N.Yamazaki's blog

主に音声合成について思ったことを書いてみようと思います。
<< 【β版公開】Raspberry Piで音声合成する「AquesTalk Pi」 | main | 音声合成の人気の声種は? >>
AquesTalk Pi の使い方まとめ

 AquesTalk Piとは、Raspberry Pi上で軽快に動作する音声合成コマンド(プログラム)です。
インストールから基本的な使い方、オプションの使い方を簡単にまとめました。

Raspberry Pi Type B

■音が出るか確認
予めRaspberry Piで音声が再生できるかチェックします。

オーディオをミニプラグに出力させる場合

$ amixer cset numid=3 1

オーディオをHDMIに出力させる場合

$ amixer cset numid=3 2

以下のコマンドでRaspbianに用意されている音声データを再生してみます。音声が聞こえればOK。

$ aplay /usr/share/sounds/alsa/Front_Center.wav

■プログラムのダウンロード
こちらのページから、Downloadのプログラム使用許諾を下までスクロールして読むと、[同意してダウンロード]ボタンが有効になります。クリックしてファイル(aquestalkpi-xxx.tar.gz)をダウンロードします。なお、IEなど一部のブラウザにではファイルの途中までしかダウンロードできないなどの不具合が報告されています。ダウンロードできなかったり、ダウンロードしたファイルのサイズが表示と異なる場合は、他のブラウザでお試しください。


■インストール
ダウンロードしたパッケージをRaspberry Pi上の任意の場所に展開するだけです。
なお、実行時には実行モジュールAquesTalkPiと同じところに、aq_dicディレクトリを配置している必要があります(パッケージをそのまま展開すればそうなっているはずです)。

$ tar xzvf aquestalkpi-20130827.tar.gz
$ cd aquestalkpi

■基本的な使い方
基本的な構文は次のようになります。

$ ./AquesTalkPi [オプション] 入力文字列  [ > 出力ファイル ]


デフォルトでは、AquesTalkPiに読ませる入力文字列を引数に指定し、音声出力は標準出力になります。入力文字列はUTF8(BOM無し)で指定します。出力はWAV形式です。次の例は、パイプでaplayに送って、すぐに再生します。

$ ./AquesTalkPi "漢字も読めます。" | aplay

■その他のオプションを調べる
次のように-hを指定して確認できます。

$ ./AquesTalkPi -h

■様々な文字列の指定方法
-f の後にファイル名を指定すると、読ませる文字列を引数の代わりにテキストファイルで与えられます。なお、先頭の1行しか読み込まないので、改行があるとその手前までしか読み上げません。
次の例は、パッケージに含まれるサンプルテキストファイルを発声します。

$ ./AquesTalkPi -f test.txt | aplay

-f の後に - を指定することで、読ませる文字列を標準入力(パイプ)にすることもできます。これは、他のプログラムで生成した文を読ませるときに便利です。次の例は、現在の時刻を読み上げます。

$ date +"%I時%M分%S秒" | ./AquesTalkPi -f -  | aplay

■声を変えてみる

・声の種類
デフォルトでは声種f1ですが、オプション -v f2 を指定することで、声種f2で合成します。

$ ./AquesTalkPi -v f2 "魔理沙だよ。" | aplay

・棒読みにする
-b オプションを指定すると、すべて平板アクセントとなります。SofTalk っぽくなりますね。

$ ./AquesTalkPi -b "棒読みだっていいじゃないか" | aplay
$ ./AquesTalkPi -b "ゆっくりしていってね?" | aplay

・話す速さの変更
-s オプションの後に数値を指定して、発声する速度を変更できます。数値としては50から300の値が指定でき、値が大きいほど速く発声します。デフォルトは100です。

$ ./AquesTalkPi -s 300 "生麦 生ごめ 生卵" | aplay
$ ./AquesTalkPi -s 80 "霊夢もゆっくりしていってね?" | aplay

・音量の変更
-g オプションの後に数値を指定して、音量を変更できます。数値としては0から100の値が指定でき、値が大きいほど大きくなります。デフォルトは100です。

$ ./AquesTalkPi -g 10 "小さな声" | aplay

■その他の機能

・ファイルとして出力
デフォルトでは標準出力に出力しますが、-o オプションで出力するファイルを指定できます。

$ ./AquesTalkPi こんにちは。 -o out.wav

上のコマンドは次と等価です

$ ./AquesTalkPi こんにちは。 > out.wav

・入力を音声記号で指定
-k オプションで、漢字を含んだ日本語のテキストの代わりに音声記号列で指定します。
これにより、読みやアクセントを直接指定することが出来ます。微妙な発話調整を行う場合に利用します。音声記号列の書式に関しては「音声記号列仕様」を参照してください。
ちなみに、このオプションを指定した場合は辞書ファイル(aq_dic)が無くても使用できますので、漢字を読ませる必要が無く、メモリの削減を必要とする場合には検討してみてください。

$ ./AquesTalkPi -k "ユックリ_シテイッテネ?" | aplay

・音声記号列を出力
-t オプションで、WAV音声データの代わりに、音声記号列を出力します。漢字かな混じり文を解析する言語処理部(AqKanji2Koe)の結果を返すものです。-k オプションで使用する音声記号列の参考用としても使えます。

$ ./AquesTalkPi -t "組み込み向けの音声合成はAquesTalk"

| AquesTalk | 19:15 | comments(0) | - |
コメント
コメントする









PROFILE
Follow
CATEGORIES
LATEST ENTRIES
SEARCH THIS SITE
RECOMMEND
RECOMMEND
RECOMMEND
Arduino Uno
Arduino Uno (JUGEMレビュー »)

AquesTalk pico LSIの評価ボードとして最適
RECOMMEND
Raspberry Pi Model B+ (Plus)
Raspberry Pi Model B+ (Plus) (JUGEMレビュー »)

これと AquesTalk pi で簡単にテキスト音声合成!
RECOMMEND
RECOMMEND
RECOMMEND
SONY MDR-CD900ST
SONY MDR-CD900ST (JUGEMレビュー »)

普段これで開発しています。
RECOMMEND
RECOMMEND
RECOMMEND