N.Yamazaki's blog

主に音声合成について思ったことを書いてみようと思います。
<< SofTalkの声はAquesTalkのどの声種? | main | 音声合成LSI用のオーディオアンプ(再考) >>
聞き取りやすい音声合成エンジンをリリース!
今回リリースの AquesTalk pico f6 は、明瞭性を大幅に向上した音声合成エンジンです。
ここでは、従来エンジンとの聴取比較を行い、その違いを確認してみましょう。
プレスリリース

■ベースは pico f5
AquesTalk pico f6 は、音声合成ライブラリAquesTalkシリーズの中の「AquesTalk pico」エンジン、声種は f5(落ちついた女声)をベースに開発しました。したがって、声質は f5 を継承しています。
プログラムコードと音声データを含めても 30KByte 以下という驚異的な小ささを維持したまま、数10MByte 以上の音声データが必要とされるコーパスベースの音声合成エンジンと比べても遜色の無い明瞭度を実現しています。

■イントネーションの新モデルも実装
ピッチパタンを生成する韻律モデルを刷新しました。
様々な入力にも対応した安定したパタンを生成し、イントネーションを操作する各種記号とその効果をさらに直感的にすることで、所望のアクセントやイントネーションに楽に調整できるようになりました。
なお、声の高さは、AquesTalk pico f5 に比べて若干低めになっています。

■聞き比べてみよう
以下に、ベースとなったAquesTalk pico f5 と、今回リリースの AquesTalk pico f6 のサンプル音声を示します。
「はく、ハグ」
pico f5 
pico f6 

「たま、たな、かに、かみ」
pico f5 
pico f6 

「かんぴょー、かんびょー」
pico f5 
pico f6 

「L,M,N」
pico f5 
pico f6 

「りょーこ、よーこ」
pico f5 
pico f6 

「ローバ、ドーパ、ノーバ」
pico f5 
pico f6 

「すみれ、つみれ」
pico f5 
pico f6 

「パーベン、バーレン、ガーデン」
pico f5 
pico f6 

「かんじょー、かんりょー、かんみょー」
pico f5 
pico f6 

「こーりゅー、こーみゅー、こーにゅー」
pico f5 
pico f6 


■さらに聞くには
下記のデモページにて、ライブラリ種類に AquesTalk pico、声種に f6 を指定すれば、任意文の合成音声を体験できます。
「デモンストレーション」http://www.a-quest.com/demo/
| AquesTalk | 12:32 | - | - |
PROFILE
Follow
CATEGORIES
LATEST ENTRIES
SEARCH THIS SITE
RECOMMEND
RECOMMEND
RECOMMEND
Arduino Uno
Arduino Uno (JUGEMレビュー »)

AquesTalk pico LSIの評価ボードとして最適
RECOMMEND
Raspberry Pi Model B+ (Plus)
Raspberry Pi Model B+ (Plus) (JUGEMレビュー »)

これと AquesTalk pi で簡単にテキスト音声合成!
RECOMMEND
RECOMMEND
RECOMMEND
SONY MDR-CD900ST
SONY MDR-CD900ST (JUGEMレビュー »)

普段これで開発しています。
RECOMMEND
RECOMMEND
RECOMMEND