N.Yamazaki's blog

主に音声合成について思ったことを書いてみようと思います。
<< 合成音声における『不気味の谷現象』 | main | iPod shuffleのイヤホンを取り替える(PHILIPS SHE9700編) >>
VoiceOverの音声合成エンジンは?
新しい iPod shuffle の目玉の機能の VoiceOver
規則音声合成技術って、これまであまり目立った存在ではなかったのですが、Appleのこの製品によって、今まで触れることのなかった非常に多くの方々がこの技術に触れることは間違いないでしょうね。

さて、Appleはこの音声合成に何処製のエンジンを使っているのでしょう?
(ということは、少なくともウチのエンジンではないということ。残念!)
Appleのホームページによれば、iTunesのMac OS X Leopard版とWindows版では前者のほうが『非常に優れた英語の音声』と書いてあるので、英語のエンジンは少なくとも2種類存在するのですが、日本語の場合もMacとWindowsでは異なるのでしょうか?

今回は、Windows版の日本語のエンジンだけをざっくり調べてみました。

で、判定結果は
 Nuance製 "REALSPEAK" 声種:Kyoko

ここは多言語に強い会社なので、ある程度の予想はついていました。
ということは、他の言語も REALSPEAK なのかも。
なお、聴取して判断しただけですので、もしかしたら間違っているかもしれません。
その際はご指摘ください。


ところで、日本語の合成品質について、色々言われているようですが、
たしかに残念なレベル。
音質云々ってこともあるのですが、それ以前に正しい読みとアクセントがついていないので、何を言っているか判らない。

この分野のエンジニアの立場から言うと、アーチスト名や曲名を正しく読ませるのは至難の業です。文脈から判断することもできませんし、アーチスト名などは、かなり突飛な命名をしてますし・・・
結局のところ、他の知識やルールで読むのは難しく、個々の読み方を辞書に持たせない限りまともに読めないということ。

そこで、
エンジニアリング的に現実的な解決方法として、CDDBに曲名などと共に"よみ"(できればアクセントも) のプロパティ情報を加えるのが簡単かなと考えています。データベースの構築は大変でしょうが、VoiceOverみたいな機能があちこちで使われるようになれば、みんなの協力でなんとかなるんじゃない?

| 音声合成一般 | 15:18 | comments(0) | - |
コメント
コメントする









PROFILE
Follow
CATEGORIES
LATEST ENTRIES
SEARCH THIS SITE
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
SONY MDR-CD900ST
SONY MDR-CD900ST (JUGEMレビュー »)

普段これで開発しています。
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND