N.Yamazaki's blog

主に音声合成について思ったことを書いてみようと思います。
<< AquesTalkをVBで使う | main | 音声読み合わせをエクセルで行う >>
自然な合成音声
合成音声の品質について述べるとき、
「より自然な合成音声」とか「もっと自然に」などと
「自然」という単語が頻繁に使われています。

ところで、この「音声」の部分を別の単語に置き換えてみると・・・
「自然な合成食品」 「自然な合成素材」
どうもピンときませんね。
自然と合成ってのが対立しているように感じませんか?

では、「自然な合成音声」って、どういう意味で使ってるのでしょう?
まず、一番近いところが、
人の声に似ている(人間の声っぽい、人間的)
あたりではないかと思います。

そのほかにも、
明瞭である、美しい声、滑らか、などの意味にも使われることもあります。

しかし、
自然な音声は、必ずしも美しく明瞭とは限らないですね。
電話の会話や、会議のやり取りを録音して後で聞いてみれば、
通常、人間が発声している音声が、いかに不明瞭であるかわかるでしょう。

ここからわかることは、
「明瞭な声」とか「美しい声」という表現は、あきらかに「人間的な声」とは異なるベクトルであるということです。

このような理由により、普段何気なく使っている「自然な合成音声」という表現ですが、合成音声の品質を云々するときに「自然」って単語は、あまり使わないほうが良いかなとも思ってます。
「より人の声に近づいた」とか「明瞭さを向上した」などと言ったほうが間違いが無いのではないかな。
もっとも、いろんな理由で、あえて曖昧にしておきたい場合には便利な表現ですが・・・


この話に関連して、人間的では無いけど、美しい、明瞭な合成音声の存在の可能性もでてきます。
人間っぽい声を目指すだけが、音声合成の研究開発の方向性ではないようです。
この話題はまた別の機会に・・・

| 音声合成一般 | 14:58 | - | - |
PROFILE
Follow
CATEGORIES
LATEST ENTRIES
SEARCH THIS SITE