2006.11.19 Sunday
自然な合成音声
合成音声の品質について述べるとき、
「より自然な合成音声」とか「もっと自然に」などと
「自然」という単語が頻繁に使われています。
ところで、この「音声」の部分を別の単語に置き換えてみると・・・
「自然な合成食品」 「自然な合成素材」
どうもピンときませんね。
自然と合成ってのが対立しているように感じませんか?
では、「自然な合成音声」って、どういう意味で使ってるのでしょう?
まず、一番近いところが、
人の声に似ている(人間の声っぽい、人間的)
あたりではないかと思います。
そのほかにも、
明瞭である、美しい声、滑らか、などの意味にも使われることもあります。
しかし、
自然な音声は、必ずしも美しく明瞭とは限らないですね。
電話の会話や、会議のやり取りを録音して後で聞いてみれば、
通常、人間が発声している音声が、いかに不明瞭であるかわかるでしょう。
ここからわかることは、
「明瞭な声」とか「美しい声」という表現は、あきらかに「人間的な声」とは異なるベクトルであるということです。
このような理由により、普段何気なく使っている「自然な合成音声」という表現ですが、合成音声の品質を云々するときに「自然」って単語は、あまり使わないほうが良いかなとも思ってます。
「より人の声に近づいた」とか「明瞭さを向上した」などと言ったほうが間違いが無いのではないかな。
もっとも、いろんな理由で、あえて曖昧にしておきたい場合には便利な表現ですが・・・
この話に関連して、人間的では無いけど、美しい、明瞭な合成音声の存在の可能性もでてきます。
人間っぽい声を目指すだけが、音声合成の研究開発の方向性ではないようです。
この話題はまた別の機会に・・・
「より自然な合成音声」とか「もっと自然に」などと
「自然」という単語が頻繁に使われています。
ところで、この「音声」の部分を別の単語に置き換えてみると・・・
「自然な合成食品」 「自然な合成素材」
どうもピンときませんね。
自然と合成ってのが対立しているように感じませんか?
では、「自然な合成音声」って、どういう意味で使ってるのでしょう?
まず、一番近いところが、
人の声に似ている(人間の声っぽい、人間的)
あたりではないかと思います。
そのほかにも、
明瞭である、美しい声、滑らか、などの意味にも使われることもあります。
しかし、
自然な音声は、必ずしも美しく明瞭とは限らないですね。
電話の会話や、会議のやり取りを録音して後で聞いてみれば、
通常、人間が発声している音声が、いかに不明瞭であるかわかるでしょう。
ここからわかることは、
「明瞭な声」とか「美しい声」という表現は、あきらかに「人間的な声」とは異なるベクトルであるということです。
このような理由により、普段何気なく使っている「自然な合成音声」という表現ですが、合成音声の品質を云々するときに「自然」って単語は、あまり使わないほうが良いかなとも思ってます。
「より人の声に近づいた」とか「明瞭さを向上した」などと言ったほうが間違いが無いのではないかな。
もっとも、いろんな理由で、あえて曖昧にしておきたい場合には便利な表現ですが・・・
この話に関連して、人間的では無いけど、美しい、明瞭な合成音声の存在の可能性もでてきます。
人間っぽい声を目指すだけが、音声合成の研究開発の方向性ではないようです。
この話題はまた別の機会に・・・