N.Yamazaki's blog

主に音声合成について思ったことを書いてみようと思います。
<< AquesTone2 MIDI打ち込みの基本(初級) | main | 【β版公開】Raspberry Piで音声合成する「AquesTalk Pi」 >>
言語処理ライブラリ「AqKanji2Koe」が新しくなりました
 AquesTalk(2)で漢字からの音声合成を行うときに使用する言語処理ライブラリ AqKanji2Koe が Ver.2 にバージョンアップ

ユーザ側から見た強化ポイントは以下のとおりです。

  1. ユーザ辞書が使える
    要望の多かった、辞書に単語を追加する機能です。
    アプリ開発サイドで、辞書内容をアップデート可能です。
    ユーザ辞書は、専用のユーザ辞書作成ツールを用いてを作成します。

  2. 英単語が読める
    これまでは、辞書にない英単語は棒読みしていたのですが、独自のアルゴリズムでカタカナ英語読みするようになりました。4文字以上英単語の未知語は、カタカナ英語読みします。
    例) eclipse    イーシーエルアイピーエスイ'ー  ⇒ イクリ'プ_ス

  3. 変換精度の向上
    Ver1と比較して、読み、ポーズ位置、アクセントの精度が向上しています。

  4. サイズが小さく
    辞書のサイズを、これまでの25MBから、最小構成で5MBに削減。
    プログラムも500KBから150KBになりました。

  5. 用途に応じた3種類のシステム辞書
    標準:約7MB(約36万語)、スモール:約5MB(約25万語) ラージ:約13MB(約50万語)の3種類の辞書を用意しました。

一方、技術的な変更点は・・・

  1. 辞書データの全面的な見直し
    見出し語の選別だけでなく、各種フラグ情報を付け直しました。

  2. 辞書引きアルゴリズムの変更
    これまで形態素解析にMeCabを利用してたのですが、今回は辞書引きにmarisaを使ってます。
    MeCabの辞書引き(Darts-Double-Array Trie)は高速だけど配列のサイズが大きくなるので、marisaにしてサイズを小さくしています。ビタビ部分は独自実装にしました。

    MARISA: Matching Algorithm with Recursively Implemented StorAge


言語処理は、データ量が多くて手作業だけでなくPCで処理するのにさえ時間がかかって苦労します。さっさと一通りの実装を終えて、再びデジタル信号処理に戻りたいな。

| AquesTalk | 16:14 | - | - |
PROFILE
Follow
CATEGORIES
LATEST ENTRIES
SEARCH THIS SITE
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND
SONY MDR-CD900ST
SONY MDR-CD900ST (JUGEMレビュー »)

普段これで開発しています。
RECOMMEND
RECOMMEND
RECOMMEND
RECOMMEND