|
カテゴリ:Raspberry Pi
『Raspberry Pi [実用]入門』の「喋る温度計制作」で Open JTalk で音声合成というのあったので、音声合成を試してみることにした。Open JTalk といえば、かなり前に Open JTalk を Python から使ってみるでNonVisual Desktop Access (NVDA) を使ってやってみたことあったなぁ。最近、家で Windows をほとんど使ってないので、今回は試してない。
とりあえずインストール sudo apt-get install open-jtalk hts-voice-nitech-jp-atr503-m001 open-jtalk-mecab-naist-jdic 喋らせるためのパラーメーターがやたら多いのでスクリプトにしなきゃならないレベル(1.0.6 からは .htvoice ファイルがあればパラメータをコマンドラインで指定しなくてよいようだけど)。 喋らせてみると、思ったよりも進化していて、それなりに聞けるレベル。使えるかも。でも遅い。Raspberry Pi が遅いから仕方ないのね。声は男のモデルの声なので、MMDAgent の mei も使ってみた(1.3.1 を使った)。Open JTalk 1.0.6 なら Open JTalkでテキストスピーチ on Debian など参照。 試しに手元の PC で同じことを試してみると、許容範囲の遅延で出力できた。比較的速いマシンに Raspberry Pi と他のサーバーとの連携を考える のようにしてテキストを渡して、音声合成やらせて NFS 上にファイルを書きだして、音声ファイルを Raspberry Pi で読み込んで出力させるってのもありかなと。書き込みが少なくなる分だけ Raspberry Pi の SDカードの劣化も防げるし、そうするかな。 AquesTalk Pi も試してみた。スピード的には実用的でいい。音声合成LSI 「AquesTalk pico LSI」 とか使って電子工作ってのもありかもしれない。とりあえず、ソフト版の方で試したが、 $ ./AquesTalkPi "漢字も読めます。" | aplay のように簡単に使えるので、個人利用ならさらっとできて便利。AquesTalk Pi の使い方まとめ など参照(記事の中で amxer となっているの amixer の間違い)。ただ、非営利の個人利用だけなので組織で使う場合にはライセンス料が必要。ライセンス料は、5,800円(税込6,264円)。今いる秘密組織で使うには価格的にはよくても、いろいろ面倒なのでやめとく。だから Open JTalk で頑張る。 パソリで ID カードを読み込んだら、その人の情報を参照して、ちょこっとしゃべらせるというところのベースができた。あまっている VGA ディスプレイもつなげるようになったので、あと画面をどうやってつくるかな。 それにしても最近の音声合成すごいね。スライドバーで感情を調節できる無償音声合成ソフト「CeVIO Creative Studio FREE」、CeVIO Creative Studio
なんだね。いくつか商用のものを聞いてみたけど、どれも進化してる。 Android で N2 TTS も試してみる。Nexus 5 にインストールして、Google Play ブックで読み上げさせてみたら、まあ使い物になる。無料でこのレベルのものが使えるとはよい時代になったものだ。 お気に入りの記事を「いいね!」で応援しよう
Last updated
2014.04.14 03:10:01
コメント(0) | コメントを書く
[Raspberry Pi] カテゴリの最新記事
|