ロボットは完成し、一応歩けるようにはなりましたが、せっかくディーラーズルームの看板ロボにしようというのですから、しゃべらないことにはつまらない。
といっても、AIと音声出力を装備して自由自在にしゃべらせるのではなく、モーションに応じた音声データをあらかじめ作っておいて、動かしながら再生しようというわけです。
私はもともとMac使い。Macならば、簡単に合成音声を作ることができます。MacOSXにはテキスト読み上げ用の音声再生ソフトが標準で付いてくるのです。もともとは目の不自由な人のための機能なので、WINDOWSでも同じようなソフトウェアはあるとは思いますが。
MacOSXに標準で付いてくるのは英語用の読み上げソフトのみなのですが、同じ音声を使ってフリーウェアで日本語のテキストを読めるソフトが配布されています。私はiSpeechというフリーウェアを使用しています。

上画像がその実際の画面で、再生ボタンを押すとグレーのウインドウ内に入力したテキストを読み上げてくれます。『AIFF』ボタンを押すと、音声をAIFF形式のファイルに出力してくれます。

左画像のように『VOICE』というプルダウンメニューで、声質を選ぶことができます。私がSpirito-Oroで使っているのは『Trinoids』といういかにも機械的な音声です。もう少し人間的な声や女性風の声、あるいはメロディーに乗せてテキストを読み上げるような少し変わった声もあるのですが、抑揚はないのでどれを聞いてもはっきり合成音声だとわかります。ロボットの声のイメージが強いのと、聞きやすいのとで『Trinoids』を選んでいます。下に、QuickTime形式に変換した音声データへのリンクを載せておきます。興味のある方は聞いてみてください。
音声データサンプル
プルダウンメニューの横のツマミで再生速度を調整できます。音の高低には影響しないので、速度を変えることで少し声の表情を変えることができます。(急いでいるときは早口になるなど)
たとえば「やったー」という言葉だと、そのまま「やったー」と入力する場合と「や、たああぁぁ」などと入力した場合とで少し音声が変わったりしますので、少しだけですがこれで表情を変えることができます。
iSpeechから出力される音声データはAIFF形式ですので、そのままではVS-RC003(RB2000のボード)で再生することはできません。音声データの変換には、spwaveというフリーウェアを使っています。

上画像がiSpeechと同じ『ありがとうございます』という音声データを表示した画面です。波形から音声を切り分けたりフェードイン/アウトなど簡単な編集も可能なのですが、まず使うことはないですね。新規保存でMicroSoftADPCM形式に変換し、拡張子を『.wav』にすれば、そのままWINDOWS機に移してRobovieMaker2で使うことができるようになります。
と、まあ、たったこれだけです。
簡単ですね。安直ですね。我ながら。
次回は、RobovieMaker2でモーションを作る手順について簡単に説明します。
続く。