2009年1月15日木曜日

text to speech

こういう記事を見つけた。
コエラボに投稿された作品を使って閻魔あいが合成音声でしゃ�

で、聴いてみた。
地獄少女 地獄ラヂオ|コエラボ★思い通りにキャラがしゃべる

あんまし面白くなかった。
昔遊んでたReadPleaseとかのtext to speechソフトを思い出して、それと「人間っぽさ」ってあんまし変わらんなあ、と思ったので。流暢さとか抑揚はかなりレベルアップしてるんだろうけど。

でも、これ、イラストとかその他のエトセトラがあった上で、この音質の声質で、「パーソナリティ」とか「キャラ」があるかのように感じられるんだな。
ReadPleaseにも何個かの話し手が設定されていて、BobとかMaryとか(そんな名前だった気がする)、白人男性50代とか黒人男性20代とか、その程度の性格付けがなされていたと思うけど、そんなもんにのめりこむのは無理だし。

「キャラ」か。
初音ミクって、何かの点で、本当に決定的だったんだな。「合成音声」に関する大衆的想像力をかなり変えてしまったんだな。
「大衆的想像力」というほど大衆に膾炙してるとは言えないと思うし、初音ミクの歌声はやっぱり気持ち悪いけど、でも、将来的にはターニングポイントとして位置づけられるものなんだろな。

個人的には、5年ほど前までは、英語の読み上げソフトに無理やり日本語のように聞こえる音を話させるのが面白かった。「さようなら」と聞こえる音を話してもらうために「sayohnahrer」というスペルを読み上げさせる、とか。
ReadPleaseはWindowsのtext to speechエンジンの性能に依存していたはずだけど、確か、XP以降、各段に「人間っぽく」聞こえるようになったんだ。
企業の受付の電話が合成音声になったりしたのはいつごろからなんだろう?
ここ10年以内だと思うけど。
分からん。

0 コメント:

ピンポイント天気予報

ninja tools

macromill