![]() |
2018.10.03 Wednesday
AIアナウンサー 荒木ゆい
AIの学習能力はスゴイ。
荒木ゆいという女性アナウンサーが話すのだが、これがAIの合成音とは思えない。 こちらでサンプルを聞くことができる。 これは人間ではないと分かる人はほとんどいないだろう。 実際にアナウンサーが読んでいるニュース音声10万件を、Spectee AIで機械学習して、原稿の読み上げができるようになったという。 すでに活躍しているらしい。 もちろん、男性のアナウンサーも音色を変えるだけだから簡単だ。 聞き取りやすさ、ということで女性の声が適しているということだと思う。 ここまでくると、自分の声の特徴を学習して、自分の声で話すAIも簡単に作れるだろう。 将来は自分の声で勝手に応答する電話などもできるかもしれない。 テキストのファイルがあれば、音声ファイルを作るのは数分とのこと。 アマゾンのスマートスピーカーのスキル(拡張機能)としても販売している。 このスキルをアレクサ(アマゾンの人工知能)に覚えさせると、アレクサが「荒木ゆい」になる、ということだ。 これだけ流暢に話すと、聞きやすいし、スマートスピーカーが人に近くなる。 ネットのインフラがあればこそのものだが、機械学習の威力はスゴイ。 上方落語を10万件機械学習させれば、関西弁で話すこともできるのだろうか。 よしもと新喜劇の音声を10万件機械学習すれば、関西弁でボケたり、ツッコんだりできるようになるのだろうか。 そんな応用はもう検討しているだろう。 しかし、荒木ゆいの声でベタベタの関西弁を話されても、と思うが‥。 この調子なら、あと数年でペットロボットのaiboも人間の言葉を話すようになるかもしれない。 もっと言えば、コールセンターなどの仕事は、ほとんどコンピューターで置き換えられるだろう。 クレーマーの対策なども完璧にプログラムされて、いくら相手が怒っていても人間よりうまいこと対応できる。 あ、だから最近その手の電話をかけたら「お客様とのお電話は録音させていただいております」ということになっているのかもしれない。 学習させるためには、サンプルが必要だからなあ。 エライ時代が来たものだ。 もうちょっと若かったら、そういうものを作る仕事をやってみたかったと思う。 今流行りのボーカロイドも、もっとスムースに歌えるようになるだろう。 そうなると、ポップスの中には、AIが作詞作曲して、AIが歌うというジャンルが出てくるぞ。 その方が、人間が作るよりいいかもしれない。 古今東西のヒット曲を学習させたら、スゴイのができるかもしれない。 もうやっていたりして‥。 |
![]() |