すべての夢のたび。

1日1記事ぐらいな感じでいきたい雑記ブログ

音声版フォトショップ


また一歩コンピュータが進化したって感じですね。どーせこれもディープラーニング使ってんだろ?

アドビの開発者会議での技術プレビューみたいなものですかね。人が喋った内容を録音して文字に直して、切り貼りして、コンピュータに喋らせる。コピペだけでなく、自由な文章を喋らせることが可能なようです。

ジン氏は「20分程度の1つのスピーチがあれば、AudioBookのように取り扱って話者の話し方を取得することが可能で、あとはテキスト入力によって発言を修正できます」と答えています。


20分。そうですね。そこらのアニメから好きなキャラのセリフ部分を20分ぶん抜いてコンピュータに聞かせてやれば、特徴を覚えてあとはなんでも自由に喋らせることができる時代が来てしまういうわけです。声優さんヤバいな。もう必要なのは「いい声」だけなんでしょうか。失業しちゃう。

でもまだ感情を込めた演技とかはできないでしょ、って思うけど、それも時間の問題でしょうね。声質を抽出することが可能なら、抑揚を抽出することもきっとできるでしょう。好きな声で、好きなセリフを、好きな言い方で喋らせることができる。それたぶんエナジードリンクなんかよりずっと効くよねぇ。

それはそれとして、この技術が広まったら、たとえば「証拠としてICレコーダーで会話を録音しました」なんてのがあんまり意味なくなるわけですよね。まぁ写真や動画はとっくにそうなってますけども。いや、なんか、そういうのよりもっと悪用できそうだよなぁ。大統領の声で好きなこと言わせられるわけでしょ。これ世に出しちゃマズい技術なんじゃなかろうか。