すべての夢のたび。

1日1記事ぐらいな感じでいきたい雑記ブログ

機械知性の生まれ方


非常に興味深く読まさせていただきました。むずかしいことばはほとんど使われてないので、ご一読をお薦めします。


英語のルール(文法規則)があって、日本語のルールがあるとする。今までは、話されたもの、書かれたものからこのルールを抽出してやって、ルールとルールの間の変換規則を作ってやって、それでコンピュータに機械翻訳をやらせていました。入力と演算(変換規則)があって、出力を得ていたわけです。

ところがニューラル機械翻訳は違う。まず入力(例)と出力(例)を用意するのです。英語の文と、それを翻訳した日本語の文、そいつらをとにかく大量に用意してやって、コンピュータにガンガン食わせるわけです。するとコンピュータは、こんな感じの文だったら、こんな感じに変換すればいいんだなって、なんとなく規則を学んでしまう。主語やら述語やら名詞動詞形容詞やらの概念すらなしで、それをやっちまう。

でもこれって実は人間がやっていることに近いんですよね。人が、知らない国に飛び込みで行っても、しばらく暮らしているうちになんとなくそこの言葉を覚えてしまう。文法規則を明に学ぶわけではなく、話されていることばから、なんとなくルールが抽出されていって、そのうち自分でもそれに従って話せるようになるわけです。

面白いのは、そのルールをうまく取り出せないこと。たとえばぼくら日本人は「は」と「が」の使い分けはできるんですけど、どういうときに「は」でどんなときに「が」を使うのか、うまく説明できる人はあまりいません。なんていうかそれらのルールは、ことば全体の中にちょっとずつ広く埋め込まれていて、取り出すのが難しいんですよね。

そしてニューラル機械翻訳も同じで、いっぱい文例を食ってなんとなく翻訳ができるようになったコンピュータがいたとして、そいつが中でいったい何を、どんな演算をやっているのか、後から人が見てもさっぱりわからないわけです。もう人が触って調整できるものではなくなっているし、やり方をうまく取り出して他の言語に適用したりすることももちろん無理。

けれどそこに可能性があるんじゃないかと思うんですよねぼくは。人工知能ってさ、作ろうとしてたけど、うまくいってなかったじゃないですか。それって、人が作るからなんですよね。人は自分が理解しているものしか作れない。コンピュータをプログラミングするなら、理解している範囲でしかできないわけです。でもそれってつまり人間以上の機械知性はできないってことになる。人を超えるなら別の方法を使うしかない。偶然にまかせるとか、勝手に学習するとかです。でもそうやってできあがった、人を超えた人工知能は、もう人に理解できるものではなくなっているわけです。


言及先の記事の終わりから2つめの節、「さらなる暴力の連鎖」ってところが非常に興味深いです。ニューラルネットワークは入力と出力を用意すればなんでも学習してしまう。だから、絵とその解説のペアを大量に見せれば、絵を見せると解説をしてくれるシステムができる。絵だろうが文だろうが音だろうが何だろうが、コンピュータにとってはただのバイト列にすぎないですからね。食わせられてるものが絵なんだって知る由もない。

そのうちたとえば、ぼくらがパソコンでゲームをやっているところにニューラルネット挟んでおくじゃないですか。するとぼくらがゲームパッドごりごり適当に操作すると勝手にFPSっぽい画面を生成してくれるとか、そういうのも原理的にはできちゃうわけです。気象観測データを毎日毎日延々食わせ続ければ、いずれ人間や、人間がプログラミングしたスーパーコンピュータよりもうまく、ニューラルネットは天気予報をするようになっちゃうかもしれない。

そんなふうに、期待が広がりますね。いま人間は、ありとあらゆるものをニューラルネットに食わせてる最中のようです。それってさ、まるで得体の知れない神への供物みたいですよね。人が自発的にやっているように見えて実はそうではない。いつかいずれ人を超えるもののために奉仕させられているようなもんです。ワクワクしますね。


意味の話を書く時間がありませんでした。ていうか頭の中でまだまとまっていないので書けません。この新しい神はルールだけ知ってるけど意味を知らない。意味ってなんでしょうね。ウィトゲンシュタインは意味じゃなくて用法を探せって言ってましたけど。