すべての夢のたび。

1日1記事ぐらいな感じでいきたい雑記ブログ

言葉に意味を与える

tokyocatさんのエントリに言及した「言葉と意味」というエントリについて、さらにまたtokyocatさんから応答をいただいたり、「他の方」から応答をいただいたり(テクノラティは肝心なときにまともに動かん…)して、また考えが進んだりしてました。


東京猫の散歩と昼寝 : 言語について素朴に考える (2) (もう"3"が書かれてますが!)

形式化され公理化された数学や論理は、現実世界との対応で考えなくていいし、むしろそれとの対応で考えてはいけない、みたいなところがある。しかし、数学や論理の問題を現実と対応させずに解くのは、我々は得意ではない。いわゆる意味と呼ぶものが立ち上がってこないと感じられるのも、ひとつはそういう場合だろう。


数学には「形式主義」という考え方があって、それは「数学は記号とその操作規則を集めたものに過ぎない」みたいな捉え方です。つまりここからは“意味”は削ぎ落とされている。しかし、実際に数学者が何かの定理を証明しようとするときは、ルールに従ってただただ当てもなく記号列を変形させているのではないわけです。そこには必ず予想があり、証明が向かう方向性がある。それはどこから来るのか、というと、間違いなく現実世界ですよね。これは「“意味”はシステムの外側からやってくる」(!)ということなのだと思います。システム内の言葉だけでは“意味”に客観的な説明を与えることはできない、ということです。部分的には論理的な説明をすることはできる。しかし、推論過程を元へ元へと遡っていくと、実はシステム内には根源的な足場はない。どこかでそれは必ず、現実世界の何かへの参照となっているのです。


というわけで、機械翻訳がいつまでたってもマトモにならない理由も理解できる。コンピュータは言葉の意味なんて考慮せずに、ルールに沿って「機械的」に記号列を変形しているだけだから、ですね。極端に言えば、コンピュータの言語空間中では、すべてのシンボル(=言葉)が等距離の関係にあるわけです。

ぼくは(前も書きましたが)Googleがこれから本格的に手がけるはずのことに機械翻訳があると思っています。どんなものかというと、英語のブログが翻訳ゲートウェイを通せば日本語で読めて、日本語でコメントを書けばまたゲートウェイを通して英語で書き込まれる、そんな感じです。しかし、これは予言ですので、外れたら笑ってください。でももし何年かあとに当たってたらちょっと見直してください(笑)。

Googleの翻訳は今はまだ他社のそれに比べてぜんっぜん精度が低いのでそんなの到底無理ですが、おそらくGoogleは(もうほとんど妄想になってますが)、言葉に意味を与える方法、コンピュータの言語空間中のシンボルを人間のソレに近い形に配置しなおす方法を、たったいまも一生懸命考えている(はずな)のです。ひとつの言語につき、数万語、十数万語、あるいは数十万語? それら全てのシンボルに正しい位置を定義しようなんてマトモな人間なら絶対考えませんが、Googleならやっちゃう可能性がある。集合知を利用するのか(Google Earthみたいにね)、それともクロールしてきたページを片っ端からガリガリ解析するのかはわかりませんが、とにかくきっとそういうことをやってくる。それがまぁ、ネットの次の革命(笑)になるだろうと、ぼくはそう予測しているのです。(だって世界政府にそれって必要でしょ?)