AIが翻訳の不可能性に気付く日

中央公論4月号で人工知能研究者の松尾豊氏が「ほんやくコンニャク」は「夢物語ではない」と書いている。「研究自体は5年〜10年で一定のメドがつき、10年〜15年後には実用化できるかもしれない」。じつは今から10年前、リアルタイム自動翻訳は「あと5年で実現できる」はずだった*1。有望そうな技術が出てきたら、逆に未来が遠退いたというのが興味深い。翻訳の難しさに対する理解が進んだ証拠だろうか。

いま、人工知能が抽象概念を獲得することができるようになり、言語をも獲得できるようになりつつある。つまり、我々日本人を苦しめてきた言語の壁が取っ払われる可能性が出てきているのだ。
（松尾豊「AIが完全自動翻訳を実現する日――言語の壁がなくなったときあなたは世界で闘えるか」中央公論2016年4月号）

「概念の獲得」「言語の獲得」と、「言語の壁が取っ払われる可能性」がどう結びつくのか、これだけではよくわからない。そこで松尾豊氏の著作『人工知能は人間を超えるか』を読んでみたのだが、そもそも機械翻訳の話に特化した本ではないこともあり、いくつか不明点が残った。

ひとつは、言語の統語論的側面の取り扱いについてである。ディープラーニングによって人工知能が自力で概念を獲得できるようになる。現状では画像のみだが、やがては動画その他マルチモーダルなデータから特徴量を抽出することができるようになり、さらにはAIに人間のような身体を与えることで、環境との相互作用や行動・結果関係などを踏まえた、より高度な概念を手に入れることができるようになる。

その結果、コンピュータが「言語」を獲得する準備が整う。先に「概念」を獲得できれば、後から「言葉（記号表記）」を結びつけるのは簡単だからだ。
「ネコ」「ニャーと鳴く」「やわらかい」という概念はすでにできているから、それぞれに「ネコ」「ニャーと鳴く」「やわらかい」という言葉（記号表記）を結びつけてあげれば、コンピュータはその言葉とそれが意味する概念をセットで理解する。（中略）コンピュータによる翻訳が本当に実用に耐えるものになるとすれば、この段階にきてからである。機械翻訳というのは、身近なだけに簡単な技術に思えるかもしれないが、実は、かなり高度な技術なのである。
（松尾豊『人工知能は人間を超えるか』pp.188-189）

でも概念にラベルを貼り付けるだけでは「言語の獲得」とはいえない気がする。松尾氏がソシュールを援用しているので、それにならえば、この段階で獲得されたのは、シニフィエ（概念）とシニフィアン（名前）の結合体としてのシーニュ（記号）でしかない。こうした記号がいくら蓄積されても、それだけで言語が分かるようにはならないだろう。人間の言語は「文」という形で運用される。そしてこの「文」が全体として持つ「意味」は個々の記号が持つ概念の総和ではない。文それ自体がシニフィアンとして機能する。こうした新たなシニフィアンとしての文に対応するには、個々の記号を文に構造化するための規則、すなわち「文法」が必要だ。だから「言語の獲得」には「文法の獲得」が欠かせないはずである。

もちろん松尾氏も、人工知能で人間と同じような精神作用を実現するには、「本能」などとともに、「文法」をコンピュータに埋め込む必要があるのではないかと述べている。しかし同時に人工知能は何から何まで人間と同じでなくともよいとも述べている。そのためだろうか、文法埋め込みの具体的な方策についてはこの本では何も語られていない。けれど、「ほんやくコンニャク」レベルの自動翻訳が実現するには、この過程、すなわち「文法の獲得」を経た上での「言語の獲得」が不可欠であると思われる。

というのも、それがなければ、次のフェーズ、「知識の獲得」の段階に進めないからである。松尾氏は、上に引用したとおり、「コンピュータによる翻訳が本当に実用に耐えるものになる」のは「言語の獲得」の段階に来てからであるとしている。しかし実際のところ、完全自動翻訳が実用化するとすれば、「言語の獲得」のさらに上の、「知識の獲得」の段階に到達してからになるのではないか。松尾氏自身、機械翻訳の難しさについて説明する際、真っ先に次のような例を挙げていた。

He saw a woman in the garden with a telescope.

この文は、人間の日本語話者であれば一般的に「彼は望遠鏡で、庭にいる女性を見た」と翻訳するだろう。「庭にいる」のは「女性」であるという判断である。けれど、グーグル翻訳で生成される訳文は、「彼は望遠鏡で庭で女性を見た」*2。これでは「彼」のほうが「庭にいる」ことになってしまう。では、なぜ人間は前者のように翻訳できるのか。それは、統語的に曖昧な文を解釈するにあたり、知らず識らず、テキスト外の情報、一般常識を参照しているからである。

単純な1つの文を訳すだけでも、一般常識がなければうまく訳せない。ここに機械翻訳の難しさがある。一般常識をコンピュータが扱うためには、人間が持っている書ききれないくらい膨大な知識を扱う必要があり、きわめて困難である。コンピュータが知識を獲得することの難しさを、人工知能の分野では「知識獲得のボトルネック」という。
（同前p.103）

この「知識獲得のボトルネック」を解決するには、AIが言語を獲得していなければならない。というのも言語を獲得していれば、「コンピュータも本が読めるようになる。いろいろな小説を読んで、『望遠鏡で覗くのは男のほうが多い』ことも理解するかもしれない」（p.190）からである。しかし、AIが言語を獲得するには、AIが文法を獲得していなければならない。では、どうすれば文法が獲得できるのか。そのやり方が書いてない。

もうひとつ、この本をもっぱら「ほんやくコンニャク」の実現可能性を吟味するという目的をもって読むとき、大きな障害であると感じられるのは、翻訳原理それ自体についての説明が見られないことである。肝心の部分が結局よくわからない。

手がかりのようなものはある。松尾氏は、ソシュールの記号概念を説明するところで、ひとつの図を掲げていた。「図19 シニフィアンとシニフィエ」（p.140）。上下半分に区切られた円が横に3つ並んでいる図である。左端の円は、上半分に「シニフィエ」、下半分に「シニフィアン」とある。真ん中の円は「日本語の場合」であるとされ、「シニフィエ」に当たる上半分に黒い猫のシルエット、「シニフィアン」に当たる下半分に「ネコ」という文字が記されている。一番右側に置かれた円は「英語の場合」である。上半分に「日本語の場合」と寸分違わぬ猫のシルエット、ただし下半分は「ネコ」ではなく「cat」になっている。

この図がミスリーディングだと思うのは、語レベルのシニフィエの同一性に基づいてシニフィアンを付け替えれば、それだけで翻訳が実現するかのような誤解を与えるおそれがあるからである。「ネコ」と「cat」の概念は同一であるから、「ネコ」を「cat」に翻訳できるというように。けれど実際には、「ネコ」と「cat」の概念は同一ではない。

ソシュールが喝破したように、概念というのは絶対的なものではない。言語共同体によって世界の分節の仕方（概念構造）は多様に異なるのだし、現代思想の根幹をなしているこの相対主義については繰り返すまでもないだろう。日本語の「猫」と英語の「cat」とフランス語の「chat」とは厳密には異なるカテゴリーに属するのだ（中略）。言語の恣意性とは、概念の組み立て方が多様なことであり、唯一の絶対概念に対して「猫」とか「cat」とか勝手にレッテルを貼れる、ということではない。概念とは人間のコミュニケーション体験の集積から生成される文化的、相対的な存在なのである。
（西垣通「知をめぐる幼稚な妄想」現代思想2015年12月号）

もっとも松尾氏も、異なる言語間に語レベルの一対一対応が成立しないことをきちんと指摘している。

もちろん、文化や言語によって用いられる概念はさまざまである。たとえば、英語には「punctual」というよく使われる形容詞があり、「時間に正確だ」という意味で、「He is a punctual person.（彼は時間に正確な人だ）」というふうに使う。ところが、これに1対1で対応する日本語の単語はない。どうしても「時間に正確だ」と2単語を使って表現しなければならない。
（松尾前掲p.189）

それでもこの記述から、「ほんやくコンニャク」の基本的な翻訳原理が、言語内在的な概念ないし意味の等価性に基づいた、言語間でのラベルの貼り換えにあることが読み取れる。ここで当然問題となるのは、等価性を確保すべきレベルをどう設定するか（語でないとすれば句か、文か、それとも対象となるテキストや言説の全体か。全体であるとすれば、どのように「全体」を定義するか）、そしてより根本的には、こうした等価性は現実的に成り立つのか、ということである。成り立たないと考える論者も少なくない（たとえば長尾真、別宮貞徳）。

ところで、西垣通氏の指摘するとおり、ソシュールの考えによれば、概念というものはひたすら「文化的、相対的な存在」である。けれど、ノーム・チョムスキーは、そのようには考えていない。諸言語には、統辞構造のみならず、概念の次元においても生得的な共通性があると主張している。

単純に考えれば、ソシュール的な言語（langue）観によれば翻訳不可能性が帰結し、チョムスキー的な言語（language）観に従えば翻訳可能性が帰結するといえそうだ*3。でもじつは、チョムスキー自身は、翻訳の可能性について、少しニュアンスのある言い方をしている*4。標準理論の言語モデルを用意した1965年の著作『文法理論の諸相』に次のような記述がある。

深く根ざした形式的普遍性の存在というものは、すべての言語が、同じ型に裁たれているということを含意しているが、特定言語間に、一項一項の対応（point by point correspondence）が存在することを、含意するものではない。たとえば、言語間の翻訳に、なにかしかるべき手順（reasonable procedure）があるにちがいない、というような含意は持っていない。
（ノーム・チョムスキー『文法理論の諸相』安井稔訳p.35）

この箇所には、次のような註が付されている。

「しかるべき手順」（reasonable procedure）というのは、言語外の情報（extralinguistic information）を含まない手順――すなわち、「百科辞典」（encyclopedia）を組み入れない手順、の意味である。議論については、Bar-Hillel（1960）を参照のこと。任意の言語間の翻訳に、しかるべき手順が考えられるかどうかは、実質的普遍性（substantive universals）がじゅうぶんであるかどうかにかかっている。実際、言語[複]が、かなりの程度まで、同じ鋳型で造られていると信ずべき理由はたくさんあるが、翻訳のしかるべき手順が、一般的に、可能であると考えるべき理由はほとんどない。
（同前p.238）

「実質的普遍性」とは、端的には「素性（features）」*5レベルで確認される普遍性のことであり、チョムスキーが主張する概念普遍性とは、「意味素性」のレパートリーの普遍性のことをさす。つまり、チョムスキーは、「意味素性」レベルの普遍性が「じゅうぶん」であれば、その限りにおいて、翻訳の「しかるべき手順」*6が存在すると言っているわけである。標準理論の頃のチョムスキーはこのような留保を付しているが、80年代以降、語彙項目の生得性・普遍性が積極的に主張されるようになる。1986年のマナグア講義を見よう。個々の単語の意味動態は非常に複雑・精妙である。しかし人間の子供は、こうした複雑な原理に基づく単語をものすごいスピードで覚えていく。こんなことができるのは、子供が、

言語を経験するよりも前に、何らかの方法で概念をもっていて、基本的に、すでに自分の概念的な装置の一部となっている概念につける名前を学んでいるに過ぎないのだということです。
（ノーム・チョムスキー『言語と知識――マナグア講義録（言語学編）』田窪行則・郡司隆男訳p.28）

人間の脳には生得的な概念のデジタルな材料と枠組みがあり、子供が学ぶのは、その概念に張り付けるラベルだけだということである。つまり、ここで、意味レベルの「実質的普遍性」が主張されていることになるが、しかし、講義後の質疑応答の際にチョムスキーが示す態度は、あまりすっきりしたものではない。「この講義でお話しになった最近の知見は、言語教育とか翻訳とかにどのように応用することができるのでしょうか」という質問に対して、チョムスキーは次のように答えている。

言語教育とか、翻訳とか、橋の建造とかの、実用的な活動に関係している人々は、科学で何が起きているかに注意を払う必要が、おそらくあると思います。けれども、そういう人々も、おそらく科学にあまり深入りすべきではないでしょう。なぜなら、自分が何をしているのかをはっきりと意識せずに、実用的な活動を遂行する能力というものは、通常、科学的知識などよりずっと進んでいるからです。（中略）私は、現代言語学は実用的なことについてはあまり言うことがない、と思っているということです。現代言語学が何をしているのかに注意を払い、翻訳家や教師の仕事の向上に役立つようなアイデアを提供してくれないか、と考えることはよいことだと思います。しかし、それは実用的な活動に従事している人が自分で決めることなのです。
（同前pp.179-180）

チョムスキーは、言語理論と「実用的な活動」を短絡的に結び付けることに慎重である。あるいは懐疑的である。実質的普遍性を基盤としたreasonableな手順が可能であったとしても、翻訳は、そのような手順のみで完遂することはできない。「言語外の情報」「百科辞典」を組み込んだunreasonableな手順が必要となる。つまり翻訳とは、合理主義ではなく、経験主義に裏打ちされた、理に適わない活動である。極端なことをいえば、無理である。このような考えがチョムスキーの念頭にあったといえば、もちろんいいすぎだろう。けれど、言語外在的な知識を利用して外在的言語間の相違を外在的言語間で調整することをめざす実践的コミュニケーション、すなわち翻訳の問題が、言語はコミュニケーションの道具ではないと考えるチョムスキーの関心の外にあることだけはたしかだ。

おそらく言語と知識を獲得した人工知能は、特徴量の厳密な計算と比較に基づき、外在的言語の表現間に等価が成立しないこと、すなわち、いわゆる「翻訳」が無理であることに気付くのではないか。それと同時に、これまで人間が行ってきた「翻訳」と称する活動が、ことごとく、その言葉が一般的に含意するのとは異なる種類の活動であったこと、「翻訳」など人類史上かつて一度も実現したことがないことにも気付くのではないか。それだけではない。「翻訳のジレンマ」――理念と実際のギャップ――に気付いた人工知能は、これを人間がどのように解いてきたか、埋め合わせてきたかについても学ぶに違いない。その帰結は重大である。どうなるか。人工知能にも「翻訳」ができるようになる。「ほんやくコンニャク」も夢物語ではないということである。

Le deep-learning, une technique efficace pour résoudre le dilemme de la traduction ?

Honyaku-konnyaku est un des gadgets dont dispose le fameux gros chat Doraémon afin de gâter le petit Nobita. En mangeant cet aliment fonctionnel, on parvient à parler et comprendre n'importe quelle langue étrangère. D'après Yutaka MATSUO, chercheur japonais en intelligence artificielle de l'Université de Tokyo, une telle chose serait sans doute possible, grâce à la technique Deep learning, dans les 10 ou 15 ans à venir. Bon, alors voyons voir.

*1:米国IBMが2006年に掲げた「IBM Next Five in Five」で、リアルタイム音声翻訳は5年以内に実現するとされていた。しかし、この言葉が正しかったかどうかは、「実現」や「実用化」といった言葉をどうとるかにかかっている。現状、翻訳アプリは、「単語が六つ以上になると、精度が落ちる」ようだし、「EXILEポイ捨て」だとか愉快な訳文を返してきたりもする（阿部和重・伊坂幸太郎『キャプテンサンダーボルト』では、翻訳アプリを通したおかしな日本語が敵役の不気味さを増幅する役割を担っていた）。それでも「実現」は「実現」だといわれれば、「そうですね」と答えるしかない。人間の翻訳者・通訳者でも誤訳はする。

*2:さっきこの英文をGoogle翻訳にかけてみたら、「彼は望遠鏡と庭で女性を見ました。」と出た。ところがピリオドを除いて翻訳させると、「彼は望遠鏡で庭の女を見ました」と正しく訳してきた！

*3:西垣通＆ジョナサン・ルイス『インターネットで日本語はどうなるか』によれば、「極端に言えば、共時的な言語（ラング）同士のあいだの翻訳可能性は、構造主義的言語学ではまったく保証されないのだ。（中略）一方、（中略）チョムスキーの言語学が機械翻訳を目指すエンジニアにとっていかに魅力的だったかは言うまでもない。たとえ、日本語と英語の表面的な文章構造がまったく違っていても、日本語文を分析して奥にある普遍的な論理表現までたどりつければ、そこから逆の操作で対応する英語文を見出せるはずだ。」（pp.124-125）。

*4:他方、ソシュール自身の翻訳観はわからないが、丸山圭三郎は、「言語ごとにその価値体系が異なっていても、翻訳はやはり可能である」というアンドレ・ビュルジェの考えに「原則的には賛同したい」と述べている（『ソシュールの思想』p.330）。

*5:松尾氏の「特徴量」も「素性（features）」のことである。p.135、p.176参照。チョムスキーのミニマリスト・プログラムの図式に突き合わせると、ディープラーニングによってAIが獲得する「概念」とは、I言語のレキシコンに含まれる語彙項目の「意味素性」の束に相当すると考えられる。AIが「文法」を持たない場合、計算手順（Computational procedure）に関係する素性は非関与的なものとなり、したがってLF（論理形式）も扱えないことになるだろう。

*6:引用部参照先の論文は、Yehoshua BAR-HILLEL, The Present Status of Automatic Translation of Languagesであり、ここでチョムスキーは機械翻訳のことを念頭に置いていると考えられる。