写生の第三形式――貞久秀紀『雲の行方』

言語には存在と使用の二つの面があって、その二つの面のそれぞれにさらに二つの面がある。だから言語の存在、言語の使用というだけでは足りず、言語の言語的存在、言語の言語的使用といわなければならない。言語の非言語的存在とは言語を一般的な事物と同等に扱うことによって言語の言語たるゆえんを見ないことにしたときに見えてくる言語の存在の仕方である。たとえば紙のうえのしみや人の発する音声としてのそれだ。でも言語の言語であるところのゆえんは物質と同じ時空間に物質としてそれが存在しないところにある。言語の言語的存在とはこういうことだ。

他方、言語の言語的使用は、端的には意味伝達ということになるだろう。でも言語の使用法はそれに限られない。言語には非言語的使用というものがある。それは伝達を拒絶すること――言語の言語的存在の自己主張――ではない。サルトルはこういっている。「言葉は像ではない。聴覚的、或は、視覚的現象としての言葉の機能は、如何なる点に於いても、他の物質的現象である絵画とは似ていない」。ところが高浜虚子によれば、「俳句は文章、画は色彩、その相違はあるが、その美感に訴えるものであるという点に二つはない」。

先ず等持院の寓居を想像せよ、京都近郊の田舎に在る、しかも足利歴代の将軍の位牌木像などの由緒ある古い大寺を想像せよ。その大寺の裏がかった処にあるささやかな一間を想像せよ。俗家は、皆新年の事であるから、門松を立てたり、〆飾りをしたりしている中に、お寺の元日はしんかんとして、平生静かな上にも、殊に静かな趣を想像せよ。召波一人、その静かな一間に在って、低い垣ごしに外面の麦畑を見ている趣を想像せよ。召波はこの時詩情動いて「元日や草の戸ごしの麦畑」という句を得たのである。寺の一間の元日の静かな趣きに、人は趣味を感じないだろうか。垣ごしに外面の麦畑の見えるような田舎びた光景に人は趣味を感じないだろうか。かくの如く両者を取り離して別々に考えて見ても、それぞれ面白い趣がある。更に両者を結び附けて、元日の寺の一間にいて、垣越しに外面の麦畑を見る、その時の心持を想像して、一層深い趣味を感ずるのは勿論の事であろう。
高浜虚子『俳句はかく解しかく味う』、太字は引用者)

江戸時代の俳人、黒柳召波が「等持院寓居」と前置して詠んだ句「元日や草の戸ごしの麦畑」についての評釈である。虚子は右のとおり「想像せよ」と五回繰り返している。このくどいほどの命令は、想像することの必須性のみならず、虚子においても像が、やはり言語の外部と認定されていることを言外に、だがはっきりと告げている。そしてこの、純粋に意味を追う読み方に重ねられるべき想像の追加的な努力によって詠み手と読み手との間で受け渡しされるものを虚子は、言語の「意味」に対し、「趣味」と呼んでいる。

吉本隆明が像を言語そのものの属性に含めたのは、こうした像を介した伝達が、つまりは言語の非言語的使用が、短詩形文学の表現の内部にとどまらず、日本語の言語活動それ自体にとって基本的な事実であることを見抜いたからだろう。それだけではない。そういう形で日本語の実相をつかんでいた吉本は、「像」の領域を取り扱ううえで、言語学と呼ばれる抽象的な外来思想が何ひとつ役に立たないことにも気付いていた。だからこそ『言語にとって美とはなにか』において吉本は、「言語学者との別れ」を体験しなければならなかったのである。

俳句の受容において意味的意識と想像的意識の、継起的な二つの心的態度を要求する虚子は、でも、こうした趣味伝達体制を支える基盤の相当に不安定であることに自覚的である。そのことは、引用したくだりの言葉使いに明らかだ。命令から問いかけへ、問いかけから断言へ。こうした語りの態様の移り行きから読みとれるのは、趣味の伝達性への懐疑だ。だから虚子の「客観写生」だとか「花鳥諷詠」だとかの俳句理念は、こうした懐疑を思い切り振り払ったところで打ち出されているということになる。

客観写生という事は花なり鳥なりを向うに置いてそれを写し取る事である。自分の心とはあまり関係がないのであって、その花の咲いている時のもようとか形とか色とか、そういうものから来るところのものを捉えてそれを諷う事である。だから殆んど心には関係がなく、花や鳥を向こうに置いてそれを写し取るという丈の事である。
然しだんだんとそういう事を繰り返してやっておるうちに、その花や鳥と自分の心とが親しくなって来て、その花や鳥が心の中に溶け込んで来て、心の動くがままにその花や鳥も動き、心の感ずるままにその花や鳥も感ずるという様になる。花や鳥の色が濃くなったり、薄くなったり、又確かに写ったり、浸して写ったり、濃淡陰影凡て自由になって来る。そうなって来るとその色や形を写すのではあるけれども、同時にその作者の心持を写す事になる。
高浜虚子『俳句への道』)

虚子は花鳥と心と言語の密着について語っている。あるいは花鳥言語と心的内容との密着について。客観写生といい、花鳥諷詠というのは、言葉を用いた新たな記号体系を編成するための方法論なのである。「花や鳥が心の中に溶け込んで来て、心の動くがままにその花や鳥も動き、心の感ずるままにその花や鳥も感ずる」。虚子の「客観写生」における「客観」とは、「自分にとっての現実」とでもいうべきものであることがわかる。

こうした虚子の主張に照らしてみれば、「趣味」が、この「自分にとっての現実」の相関物であると考えて間違いない。詠み手の私秘性の最奥に格納された、主観的な感情や感覚、印象であって、社会的な抽出を経ていないもの、経ることができないもの。「趣味」とは、これらのものを指している。そして虚子が、こうした内的体験の伝達において、言語に頼らず、言語の外部であるところの「像」に頼っていることの裏側には、言語それ自体による「趣味」の伝達の困難、いや不可能性が隠されてある。ようするに虚子のいう「趣味」は、その性格の先端で「語り得ぬもの」に触れているということだ。

見たような虚子の理念によれば、俳句とは「黙する叙情詩」なのである。けれど単に叙景による叙情ということであるならば、それはもしかすると「日本詩歌の本質」なのかもしれないのであった。大岡信の指摘である。「叙景歌の抒情性」が「最も劇的な現れ方をしている歌」として大岡が引くのは、新古今和歌集に収められた、次のよみ人しらずの歌だ。

よそにのみ見てややみなん葛城や高間の山のみねの白雲

大岡はこの歌を、その意味の表面をなぞる形で次のようにパラフレーズする。

結局は無関係なものとして仰ぎ見るだけで終わるのだろうか。葛城連峰の高間山〔金剛山〕に高くかかっている縹渺たる白雲よ。
大岡信「叙景歌の抒情性――日本詩歌の本質についての試論」、川本皓嗣編『歌と詩の系譜』所収)

情景を旨とした表現に見える。が、収録されているのは巻十一の巻頭だ。つまりこれは叙景歌ではなく、「恋歌」に分類されているのであり、そうであるならば、

あれはよその人、と見るだけで終わるのであろうか。あの方は、葛城の高間の山の峰にかかる白雲さながら、とうてい手の届くところにはいらっしゃらない、なんとも恋しいお方。
(同前)

と裏の意味が読めるだろう。大岡によれば、こうした「『叙景』と『恋』の二重映しの構造」を備えた歌は、「日本の古典和歌の中に」「大量に存在する」。その理由を大岡は、日本古代の「妻問い婚」という制度に求める。

これは、「恋」というものが「人目を忍ばねばならぬもの」、「隠すべきもの」という性格を強くもっていた社会では、ほとんど必然的に生じるはずの表現原理でした。そして日本の古代社会は、まさにそのような性格の社会でした。なぜなら、ここでは妻問い婚が婚姻の基本的様式だったからです。
夫と妻が同居せず、夜間だけ夫が妻を訪れて、夜明けとともにまた別れ別れになるというのが妻問い婚ですが、この婚姻様式の大きな特徴は、どの女とどの男が現在確実に夫婦であるのか、第三者にはしばしば判らないという点にあります。このため、求愛も結婚も、しばしば秘密裡に、いわば水面下で隠密に進行する、秘め事であらざるを得ませんでした。求愛する和歌において、主語さえも省かれ、全体がいわくありげな謎めいた語りかけになっており、一見すると四季折々の挨拶とあまり変わらないような歌に見えるような事態も、ここから生じました。
(同前)

それゆえ「恋の歌であるのに、直情的に思いを訴えることはをせず、逆に、他の事物や景物に託して、自分の抑圧している感情を秘かに洩らすという行き方が、日本の恋歌の常套になっていった」。大岡は、こうした恋歌の様式が、日本の「叙景歌の抒情性」の基盤を作り上げたと考えている。事物や景物の描写が作者内面の表現に反転する。そのようなものとして叙景歌を詠み、そのようなものとして叙景歌を読むという了解の回路が古代、日本語話者に埋め込まれた。歌だけではない。俳句も、そして散文も、同じ回路を使っているのではないか。風景を風景として、事実を事実として描く西欧式の「リアリズム」が日本の文学的土壌についに根付かなかったのは、この回路のせいであるだろう。

だがその一方で大岡は、鎌倉時代後期から南北朝時代にかけての一群の歌人の作る歌、そして数は少ないというにせよ江戸時代の歌人の作る歌に「素直な叙景歌」を見る。

月や出づる星の光の変るかな
涼しき風の夕やみのそら
伏見天皇

そして、こうした「風景を純然たる風景としてとらえ」たような歌について次のとおり語る。

私にとって面白く思われるのは、こういう鎌倉時代後期の歌の場合、平安時代の歌とは違って、歌の内容をパラフレーズする必要がほとんどなくなっているということです。つまり、詩の言葉は一義的になり、表面の意味の背後に、別の隠された意味を探る必要がないのです。
それは、これらの歌が純粋に風景を風景としてとらえるという態度で書かれているからです。言いかえれば、近代以降の写実的叙景詩が、すでにここに予告されているわけです。
大岡信『日本の詩歌 その骨組みと素肌』)

すでに見たように、「恋歌」の理念は、表の意味と裏の意味の二重性、すなわち言葉の多義性の上に築かれている。ここにあるのは意味の次元で遂行される真っ当な言葉の使用、言語の言語的使用を枠組みとした表現様式だ。だから西欧的リアリズムの成立の困難は、あくまで困難であって、不可能事ではない。大岡の考えと鑑賞によれば、一時期ではあれ、過去にリアリズムが実現していたのである。ところが虚子の「客観写生」の理念は、喩を構成しない一義的な記述、文字を文字どおり、そのまま受け取ることしかできないような単純な写生句によって複雑な主観の伝達がはたされるというものだ。大岡が「素直な叙景歌」と呼ぶものにおいてこそ、むしろ作者の主観が「ぬっと頭を出して」くるというのである。いわゆるリアリズムが日本に確立しなかったのだとすれば、それは大岡のいう「恋歌」型の喩の回路のためではなく、客観を主観に体系的に転換する「趣味」のメカニズムが、狭義の文学表現の枠を越え、日本語を使用した言語活動の総体を貫いて作動しているからなのではないか。日本語の言語の言語的存在は、言語の非言語的使用の共同体、趣味のサークルの内部に閉じ込められているのではないか。

だとして、貞久秀紀の述べる「明示法」の難しさはどのへんにあるか。「明示法」というのは、たとえば、

九死に一生を得るほどの大病の後にはじめてそとを歩き、生きていることのよろこびに胸をいっぱいにして歩いていて、公園の花壇に赤く咲いているツツジを見る。それは以前から毎年目にしていたものでありながら、このときはそれが目に触れるや否やそれまで目にしたことのないもののように真っ赤にそこにあり、「この世ならぬものに見えた」。
(貞久秀紀『雲の行方』)

というような体験を「それ」と呼ぶとして、この「それについて書く」というのではなく、「それを書く」というような、直接的な記述のありかたをいう。「体験」と「記述」との密着が狙われている。この「体験」がすでに「詩」と呼ばれているからには、この「記述」は詩の詩となるはずであり、つまり詩人の狙いは、詩と詩の密着の実現ということになるだろう。

日常の何気ない出来事が一個の「体験」となる過程は、「枝がゆれている」という出来事についていえば、こう分析できる。枝がゆれている(明示1)。その「枝のゆれが何かそれとはべつのふしぎに静かなもの」をよびおこす(暗示)。それは何かと考える。それは眼前にある「当の枝のゆれにほかならない」(明示2)と考える。

最初の「明示」を自動化した認知、最後の「明示」を活気付けられた認知と見れば、この過程は、「日常的に見慣れた事物を奇異なものとして表現する」ロシア・フォルマリズムの異化の過程そのものだ。「Aということがらを通してまさにAということがらが導きだされるような体験」(貞久前掲書)とはつまり、「石を石らしく」ということであるだろう。違いは、異化の目的が異化そのものであるのに対し、明示法の場合、言語の外側ですでに生じている「体験」としての異化の過程を言語に転写するというところに求められる。異化は目的ではなく、対象であり、「石を石らしく」は、「詩を詩らしく」という形に転位する。シクロフスキーによる異化の定義を確認しておきたい。

生の感覚を回復し、事物を意識せんがために、石を石らしくするために、芸術と名づけられるものが存在するのだ。知ることとしてではなしに見ることとして事物に感覚を与えることが芸術の目的であり、日常的に見慣れた事物を奇異なものとして表現する《非日常化》の方法が芸術の方法であり、そして知覚過程が芸術そのものの目的であるからには、その過程をできるかぎり長びかせねばならぬがゆえに、知覚の困難さと、時間的な長さとを増大する難解な形式の方法が芸術の方法であり、芸術は事物の行動を体験する仕方であって、芸術のなかにつくりだされたものが重要なのではないということになるのである
(ヴィクトル・シクロフスキー「方法としての芸術」水野忠夫訳、イタリックは原文では傍点)

でも貞久秀紀の作品では、「知覚の困難さと、時間的な長さとを増大する難解な形式」がとられていないように見える。むしろその詩に現れた言葉づかいは平易といってよく、流暢としかいえないように思える。

道のべにあり、ゆきすぎてなお思いかえされる二、三本の木は、
二本とも三本ともなく、二、三本として思いかえされる。
べつの日におなじ道をゆけば、二本か三本かのいずれかがあり、
いずれもこの二、三本の木であるのにほかならない。
(貞久秀紀「数のよろこび」、『明示と暗示』所収)

想起において「二、三本の木」という曖昧な形をとっていたものを目の当たりにし、それが「二本か三本かのいずれか」であることを確認しておきながら、「二、三本の木であるのにほかならない」と言い切っている。

ここに困難の在り処とその解決の方策が見て取れるようだ。日本語の圏域において、単純なものは、像を介し、複雑なものに転送される。つまり、明示から暗示への切り替わりは、同じ知識を共有し、同じ想像力を備えた共同体の成員において、ほぼ機械的に遂行される。でも、暗示から明示に向かう復路の道筋は、日本語の使用において事前に整備されていない。明示から暗示を経由して明示に戻ってくるのは畢竟難しい。どうすればいいか。この問題を解決する方策として「数のよろこび」に導入された仕組みは、最初の明示の局面にあって、像の自動的な起動を阻むことにあるといえるだろう。「二、三本の木」であるならば容易に想像できるのだ。むしろアランのいうように、想起されたパンテオンの円柱を数え、その本数をいいあてることはできない。けれど「二本か三本かのいずれか」である「二、三本の木」もまた想像できない。言葉がもつれている。やさしい言葉のもつれが、詩の言葉の表面に視線をつなぎとめる。立ち上がりそうで立ち上がらない像(明示1)と言語の言語的存在の顕示(明示2)との間で焦点が揺れ動く(暗示)。二つの明示からなる「ウサギ−アヒル図」だ。でもこれは方法の一端にすぎない。あるひとが、三本の木を前にして、

「いつもは三本ある木が、きょうは二、三本ある」
というならば、そして現に目の前にはあきらかに三本の木があり、このひとがぼんやりとしているようでもなく、機知をはたらかせてたわむれたり、婉曲表現を使ったりしているようでもないならば、わたしにはこのひとが何をいわんとしているのかわからない。にもかかわらず、わたしには奇妙におかしな感じがわいてきていて、そのかぎりではたしかに何かが伝わってきているのが感じられる。しかし、その何かが何であるのかはわからない。
(貞久秀紀『雲の行方』)

方法の要素であり難関であるものはこの先に現れる。「ウサギからアヒルへ、アヒルからウサギへ移行するときの、『何か』いわくいいがたいもの」(同前)が、その詩的言語で転写の狙われた詩的体験に伴う「奇妙におかしな感じ」と、ぴたり重なり合うような具合に言葉を按配していくこと。これが問題なのだ。「それについて書く」のではなく、「それを書く」というのであるから。

ある文によって暗示されることがらがすでにその文に明示されている――そのような文があるだろうか。ゆれている枝によってよびおこされるものが、ほかでもないそのゆれている枝であるように。
(貞久秀紀『明示と暗示』序)

言語の内と外、意味と像の双方を動員する写生の第三形式、「明示法」で最大の難関は、この二つの文のあいだに橋を架けることにある。けれど「明示法」というものは、『雲の行方』の前書にあるとおり、目的地のない道なのかもしれないのであった。それでもこれもまたひとつの理念であることにかわりはないだろう。日本語による写生をめぐる、三つの理念を素描した。



※関連するエントリ
●言語の言語的存在については
ベンヤミン「翻訳者の使命」を読みなおす(2)――ウィトゲンシュタインの中動態 - 翻訳論その他
こねこ文、あるいはシニフィアンとシニフィエの結合不良 - 翻訳論その他
●虚子のリアリズムについては
内包と外延――写真と俳句のシステム論的素描 - 翻訳論その他
一九五九年型リアリズム――「語り得ぬもの」を語るやり方としての - 翻訳論その他
●異化については
難解さとは別の仕方で - 翻訳論その他
死の恐怖をめぐって――中島義道、大江健三郎、森岡正博を中心に - 翻訳論その他

DeepL Translatorはどうなのか

「グーグル翻訳より格段にいい」というふれこみのDeepL Translator。ちょっと試してみたけれど、どうも本当っぽい。去年グーグル翻訳が新しくなってすぐに試した英仏翻訳で不出来だった文が、だいぶまともなふうに訳された。

17) 原文:He was laughed at.
Googleの訳:On le riait.
DeepLの訳:On s'est moqué de lui.

19) 原文:Thomas was laughed at by everybody.
Googleの訳:Thomas se moquait de tout le monde.
DeepLの訳:Tout le monde s'est moqué de Thomas.

20) 原文:The doctor was sent for.
Googleの訳:Le docteur a été envoyé pour.
DeepLの訳:Le docteur a été convoqué.

(※以上のGoogleの訳は2016年11月28日時点。番号は「新しいグーグル翻訳と翻訳者の失業」で振ったものに対応)

DeepLの17)と19)の訳は申し分なし。20)の訳は原文とニュアンスが違うけれど、文の壊れたGoogleよりはマシ。

G社のニューラル機械翻訳(以下GNMT)は、英仏語間の翻訳について、かなり高めの翻訳精度を掲げている。けれど実際のところ、両語間で逐語訳できないような構文の場合、短い文でもあまりうまくいかない。上の3例でGNMTの訳文は、文法的に破綻している(17と20)か、意味が原文と大きく違っている(19)。二重目的語構文の受動態をとった英文なども、GNMTではおかしなフランス語が出力されることが少なくないようだ。

25) 原文:He was given a book by me.
Googleの訳:Il m'a donné un livre par moi.
(※番号は「新しいグーグル翻訳と翻訳者の失業」からの通し番号。以下同様)

だから、去年GNMTを試してみたときの第一印象はこう。これまでの方式(フレーズベースの統計的翻訳)でも何とか意味の通じる形に翻訳できていた文は、流暢性が上がったぶん、すごく上手に訳せるようになった。けれど、これまでダメだった文は、あいかわらずダメ(主観です)。

ところが上の3例に限れば、DeepL Translatorは、どれもそれなりに訳している*1。技術的な詳細は明らかにされていないようだ。ただ、Lingueeのクローラで集めた10億文規模の対訳データでトレーニングしたとある(プレスリリース情報)。「Linguee」というのは検索サイトの一種。調べたい語句を打ち込むと、その語句を含んだ比較的信頼性の高い対訳文を一覧表示してくれる。便利極まりない。職業的な翻訳者であれば誰でも一度ならずお世話になったことがあるはず(直接サイトに行かなくても、不明な表現についてGoogleで検索をかけると上の方に出てくることが多い)。DeepL Translatorは、このLingueeの運営会社(ドイツ企業。なお同社はDeepL Translatorのローンチを機に社名をLingueeからDeepLに変えた模様)が開発した。

Le Mondeのサイトに簡単な検証記事があった(「一番いいオンライン翻訳サービスはどれ?」)。5つのジャンルの短い英語の文章を、5社の翻訳サービス(DeepL、Google、Bing、Yandex、百度)を使ってフランス語に翻訳させ、その出来栄えを比較している。5つのジャンルというのは、詩(エミリー・ディキンソンの平易な詩)、技術文(PlayStation 4のマニュアル、ただし専門的な技術用語は含まない)、報道文(バビロニア粘土板に関するもの)、「私の主張」的な文(英大臣の一人称のテキスト)、スポーツ記事(ラグビーの試合)。結果を見ると、詩、報道文、「私の主張」でDeepL の評価が相対的に高い(技術文はどれも及第点。スポーツ記事はどれも同じくらい不出来)。

記事の結論。オンライン翻訳は「たしかによくなっている」。でも「まだ人間のレベルには遠く及ばない」。機械翻訳を引っ掛けるのは簡単だと書いてある。ちょっとやってみる。

26) 原文:Il a acheté une bicyclette à son petit-fils.
DeepLの訳:He bought a bicycle from his grandson.

原文は小学館ロベール仏和大辞典の「acheter」の用例を借りた。この用例に添えられた日本語訳は「彼は孫に自転車を買ってやった」。DeepLはこれを「彼は孫から自転車を買った」という意味の英文に訳している。どういうことか。じつはフランス語の「acheter A à B」は曖昧性のある言い回しで、「AをBに買ってやる」という意味にも「AをBから買う」という意味にもなる。「おじいちゃんが孫から自転車を買う」よりも「おじいちゃんが孫に自転車を買ってやる」と判断するほうがヒトっぽい? けれど前者の可能性もゼロではない。人間でも、どちらか迷うことがある。意味を確定させるには、前後の文や言語外の情報を参照しなければならない。周知のとおり、この種の文脈は今の機械翻訳で考慮していない。

もうひとつ。

27) 原文:Elle est venue des fleurs dans les bras.
DeepLの訳:She came from flowers in her arms.

原文は小林路易『中級仏作文』より。「彼女は花を抱えてやって来た」みたいな意味になる。これも構文的に曖昧なケース。フランス語の「des」は、それだけを取り出して見た場合、前置詞+定冠詞なのか不定冠詞なのか判断できない。DeepLは「from」の意味にとっているけれど、この「des」は不定冠詞。そして例文26)の場合と違い、人間がDeepLのような解釈をすることは100%ない(はず)。ネイティブの仏語話者だと、構文的曖昧性があることすら気付かない人が多いと思う(「新しいグーグル翻訳と翻訳者の失業」の例文6)と同じ)。

自然言語は曖昧性に満ちている。人間はこうした曖昧性を知識で解消している。「知識獲得のボトルネック」が解決しない限り、機械翻訳は一か八かの対応にならざるを得ない。たまたま当たることもあるけれど、あくまでたまたまでしかない。

(DeepL Translatoirは今のところ日本語には対応していない。でも、8月30日付のRTLの記事を読むと、今年中には対応予定と書いてある。本当か?)


***


ニューラル機械翻訳のおかげで自然言語処理という分野に俄然興味がわいてきて、ネットで目に付いたものを眺めるようになった(数式みたいのは飛ばす)。いろいろ発見がある。

たとえば、英語を日本語に翻訳するのも、画像からキャプションを生成するのも、新聞記事を村上春樹ふうの文章に変換するのも、ぜんぶ同じモデルで処理できるというのは、rewordingもtransmutationも「翻訳」なのであり、translation properと一緒、というヤコブソンの指摘が実践的に裏付けられた格好だ。

また、統辞構造に留意せず、言語を系列で処理するというやり方(Seq2seq)で、結構いい感じの仕上がりになるという事実は、ソシュール言語学の再評価につながりそうである。ソシュール(というか『一般言語学講義』)は、「文」や統語論の位置付けが曖昧で、その点をチョムスキー生成文法の人が突いていた。けれどSeq2seqでいいのなら、構文論をなおざりにして、文をひたすら辞項の連鎖として見るというソシュールの態度も、あながち間違いじゃなかったといえるのではないか(ただし、丸山圭三郎は、原資料に当たった上で、リカージョンや結合価まで含めた統語論的な面もソシュールはラングに含めて考えていたとしている)。

ソシュールといえば、何より単語のベクトル表現というのが、すごくソシュールっぽい。語の意味それ自体を直接の対象にするのではなく、共起する語との関係において、いわばネガティブな形でそれを定義するというのは、ソシュールの「価値」の考え方にすごく似ている(かつ中期ウィトゲンシュタイン的な発想でもあると思う)。

去年、この単語ベクトル表現というものを初めて知って、「これはすごいのでは?」(「「AIが翻訳の不可能性に気付く日」へのトラックバックのご紹介」)と思ったけれど、その後、あれこれ欠点のあることを知るにつけ、残念な感じが強まっている。類義語や反意語をうまく扱えない(同じような文脈で出現するから)。そして何より機能語の処理に難があるというのは、決定的な気がする。GNMTでは、符号化の過程で、文を前からだけでなく後ろからも読み込ませ、前側・後側双方の単語を踏まえたベクトルを合成するということが行われているらしい。これに「アテンション」と呼ばれる、各単語の関与性を動的に考慮する仕組み(復号プロセスに沿って単語の重みが次々変わっていく)を加えたものがGoogleのいう「文脈」。でも、機能語や多義語の問題が、こうした狭すぎる意味での文脈だけで解決するはずもなく、当該方式の機械翻訳が「そこそこ」の壁を打ち破るのは相当むずかしそうである。実際、自然言語処理の専門家で、「ほんやくコンニャク」がもうすぐできる、なんてことを考えている人はいないのではないか。知識獲得の問題以前に、言語事象の取り扱いの目が粗すぎるのだ。

とはいえ、「ほんやくコンニャクは無理」と言い切るのもなんだかさびしいので、自然の言語の処理だけでなく、もっといろんなことのできる本格的なAI(ドラちゃん本体)の開発に期待がかかる。

それで松尾豊『人工知能は人間を超えるか』を読み返してみたのだけれど、以前のエントリ(「AIが翻訳の不可能性に気付く日」)に書いたとおり、やっぱりよく分からない部分がある。

まず再確認しておくと、この本で松尾氏はソシュールを引き合いに出している。でも実際のところ、概念にラベルを貼り付けて万事解決という考え方は、むしろソシュールの批判した「言語名称目録観」に近い。そもそも自己符号化器等によって概念そのものをポジティブな形で手に入れようというやり方は、先のベクトル表現と対照的に、非ソシュール的。何よりソシュールの記号概念は、こうしたシニフィアンシニフィエを切り離した取り扱いを許すものではない。記号がシニフィアンシニフィエの結合体であるとはいっても、シニフィアンシニフィエがあらかじめあって、その両者の結び付いたものが記号になるのではなくて、まず記号がある。ある存在者を記号とみなしたとき、すでにシニフィアンシニフィエの結合体としてそれがある、ということである。松尾氏は「言葉(記号表記)」(同書p.188等)と表記しているけれど、ソシュールが「記号signe」という言葉に不満を感じていたのは、こんなふうに「記号」と「シニフィアン」とが混同されてしまうことを危惧していたからだ。

ディープラーニングについては、松尾氏のこの本を読むまで名前しか知らなかったのだけれど、読んでみたら思ってた以上にコネクショニズムだった。コネクショニズムの話は、チョムスキーの本やチョムスキーがらみの本を読んでいると、ときどき出てくる。否定的な言辞が添えられていることが多い(たとえば酒井邦嘉『言語の脳科学』)。ところが、松尾氏は次のように言っている。

人間は言葉を話す。特に、「文法」を使って文の形でものごとを描写したり、書き綴ったりする。では、文法はどのように獲得できるのだろうか。有名な言語学者ノーム・チョムスキー氏は、人間は生得的な文法(普遍文法)を備えていると言った。私の考えもこれに近い。
(松尾豊『人工知能は人間を超えるか』p.193)

で、これを「コンピュータに埋め込まないと、人間と同じような文法を獲得するのは難しいかもしれない」(同書p.195)。つまり松尾氏は記号主義(古典的計算主義)的な構文論を認めている。その上で、人工知能は人間の知能と同じでなくても構わないとしている。構文論抜きで構わないということだろう。松尾氏による人工知能にとっての「記号」は、前述のとおり、ソシュールの考えるような「記号」ではないし、記号主義的な「記号」とも違うのだ(構文論がなくても成り立つものと考えられているから)。

もし単純に構文論抜きの記号で行くのであれば、森羅万象の織り成す無限の事態のそれぞれに対して、ひとつひとつ記号を割り当てていくという途方もないことになりそうだけど、どうなんだろう?

ま、とにかく、最近の自然言語処理関連のトピックは面白いものが多く、興味が尽きない。そういえば、品詞にベクトル表現を与えるというのも何かで読んだ。ふつう離散的とみなされている品詞を連続量として扱うという話。これ、吉本隆明だ。吉本は品詞を自己表出、指示表出の二次元ベクトルで考えている。文芸作品の価値も計算可能で比較可能と吉本隆明が主張したことの根に、自然言語処理的な着想があったのだ。

こうした品詞に限らず、言語学では基本、言語記号を離散的なものと考えている。単語の意味についても、離散的な意味素性の集合として記述されることがある。ニューラルネットを使って「概念」を構築するという場合において、この意味素性に対応するのが「特徴量」だ。これまで離散的に捉えられていた記号の成分が、連続量として処理されるようになった。けれど「素性」も「特徴量」も英語では同じ「feature」。いうまでもなく、両者のアイディアは、記号論的に同じ図式を共有している。すなわち、一個の記号にスペシフィックな内包的存在者を措定している。その昔デリダが批判した形而上学の図式。自己符号化器による概念の獲得であれ、ベクトル表現による単語や文の意味の獲得であれ、数値列の生成をもって「概念」や「意味」が獲得されたとみなす限りにおいて、昔ながらの形而上学を免れていない。「ゼロショット翻訳」とかいうのはその最たるもの。個別言語から切り離された、普遍的な純粋意味論の生成を主張している。つまり――デリダがパースを持ち上げソシュールを批判したときに使った言葉でいえば――「超越論的シニフィエ」の工学的実現を謳っている。統計学形而上学だ。

目下、自分の関心は、GNMT等の現状あまり精度のよくない機械翻訳システムが、これから精度を上げていき、「そこそこ」の水準に達するとして、そのことが日本語に対し、何らかの影響を及ぼすか否かという点にある。英語に機械翻訳しやすい形に日本語が変化していく*2とか、前に「自動翻訳機が実現しない理由、エッセンスのナンセンス、物語に拮抗する文体」に書いたようなこと。そういうことが起きれば、それはそれで面白い。ただそうなると、言語的な多様性が縮減することになるわけで、完全自動翻訳機が完成する頃の世界には、そもそも実質的に異なる言語なんてなくなっているかもしれない。そしたら「ほんやくコンニャク」のありがたみもそのぶん減ることになるけれど、ドラちゃんの道具はほかにもあるから大丈夫。


※例文の画面キャプチャはここにまとめた。


Alors le DeepL Translator ?
Quelques méthodes récentes utilisées dans le domaine du traitement des langues naturelles évoquent des idées linguistiques plutôt classiques : le modèle sequence-to-sequence serait comparable à la notion de syntagme (enchaînement des éléments consécutifs) introduite, sans tenir compte explicitement de la structure syntaxique de la phrase, par F. de Saussure, et le principe des vecteurs de mots est aussi un peu comme la notion saussurienne de valeur, surtout en termes de négativité. L'idée fondamentale de ces méthodes TAL est très métaphysique, car en fait elle présuppose la distinction rigoureuse et la correspondance biunivoque entre le signe linguistique et son corrélat idéal. La traduction dite «zero-shot», c'est le plus typique du genre. Elle est basée sur la prétendue génération d'une sémantique pure et indépendante des langues. On fait donc valoir l'ingénierie de «signifié transcendantal». Il s'agit d'une métaphysique re-construite (et non pas dé-construite) par l'apprentissage automatique et statistique.

*1:もちろん、これはあくまで単独の文として見た場合の話で、文章の流れの中で訳文がそのまま使えるかどうかは別問題。現実世界で使用される文は、教科書の例文みたいな「死んだ文」ではなく、言語内外の文脈により活性化された「生きた文」。人間の翻訳者は、この種の文脈やテーマ・レーマ構造などを踏まえて訳し方を決める。けれど現状の機械翻訳は、こうした文同士のつながりは考慮していない。だから、複数の文を翻訳させると、相互に無関係な文がズラズラ並ぶことになり、「何いってんだこいつ」となる(「新しいグーグル翻訳と翻訳者の失業」の13)と14)がこのケース)。

*2:ニューラル機械翻訳は予測不能な結果を出してくるので、こうすればこうなるというルール化が難しい。それでも、対処法がないわけではない。たとえば「新しいグーグル翻訳と翻訳者の失業」の13)や14)に見られるような結束性や照応の問題をクリアするには、2つの文を1つの文にまとめてしまえばいい。「吾輩は猫である。名前はまだ無い。」ではなく、「吾輩は猫であり、名前はまだ無い。」にする。あるいはもっと単純に、最初の句点を読点に変えて「吾輩は猫である、名前はまだ無い。」にする。するとだいぶ改善される。

盗まれた身体――奥村悦三『古代日本語をよむ』

堀江敏幸「土左日記」現代語訳の面白み。「貫之の緒言」と「貫之の結言」、そして括弧を使って本文に組み込まれた沢山の自注。「十六歳の日記」みたいだ。でも実際の「土左日記」には緒言も結言も注記もない。だから「原文にない」、「創作だ」といいたくなるかもしれないけれど、原文にないといえば、そもそも訳文にある言葉はどれひとつ原文にない。そうでないと翻訳は成り立たない。つまり「原文にない」は翻訳が翻訳であるための必須条件だ。もちろん、原文にない言葉を緒言や結言や注記という形によって本文と別のものとして差しだすことは、訳文において、そこにない原文の範囲を限定し、翻訳と創作、翻訳と解釈の区別を律儀に保とうとする潔癖な所作に見えかねない。だからそれは、純粋な翻訳があり得ると考える習慣、実利的な思考の強化に貢献することにもなる。川端康成は晩年、「十六歳の日記」にあとがきを二つ重ねたり、注を加えたりしたことを悔いている。しかしながら、堀江訳「土左日記」では、翻訳とそれ以外とを区別することなどできないのではないか、外部と内部は分かちがたくからみあっているのではないかという疑いが、括弧の外側においてすでに疑われているようなのだ。

(原文)をとこもすなる 日記といふものを をむなも してみむとて するなり
(訳文)おとこがかんじをもちいてしるすのをつねとする日記というものを、わたしはいま、あえておんなのもじで、つまりかながきでしるしてみたい(それは必ずしも、女になりすますことを意味しない。すでにこの書が私という男の手になるものであり、土左日記という標題を持つ創作であることは、劈頭に、ほかならぬ漢字で記されているのだ。これは土左日記であって、とさのにきではない)。

緒言、結言、注記を含めた訳文の全体で原文の完全な翻訳をなす(完全な、というのは純粋な、という意味ではないし、完璧な、という意味でもない)。三点は、本文の本文性、翻訳の純粋性を際立たせるという動機――「括弧内は訳者が補った説明である」といった類の、学術書等の翻訳の凡例に見られる弁明により露骨化するそれ――とは違った動機に促されたものらしい。訳者あとがきを読むと、「奇妙な視点の揺らぎ」と書いてある。

久しぶりに読み返した「土左日記」の言葉には、やはり大小の複雑な揺れがあった。しかし揺れの合間に、ひとつの声が流れていた。どの場面のどの位置に立っても、背後から、いまなぜこのような散文を書かざるをえないのかを自問する貫之の声が聞こえてきた。仮名文字表記による散文に漢籍をふくむ他者の言葉を呼び込み、もうひとりの大きな他者としての自作和歌をも組み込みながら、彼はつねに冷静な眼で、「いま書かれつつある言葉」からいっときも眼を離さないメタフィクションを創造しようとしていた。書かれたものを読み返すまなざしが、「書かれつつある」現在を二重化する。表向き簡素な文章のなかで、貫之は二十世紀後半以後の文学の先鋭的な意匠と少しも異なるところがない、果敢な実験を試みていたのである。
堀江敏幸「いま書かれつつある言葉」、池澤夏樹『日本文学全集03』p.499)

メタフィクション」――けれど「奇妙な視点の揺らぎ」という点に立脚すれば、「移人称小説」と呼ばれていてもよかったはずである。語り手である女の「わたし」は、全知の作者、男の「私」の知識をもって、「わたし」には知り得ないようなことを平気で語る。だれのものとも知れない視点が全部「私」のものであるとされた中に紛れ込む。草創期の仮名散文における「先鋭的な意匠」と見てもいいけれど、小説を書くことに付きまとう「当たりまへ」が原初にちかいところで当然に発現しただけと見ることもできる。区別できない。区別しようとするのが間違いであるのかもしれない――。

であるとして、話はとぶようだが、堀江訳「貫之による緒言」に次のようなところがある。

かつて真名序と響きあう仮名文字の序を綴っていたときにも感じた和文と漢文とのずれ、もしくは漢文の和文への浸食に対する抵抗のむずかしさを、私は土佐からの船の上で、いまさらながら認めざるをえなかった。
(前掲書p.351)

この「漢文の和文への浸食」については、ずっとまえ、山城むつみ氏のエッセ、「翻訳の力――貫之、プーシキン、二葉亭に連動しているもの」(三田文学1996年夏季号)が奥村悦三「書くものと書かれるものと――日本語散文の表現に向かって」をとりあげているのを読んだ。それによれば、「奥村氏は、(中略)翻訳語の混入をめぐる考証も着実に押さえつつ、そこから『個別の翻訳語の存在の数限りない指摘以上に、土左全体が翻訳文体になっていることを認めることができる、とは言えないのであろうか』とさらに踏み込んだ問いを投げかけている」。

実際、土佐日記は初っ端「をとこもすなる」の「も」ひとつとっても一筋縄ではいかないわけで、ぜんぶが翻訳なのだといわれると、そうか、翻訳か、とも思う。難しい思想書の翻訳でテニヲハがおかしくなっているのは見たことがある。けれど、ずっとまえのそのときは、「翻訳文体」の射程を勝手に短く見積もっていた。だから、挙げられた奥村氏の論考は読んでいない。けれど、この春刊行された『古代日本語をよむ』は読んだのである。そして、「漢文の和文への浸食」のモダリテをめぐり、あるひとつの貴重な示唆を頂戴した。

正倉院に残された上代文書群に、僅少の正訓を交えながらも基本的には真仮名を使って書かれた手紙(ないし解文)と見られるものが二点含まれていて、甲種・乙種と呼び分けられている。いずれも読む人が読めば読めないところはないようだ。けれど全体として言わんとしているところがよくわからない。そういう代物が二つ残っている。

考えられることのひとつは、こういうことだ。「文意が分かりにくいのは、多分に私的な内容のものであって、当事者同士が了解すればそれで済むといった性質をもつからであろう」(山口佳紀『古代日本文体史論考』)。あるいはまた、甲乙両種の仮名文が「《万葉集》のなかの題詞や序や左注などの漢文にくらべると、いまだ、散文とよぶには、あまりにも遠いように感じられる」(亀井孝ほか編『日本語の歴史2 文字とのめぐりあい』)、そういう未熟さを抱えていたためである。

対して奥村氏は、こう考える。「この書状は純粋の真仮名文ではなかった、それは言わば翻訳文であった、とも主張しうるのではないであろうか」。つまり、「日本語として読もうとしたから理解できなかったのであり、解釈するためには、それが、正倉院文書中に多数見出される漢文(あるいは、変体漢文)の文書と『重ね合せ』られるべきもの(中略)であると考えられなければならないだろう」。

「翻訳文」といっても、必ずしも、起草に先立って一定の漢文が現実に書かれており、それを仮名文に翻訳した――奥村氏はその可能性も捨てていないけれど――というのではなく、心内の文案に照らして、つまり漢文的な発想に寄りかかって文章が綴られたということである。その効果としては、漢文的な書式がとられる、漢文的な文型がとられる、漢文的な語法がとられるといったこと、そしてまた、築島裕平安時代の漢文訓読語につきての研究』にいわれるような「漢文訓読語」が混入するといったことが真っ先に考えられるだろう。

けれど、奥村氏の挙げる中には、こうした形式面・語彙面の浸食とは様相を違えたものがいくつか(いくつも)ある。

例えば乙種に見られる「宇気」は、小松茂美『かな―その成立と変遷』に掲げられた釈文で「受ける」と解されている。けれどそう解すると文意がよく理解できない。いや、そう解するからこそ理解できないのであって、じつはこの「宇気」は、「日本語の『受く(受ける)』と解されるべきでなく、漢語『請』の翻訳語と考えられるべきであろうと思われる」。

請という字が、「受」の意味を持っている――だから、ウクという《訓》を付されることにもなる――ばかりでなく、「請求する」ことをも意味するために、前者にのみ対応させうるウクが――本来、日本語としては考えられなかった――後者の用法をも併せもつようになった、とは想定できないであろうか。
(奥村悦三『古代日本語をよむ』p.35)

こういった意味の領域の浸食は、先に挙げた形式面での浸食とインパクトのありようが違う。後者の浸食は、一見してその度合いが明らかであるけれど、前者の場合、見ただけではわからない。いわゆる「訓読語」の混入にしても、特異な言葉の使用ではあるにせよ、やはり基調は和語であり、また字音語であり、おおむね字義どおり理解できる。ところが、奥村氏のいう「翻訳語」の場合、記された言葉は和語そのものであるのに、和語としてそのまま読むことはできないのである。和語の浸食は、外側ではなく、内側から、かつ内側だけに及んでいるということだ。

似たようなことを考えたことがある。

意味を媒介に、漢字を使って日本語を書く。そのため、まっさきに思い浮かぶやり方は、手持ちの日本語の言葉と意味の似た漢字を選び、それを当の日本語の言葉の表記としてしまうという形だろう。(中略)日本語の「イケ」という言葉と意味の重なりを持つ「池」という漢字を、その原義を犠牲に、日本語の「イケ」を表記する文字として選択するということだ。この場合、日本語側の意味は、いずれ両言語間の交渉によるノイズが入るのは必定だとしても、当初に限れば無傷であり得る。
けれど、こういう形とは別の形、つまり日本語の「イケ」という言葉を「池」と表記したのではなく、逆に中国語の「池」を、中国語の「池」の持つ意味を丸ごと保持したまま、日本語で「イケ」と呼ぶことにした、ということも、理論上、考えられないわけではない。この場合、日本語の言葉は、日本語の音を備えてはいるけれど、その内実においてむしろ中国語となる。つまり、この仮定に従えば、日本語は、自ら中国語となることで、その書くことを手に入れたということになる。
(「志賀直哉『国語問題』再考」、トラデュイール第2号)

これを書いたときは、後者の可能性をとるうえで、クワインの「根底的翻訳」や「指示の不可測性」といった概念を参照しつつ、訓の成立に対する渡来人の関与のことを重視していた。半島からの渡来人が当地で和語を学び、その渡来人の習得した和語を通じて漢語を学ぶ。こういう二重に不透明なプロセスがあったことにこだわっていたのだ。でも一面的だった。よく考えれば、漢語による和語の乗っ取りは、外来の、異なる言語を使うひとたちの介在がなくても、平安中期以降の漢文訓読の場で確認されるとおり、生まれつき和語を使って話すひとびとの側で、自発的にも内在的にも起こりえることだろう。へんなところに引っかかっていた。自分でも「日本語は、自ら中国語となる」と書いているのに。

要は翻訳の問題なのだ。日本語がその書くことを手に入れるため、翻訳という意味論的なプロセス、不透明かつ不安定でしかあり得ないプロセスを経ていることが、いろいろのおおもとにある。相違していることが形に反映していない二つの語、翻訳語と自国語の混在する状況が組織的に生まれたのである。現今「役不足」等の言い回しに見られる誤用と正用の混在や、「善意・悪意」等の法律用語と日常語との乖離にも似たようなことが、もっと広くあまねく起きたと考えれば、文字獲得のため当初払った代償の大きさがわかる。言語体系が二重化したのである。しかもその二重性は不可視だ。

古代には、書かれたものは、ほとんど常に、漢語(字音語)のみならず、また、日本語としては理解できない翻訳語をも使うことで綴られたものであること、また、後者については、古代人が日常使っていた言語に基づいては、意味を解しえないものだと考えるべきことは、おそらく、間違いない、と言えるのであろう。してみれば、古代日本語をよむには、そこに、それらが数多く含まれている(かもしれない)ことを常に念頭に置いておかなければならないであろう。
(奥村前掲書p.168)

ここにはいくつもの留保がある。結局のところ、断言できることは何もないといっていい。けれど、まさにこの点がおおごとなのだ。何も断言できない、区別できないということ。意味作用が宙吊りのまま遂行される言語活動が、和漢二つの言語体系のあいだに、見えない差分を生み出した。そしてこの差分が、いずれの言語とも異なる、顕在化しない、しえない、第三の言語を養ってきた。そしてこの潜在的な第三の言語が、どこにもない場所で想像上の成長を続け、いまここにある日本語とのあいだに、実体のない、差異のための差異を、絶えず新たに生み出し続けている(かもしれない)のである。