「言語学の経験論的転回」再考 土屋 俊 歴史を繙くならば、言語処理は1980年代後半に音声処理の影響を受けて、「経 験論的転回」を経験したとされている。すなわち、言語能力の研究としての合 理主義的言語学となじみがよいルールベースの言語処理から、言語運用の所産 である発話と書記の痕跡の記録という経験的基礎に基づく言語処理への移行が その展開の本質である。その移行は、かつてシャノンが断念したn-gramによる 言語モデルの構築に一定程度成功したことによって、意味のある移行であった と考えられている。このような言語処理の動向は、言語学に対しても影響を与 えた。それまで、単語の数を数えるだけで二流の学者にこそふさわしいと考え られていたコーパス言語学が、先端科学として脚光を浴びるようになったこと がその象徴である。すなわち、言語運用の痕跡の記録であるコーパスこそが、 言語研究の基礎であるべきだという確信が、この経験論的展開の前提であり、 かつ、現段階においては帰結であると思われる。(たしかに合理主義的な言語 研究者も言語学の経験科学としての地位をしばしば強調するにせよ、直観が経 験ではないことは哲学者を呼ばなくても、知っていなければならないことであ る。) この経験論的転回の意味を考えるにあたって重要な問題は、ここで言語学とい うことでどのような範囲をさされているかということである。もし言語学が記 号の文法的な配列の集合の特徴づけを第一の目的とするものであるならば、そ のような集合が可能な文タイプの集合である以上、現実の出現した文インスタ ンスを収集しただけのコーパスを基礎とするが役立つはずはない(本来は、反 証例の宝庫として役立つはずであったが、実際に発話されたからといってえら くはないという態度が一旦承認されれば、コーパスの価値はもはやない)。。 それとは対極の位置にある言語学の発想として、社会言語学・心理言語学のよ うに、言語使用に関する総合科学こそが言語学であるとすると、現在のコーパ スのほとんどがマルメディア構造化コーパスとはとうていいえない以上、その ようなコーパスにもとづく研究が、言語にかかわる社会的、心理的事実の解明 にやくだつとは思えない。したがって、言語学についての極端な2つの解釈に ついては、あきらかにコーパスベースで得られた知見は、それぞれの意味の言 語学に役立つはずはないのである。役立つようにするためには、言語学の概念 を変更するか、コーパスの作り方について抜本的に考え直す必要がある。 言語学の概念の変更は無理であるとしても、広い意味の言語学にとって、どの ような種類のコーパスも重要であるといえる側面があることは忘れてはいけな い。まず第一に、言語が変化するということの意味が理解されるとすると、変 化の以前と以後とを比較することは、なんらかのコーパス収集作業が成果を挙 げていなければ到底不可能である。とくに重要なのは、現代の技術が音声の記 録について格段の進歩をとげ、転記システムの助けをかりないでも、ある程度 (つまり音響的側面についてはすくなくとも)保存しておくことができるように なったことが指摘できる。これは、たしかにコーパスベースの言語処理研究の 「成果」とは言えないであろう。しかし、コーパスベースの言語研究を可能に した技術の蓄積は積極的に評価すべきであり、突然具体例を述べるならば、 フィールドワークにデジタルでないアナログの録音機を持っていくようでは言 語学者とは到底言えないという時代になっていることは明らかである。 このことを徹底するならば、真の意味の経験的言語学が可能になると思われる。 しかし、そのコーパスを基礎として、たとえば日本語について3-gramモデルの 構築したとしよう。それは、なにかわれわれの直観に背くものであるように感 ぜられることがあるかもしれない。人間の言語に特有の複雑な構造とそれを可 能にするごくわずかの規則の体系というあの文法観はどうなってしまうのであ ろうか。あるいは、辞書に例文として記載される典型的な例は、コーパスのいっ たいどこにあるのであろうか。これらに対する解答としては、ともかくまだコー パスが小さいのだ、もっと大きくすればかならずなにか出てくるはずだという ことが可能であろう。しかしこの解答は、ある意味でたんなる願望の表明にす ぎないかもしれない。コーパスを研究した成果が既存の言語学と整合的である という保証はない。あるいは、すでに言語能力と言語運用を概念的に区別した ときにこの保証はなくなっていたというべきであるかもしれない。とするなら ば、現代の言語学の経験論的転回とは、むしろ、経験的言語学のはじめての試 みというべきであるかもしれないのである。