第3回 『日本語の独自性』 

皆様こんにちは.同志社大学の土屋誠司です.自然言語処理の第3回目の今回は,日本の独自性について書いてみたいと思います.

自然言語は大きく3種類に分類することができます.一つ目は,単語の形に変化がなく,単語の位置で文法上の関係を表現する『孤立語』です.例えば,中国語やベトナム語がこれにあたります.日本語であれば,過去を示すために「食べる」を「食べた」と動詞の語形を変化させたり,「夏」の頭に「ま(真)」などの接頭辞を付けて「真夏」と記すことで,夏の真っ只中で最も暑い時期のことを表現したりします.しかしこの『孤立語』では,このような表現方法がないため,文脈や語順,接置詞(前置詞や後置詞)などを使うことで上記のような事柄を表現することになります.

二つ目は,単語の形を変化させることで文法上の関係を表現する『屈折語』です.単語の形が変化することを『屈折』と呼ぶことからこのような名称がつけられています.例えば,英語やドイツ語など多くのヨーロッパの言語がこれにあたります.名詞と形容詞の変化のことを『ディクレンション』,主語の人称や数,文法的な機能(時制や話法など)に則る動詞の変化のことを『コンジュゲーション』と呼びます.また,単語の語幹は変化せず語尾が変化するものを弱変化,単語の語幹自体が変化するものを強変化と呼びます.先の「食べる」であれば,「食べ」の部分が語幹,「る」の部分が語尾になります.

最後の三つ目が『膠着語』です.例えば,日本語や朝鮮語,トルコ語はこの『膠着語』にあたります.文法上の関係を表す短い語を他の語に密着させて表現します.日本語では『助詞』や『助動詞』という『付属語』を『自立語』の後に置くことで表現していくことになります.『助動詞』は,主人公の単語の意味を決めたり,陳述を助けたりする役割をしますので,文字通り補助的な役割を担います.一方『助詞』は,文全体の構造を決める極めて重要な役割を担うことになります.つまり,「が」,「を」,「で」などの格助詞が意味を理解する上で重要な要素になってきます.そのため,『孤立語』や『屈折語』に比べて語順の自由度が高いという特徴があります.

私も英語は未だに苦手ですし,大学生の頃には第二外国語としてドイツ語の勉強をしましたが,女性名詞や男性名詞,中性名詞など英語よりももっと複雑に感じ,ちんぷんかんぷんだった記憶があります...しかし,上記のような分類を見てみると,英語やドイツ語と日本語はまったく違う構造になっていることが分かります.日本人は語学が得意ではない人が多いという話を聞くことがありますが,ヨーロッパ圏におられる方々と比べるとそれは相当不利だと言えるかと思います.また,コンピュータで言語を扱う上でも,研究開発は欧米中心に行われてきた歴史がありますので,日本語をコンピュータで扱うのは一癖も二癖もあるということになります.単に,海外の研究成果を勉強して,日本語に適用しただけでは正しく処理できず,良い性能が出ないこともしばしばです.やはり,その言語特有の方法を編み出す必要があるかと思います.そして,それを編み出すのは日本語をネイティブに使いこなすことができる日本人にしかできない仕事なのだと思います.ちなみに,日本人であれば朝鮮語やトルコ語を勉強すると非常に簡単に覚えることができるらしいです.興味のある方は是非チャレンジしてみてください.

次回は,文の中から単語を見つけるというコンピュータで自然言語を扱うための第一歩目の処理である形態素解析について書いてみたいと思います.