第17回 『オノマトペ』

皆様こんにちは,同志社大学の土屋誠司です.自然言語処理の第17回目の今回は,オノマトペについて書いてみたいと思います.

オノマトペとは,「ハラハラ」,「ハキハキ」のような擬音語や擬態語の総称になります.言葉で物事を表現する際に,より印象深く,豊かで臨場感のあるものにするために必要不可欠な表現方法の一つかと思います.このオノマトペという表現は,日本語で非常に多く用いられる表現ですが,日本語特有の表現方法ではなく,様々な言語で同じような表現方法が存在しています.実際,他の言語では日本語程に多くのオノマトペを頻繁に利用するわけではありませんが,例えば,中国語では日本語と良く似た構造のオノマトペが利用されています.また,英語では日本語で多く見られる反復する形ではないオノマトペが利用されていますが,実際に聞こえる音をアルファベットの発音に照らし合わせてオノマトペとして表現しています.

このようなオノマトペによる表現は,その言語を母語としている人であれば非常に容易に理解することができます.また,オノマトペは音的な情報から印象を伝えますので,ある程度固定した表現もあるのですが,音の組み合わせにより様々なオノマトペを作ることもでき,実際様々なオノマトペが日々創出されています.そのため,国語辞書などにあえて記載されることは非常に稀なケースで,記載があったとしても,使用されているオノマトペをすべて網羅して記載していることはありません.そのため,その言語を母語としない人にとっては学習し難い言語表現であると言えます.特に,オノマトペを構成する文字が少し異なるだけでまったく異なる印象を与えることも学習,理解の難しさを助長していると考えられます.例えば,先の例の「ハラハラ」という危惧を感じる様子を表現するオノマトペの場合,「ハ」を濁音にすると「バラバラ」となり,統一体が部分に分解される様子を表現し,また,半濁音の「パ」にすると「パラパラ」となり,少量しか存在しない様子を表現します.さらに,「ハラハラ」の「ラ」を「キ」にした「ハキハキ」では,物の言い方が明快である様子を表現するオノマトペになります.非常に面白いですよね.

これらのオノマトペの特徴は,人が学習するときだけでなく,コンピュータで扱う際にも困難を生じさせます.そこで,私も研究対象にしたことがあり,「モーラ系列と音象徴ベクトルによるオノマトペの印象推定法」(土屋 誠司, 鈴木 基之, 任 福継, 渡部 広一,自然言語処理,Vol.19,No.5,pp.367-379,2012 )として発表いたしました.この論文では,オノマトペが表現する印象を推定する手法を提案いたしました.日本語を対象に,オノマトペを構成する文字の種類やパターン,音的な特徴などを手がかりに,そのオノマトペが表現している印象を自動推定する方法です.例えば,「チラチラ」というオノマトペの印象を知りたい場合,提案した手法を用いたシステムに入力すると「少ない」や「軽い」などという形容詞でその印象を表現し出力することができます.結果として,人間同士の一致率の8 割程度にまで推定精度を近づけることができました.これにより,大規模な辞書を作成,利用することなく,新たに創出される未知のオノマトペの印象も推定することができます.また,日本語を母語としない人に対して,日本語で表現されたオノマトペの理解の支援に繋がると考えられると共に,機械翻訳,情報検索,情報を推薦するシステムなどでも活用できると考えられます.

次回は,意図を知るについて書いてみたいと思います.