第7回 『意味解析・文脈解析』
皆様こんにちは,同志社大学の土屋誠司です.自然言語処理の第7回目の今回は,意味を捉えるための意味解析・文脈解析について書いてみたいと思います.
文の中の単語が分かり,文法のチェックができると,言葉としては成立している表現ということになります.これをもって「コンピュータは言葉を理解できた」と思うのは早合点です.例えば,「私は電車で走っている人を見た」という表現は,『形態素解析』も『構文解析』も正しく行うことができる日本語として確かに正しい表現です.しかし,どのような意味なのかを考えた場合,複数の解釈をすることができます.例えば,
・「電車の中で走っている非常識な人を私は見た」
・「私は電車の中にいて,外を眺めているとそこに走っている人を見つけた」
・「私は走っている電車の中にいて,ふと外に人がいるのを見た」
など,いろいろな解釈をすることができます.また,例えば
・「この絵は上手に描けている」
・「この力士は上手投げで勝った」
・「人気俳優が上手から出てきた」
という文で使われている「上手」という単語は何と読みますでしょうか?それぞれ
・「ジョウズ」
・「ウワテ」
・「カミテ」
となりますよね.読み方が違うと同じ漢字でもまったく異なる意味になってしまいます.
このように,発言者が何を言いたかったのかは前後の関係やシチュエーションによって変わってくることになります.そのため,『形態素解析』,『構文解析』の後には意味を推定する『意味解析』,前後の文も存在する場合には『文脈解析』という処理が必要不可欠です.
ここまで処理をすることで,ようやく言葉を理解することができます.なかなかハードルが高いですよね.ちなみに,現存のWeb検索などでは,実は『形態素解析』や『構文解析』までしか行われておらず,その先の『意味解析』や『文脈解析』はまだまだ研究段階の処理であり導入されていないと思われます.そのため,自分の望むものが得られなかったり,非常識な回答になったりすることがあります.先の「上手」の例では,例えば視覚障害をお持ちの方の補助として音声合成で文章を自動的に読み上げるシステムがありますが,その際の読み分けは非常に重要な機能ということになります.
今後は,人工知能技術も駆使して,『意味解析』や『文脈解析』を実現すべく開発が加速化していくと思われます.あと5年から10年すると,このような技術も導入したより素晴らしいシステムを我々は使用することになるのではないかといわれています.待ち遠しですね.
意味は非常に奥深いものがあります.そこで次回は,まずは単語の意味について書いてみたいと思います.