第27回 『自分の言葉を見つめなおす』

皆様こんにちは,同志社大学の土屋誠司です.自然言語処理の第27回目の今回は自分の言葉を見つめなおすことについて書いてみたいと思います.

私は,研究として人工知能や自然言語処理を扱っております.もちろんその専門分野のことには詳しくなるのですが,それと同じぐらい,そのモデルとなっているもの,例えば,人工知能の場合は人間のことが,自然言語処理の場合は母語のことが気になり,注意を払うようになりました.人間のことが分からなければ,人間を模した人工知能は作れないですし,母語のことを大事にしないと,その他の言語のことも理解できなくなり,コンピュータでの処理の方法も閃かないのではないかと思います.これは研究だけに当てはまることではないと思います.何かあることに詳しくなることは,単なる興味からで良いかと思います.そして,そのことだけではなく,その先にあるその分野の本質やそのモデルになっている事柄,周りの事柄などにも目を向けて行くようにすると,いろいろな事柄に知見や経験などが応用できるようになるのではないかと思っています.

このブログを見ていただいているということは,自然言語処理というものに興味を持っていただいているのかと思います.是非,自然言語処理を楽しみながら,自分の言葉を見つめなおしていただくと良いのではないかと思います.自然言語処理というコンピュータに人の言葉を理解させる方法を通じて,逆に今,自分が日常使用している言葉を見つめ直す良いきっかけになるのではないかと思います.コンピュータが理解しにくい言葉は,実は人間でも理解しにくいのではないか...例えば,機械翻訳システムを利用して,自分の意図していないおかしな翻訳結果が出力されてしまった場合,「性能が悪いからこのシステムは使えない」というだけではなく,「実は,自分が入力した日本語がおかしいのではないか」と...

実際,例えば,文章要約の技術では,文章の中で意味を伝えるために重要な事柄を見つけ出さなければなりません.その時,以下のような情報を使います.

 ・手がかり語:要約に重要な語を抽出するための手がかりとなる表現(語)

 ・テーマ語:要約に重要な文書固有のキーワード

 ・位置情報:文書のどこに記載されているかの情報(段落の最初と最後の文は他の文に比べて重要)

 ・タイトル:タイトルや見出しに使用されている語は重要

逆の言い方をすれば,コンピュータで文章を要約しようとすると,このような情報が正しく表記されていないとうまく処理できないということになります.果たして,自分が書いた日本語の文章は,このルールに則っているでしょうか?

すべての人が,誰にどんな物事を伝えたいのかを考え,その人の立場に立って,しっかりとした言語表現を使いこなすことができさえすれば,メールやSNSでトラブルになることももっと少なくなるのではないかと思ったりします.

次回は,重要とは何かについて書いてみたいと思います.