言語理解タスクをデザインし

人間の知的活動を支援する

相澤 彰子

コンテンツ科学研究系

副所長

研究分野

自然言語処理

テキストメディア

知識処理

研究背景・目的

 言語は人間の知的な活動の基盤であり、コンピュータによる言語処理は、知能システムの欠かせない構成要素となっています。言語処理により人間の情報収集・発信や意思決定を支援するためには、単にコンピュータでテキストの意味を解析するだけではなく、テキストの読み手・書き手である人間が、どのように言語を処理しているかを想定して、システムを構築する必要があります。本研究では、深層学習を含む機械学習、コーパス分析、アノテーションなどを用いて、コンピュータによるテキストの意味解析と人の言語活動のモデル化、および両者をつなぐ手法の開発に取り組んでいます(図1)。

図1 テキストを介した人間の言語活動(研究背景・目的)

研究内容

 最近の研究トピックとして「人間・コンピュータの共通理解基盤の実現に向けた対話タスクデザイン」を紹介します(図2)。人間とコンピュータが言語テキストを介して情報をやりとりするためには、与えられたテキストに対する解釈を共有する必要があります。これは「基盤化」と呼ばれ、言語処理における基本問題です。本研究では、データ収集や評価の方法までを含めた対話タスクの設計や分析に取り組むことで、対話における基盤化の仕組みを解明し、人間の質問に答えたり、人間と対話してタスクを遂行したりするシステムを実現することをめざしています。

図2 対話タスクの設計(研究内容)

 他のトピックとして、大量の文書を解析してユーザの質問に答える質問応答システム、定型表現を用いた文章作成支援などの研究も進めています。また、文書のレイアウトや論理構造の解析、専門用語抽出、エンティティリンキング、数式など非言語オブジェクトの意味検索などの基盤技術の研究開発にも取り組んでいます。

産業応用の可能性

 対話的な意味解析によって、たとえば人間がコンピュータに対して一方的に指示を与えるのではなく、実行可能なオプションを尋ねつつ、目的達成に向けて折り合いをつけて指示を明確化することが可能になります。人間とコンピュータがやりとりするためのインタフェース技術として、自然言語の理解は今後、多くの場面での活用が期待されます。

冊子版バックナンバー

PDFダウンロード