人間の知的活動を支援する

言語インタフェース技術

相澤 彰子

コンテンツ科学研究系

副所長

研究分野

自然言語処理

情報検索

知識処理

研究背景・目的

 言語は人間の知的な活動の基盤であり、コンピュータによる言語処理は、知能システムを実現するうえで欠かせない構成要素となっています。言語処理により人間の情報収集・発信や意思決定を支援するためには、単にコンピュータでテキストの意味を解析するだけではなく、テキストの読み手・書き手である人間が、どのように言語を処理しているかを想定して、システムを設計する必要があります。本研究では、コーパス分析、タスク設計、機械学習モデルの構築などを用いて、コンピュータによるテキストの意味解析と人の言語活動のモデル化、および両者をつなぐ手法の開発に取り組んでいます。

研究内容

 最近のトピックとして、人間とコンピュータが言語テキストを介して情報をやりとりするための対話システムの研究を紹介します。対話者同士が共通の理解モデルを構築する「基盤化」の仕組みを解明するために、対話タスクの設計、データ収集、言語アノテーションに取り組んでいます。また、対話システムのための視覚言語融合モデル(図)や、対話中のニュアンス表現や時間表現の理解モジュールの構築などに取り組み、人間の質問に答えたり、人間と対話してタスクを遂行したりするシステムの実現をめざしています。さらに、対話システムの開発を効率的に行うため、対話システムの目的に応じてカスタマイズ可能な応答文の自動評価手法の研究なども行っています。

図)視覚特徴と言語表現の対応付け(対話によるオブジェクト選択タスク)

産業応用の可能性

 人間とコンピュータがやりとりするためのインタフェース技術は、今後、多くの場面での活用が期待されます。他のトピックとして、大量の文書を解析してユーザの質問に答える質問応答、文書のレイアウトや論理構造の解析、テキストの意味解析や知識獲得、文生成と評価などの研究開発にも取り組んでいます。また論文を中心とする文書解析については、PDF解析、知識グラフ構築、情報推薦まで、多くの実践的なスキルを有します。さらに、タスク設計におけるバイアスの問題、アノテーションの確信度のモデル化、出力結果の説明性など、AI信頼性にかかわる研究も行っています。

冊子版バックナンバー

PDFダウンロード