研究背景・目的
私たちは日本手話の豊かさを知るために、2011年から日本のいろいろな地域を訪れ、地域ごとの手話表現を集めてきました。このデータは言語コーパスと呼ばれるものです。言語コーパスとは一つ一つの言葉や表現に言語情報やコミュニケーションに関する情報を付与したものを指します。日本手話を対象にここまで精緻な情報を付けた言語コーパスは他に例を見ません。近年の映像や画像を対象にした深層学習にも用いることができるデータであることが証明され、言語学のみならず、人間のことばを理解する人工知能研究に役立てることができると考えています。
研究内容
『発話単位』という手話言語コーパスを整理する際の基本単位の提案を進めています。発話単位とは、おしゃべりの順番のようなもので、対話を進めている人々にとっては無意識的に判断できるものです。しかしながら、科学的にそれを定義しようとすると、文法要素、相互行為要素、非手指動作など、さまざまな要素に目を向けなければいけません。手話を生活言語とするろう者の協力を得て、私たちが収録したデータのアノテーション作業を進めています。また、自然言語処理研究者と協力し、各手話単語の品詞アノテーションを実施し、それらの単語の係り受け構造の理解を試みています。
産業応用の可能性
手話認識、手話合成といったシステムを構築する際、我々の手話言語コーパスを学習データとして利用できる可能性があります。手話言語の本当の姿を理解し、言語情報を付与することが実現できている言語コーパスを利用することで、手話認識や手話合成といったシステム構築を飛躍的に進展させることができるでしょう。