研究背景・目的
近年、情報学やその関連研究分野では、テキスト、音声、画像、映像、センサーデータなどのインターネットを通じて集積された大規模なリアルデータが、必須の研究資源となっています。しかし、多くの場合は大学等の研究者が個別にこのようなデータを取得することは困難であり、これが研究の深化や拡大の障害となっています。一方、民間企業等では、業務の中で生成された大量のデータを十分に活用できていないという課題があります。そこでNIIのデータセット共同利用研究開発センターでは、このような民間企業等と研究者の間を橋渡しして、データセットの共同利用を推進することによりこれらの問題を解消するとともに、データを核とした産学連携の自律的発展を可能とするエコシステムの構築をめざしています(図)。
研究内容
大規模リアルデータには著作権や個人情報保護等に加えて、企業の経営的な観点からの制約もあります。そこで本センターの「情報学研究データリポジトリ」(IDR)事業では、データ保有者が安心して研究者にデータを提供できるよう、研究利用上のルールや利用契約、利用者管理などの共同利用の枠組みを整備するとともに、運用上もデータ提供者と利用者を仲介する窓口機能を果たしています。
また、データ提供者と利用者の双方がメリットを感じられるよう、データへのDOIの付与や研究成果の収集とフィードバックのためのシステム整備などを行うとともに、関係者が一堂に会するIDRユーザーフォーラムを毎年開催し、リアルな課題や研究成果などを共有する場を設けるといった、コミュニティの形成と発展のための活動を行っています(写真)。
産業応用の可能性
民間企業が保有しているデータを提供いただき、学術界で広く研究に利用してもらうことで、自社内では気づかなかったデータの活用や新たな技術開発に加えて、社会貢献や人材養成なども期待できます。また、IDRユーザーフォーラムでの企業セッションへの参加やイベントの企画、評価型ワークショップNTCIRのタスク提案・運営など、研究コミュニティの中に自ら参画することもできます。IDRでは今後さらに、データ提供者と利用者による共同研究のためのマッチングの場を提供するなど、産学連携に根ざした共同利用の深化に取り組んでいきます。