機械学習の過程や結果を見える化し

安全性分析や開発プロセスに生かす

吉岡 信和

アーキテクチャ科学研究系

准教授

研究分野

ソフトウェア科学

機械学習工学

セキュリティソフトウェア工学

研究背景・目的

 IoTやセンサーの発展によるビッグデータの広がりと、深層学習をはじめとする機械学習技術の発展、ライブラリーの整備により、今やさまざまな製品・サービスに機械学習があたり前のように使われるようになっています。しかし、機械学習は、データから自動的に最適な振る舞いを見つけ出すため、システムがどのような振る舞いになるか開発者は予想できないため、その品質を保証することやどこまでシステムの要求として設定してよいかがわからないという機械学習特有の課題が生じます。特に深層学習は、自動的に入力データの特徴を把握し、推論するため、開発者は機械がどのような特徴を捉えているのかがわからず、その処理はブラックボックスであると言われてきました。さらに、学習した推論の精度は、通常全体平均しか測定できておらず、特定の状況による推論の間違いが大きな事故につながる可能性があっても、その状況の精度のみ高くするなど細かな精度の調整ができませんでした。加えて、特定の状況でうまく学習できても、それをほかの状況に活用するのが難しく、効率の良い学習のさせかたをチームや組織を超えて再利用させることが困難でした。

研究内容

 この研究では、ブラックボックスであった深層学習をはじめとする機械学習の学習結果やその学習過程を「見える化」して、機械学習を含むシステム(機械学習応用システム)全体の振る舞いの安全性を分析したり、適切な要求を開発/運用プロセスを通して抽出したりする方法を提案しています。これにより、これまで難しかった機械学習応用システムのテストや検証に生かすとともに、学習プロセスや結果のノウハウや知識を継承できるようにします。この研究開発は、高信頼な機械学習応用システムの実現するプロジェクト(QAML: Quality assurance of Machine Learning-based Systems)を中心に産学で連携して推進しています(図)。

図)QAMLプロジェクトの概要

産業応用の可能性

 今や機械学習は、ツールやフレームワークが整備され、さまざまな製品、サービスに組み込まれています。機械学習応用システムを製品やサービスとしてリリースしてメンテナンスしていくには、その要求を適切に抽出し、それに合わせて品質を担保するのが、機械学習の産業応用の緊急の課題となっています。特に自動運転や医療、金融など人の生命や社会インフラに支えるソフトウェアに機械学習を活用することが求められており、その品質保証技術は重要な役割を持っています。

冊子版バックナンバー

PDFダウンロード