府大,画像認識で世界一の精度を達成

大阪府立大学は新たに開発したニューラルネットワークによって,世界一の認識精度を達成した(ニュースリリース)。

一般物体認識とは,「飛行機」や「自動車」,「鳥」,「猫」などの多様な物体を認識(分類)するタスク(処理の実行単位)のこと。近年は,深層学習(ディープラーニング)で注目されているニューラルネットワークを用いた手法が主流となっており,主なものだけで過去約2年間に11回も記録が塗り替えられている。

最近では,この一般物体認識手法を「画像からの物体切り出し」や「画像の領域分割」など、画像に関連する様々なタスクの「エンジン」として使うことが増えている。これらのタスクでは,手法に用いる「エンジン」を性能の良いものに置き換えるだけで,手法を高性能にできることが知られている。

そのため,認識性能の高い一般物体認識手法の提案は,一般物体認識のタスクに限らず,画像に関連する様々なタスクへの大きな波及効果が期待できる。

前回,同大が2016年12月に提案して世界一の認識精度を達成した手法は,2017年5月にXavier氏が提案した手法によって,その座をいったん奪われた。Xavier氏の研究は,「学習を適度に妨害する」ことによって,より高い性能を実現できることを示した興味深いものだったが,比較的浅いネットワークでしか用いることができないという欠点もあった。

最近提案された一般物体認識手法は,深い構造を持つネットワーク(Deep)と広い構造を持つネットワーク(Wide)に大別できる。これらを比較すると,深い構造を持つネットワークの方が,メモリ使用量に直結するネットワークのパラメータ数が比較的小さくて済む上に認識性能が高いという有利な結果が出ていた。しかし、Xavier氏の手法は広い構造を持つネットワークにしか適用できなかった。

そこで研究グループは,Xavier氏が提案した「学習を適度に妨害する」学習法を,深い構造を持つネットワークに適用できる形で実現した。また,その過程で,学習が安定する工夫も導入した。これを前回の研究グループの方法に適用することで,再び世界一の認識精度を達成した。従来世界一だった手法と比べ,その認識率の差は約3%上回り,88%の認識精度を誇る結果となった。

その他関連ニュース

  • 立教大,フーリエ変換を使った画像認識手法を開発 2024年02月06日
  • エビデント,顕微鏡用デジタルカメラを発売 2024年01月24日
  • リコー,車両塗装外観検査装置を発売 2023年12月20日
  • NIIら,眼底画像から性別を推定するAIを開発 2023年12月07日
  • 産総研,画像領域分割AIの低コスト自動学習に成功 2023年10月03日
  • 金沢大ら,光AIを用いたイメージ処理技術を開発 2023年09月20日
  • TISS,多機能画像人感センサーを発売 2023年09月13日
  • 工学院大,ホワイトニングを確認できるアプリを作成 2023年07月24日