2017年10月23日

府大，画像認識で世界一の精度を達成

大阪府立大学は新たに開発したニューラルネットワークによって，世界一の認識精度を達成した（ニュースリリース）。

一般物体認識とは，「飛行機」や「自動車」，「鳥」，「猫」などの多様な物体を認識（分類）するタスク（処理の実行単位）のこと。近年は，深層学習（ディープラーニング）で注目されているニューラルネットワークを用いた手法が主流となっており，主なものだけで過去約2年間に11回も記録が塗り替えられている。

最近では，この一般物体認識手法を「画像からの物体切り出し」や「画像の領域分割」など、画像に関連する様々なタスクの「エンジン」として使うことが増えている。これらのタスクでは，手法に用いる「エンジン」を性能の良いものに置き換えるだけで，手法を高性能にできることが知られている。

そのため，認識性能の高い一般物体認識手法の提案は，一般物体認識のタスクに限らず，画像に関連する様々なタスクへの大きな波及効果が期待できる。

前回，同大が2016年12月に提案して世界一の認識精度を達成した手法は，2017年5月にXavier氏が提案した手法によって，その座をいったん奪われた。Xavier氏の研究は，「学習を適度に妨害する」ことによって，より高い性能を実現できることを示した興味深いものだったが，比較的浅いネットワークでしか用いることができないという欠点もあった。

最近提案された一般物体認識手法は，深い構造を持つネットワーク（Deep）と広い構造を持つネットワーク（Wide）に大別できる。これらを比較すると，深い構造を持つネットワークの方が，メモリ使用量に直結するネットワークのパラメータ数が比較的小さくて済む上に認識性能が高いという有利な結果が出ていた。しかし、Xavier氏の手法は広い構造を持つネットワークにしか適用できなかった。

そこで研究グループは，Xavier氏が提案した「学習を適度に妨害する」学習法を，深い構造を持つネットワークに適用できる形で実現した。また，その過程で，学習が安定する工夫も導入した。これを前回の研究グループの方法に適用することで，再び世界一の認識精度を達成した。従来世界一だった手法と比べ，その認識率の差は約3%上回り，88%の認識精度を誇る結果となった。

キーワード：

記事一覧

【解説】NEDOが示した12の重点領域、光・レーザーの研究プロジェクトの行方は

新エネルギー・産業技術総合開発機構（NEDO）が6月1日に発表した「Innovation Outlook Ver. 1.0増補版」は、日本の産業技術が目指すべき新たな羅針盤となる報告書である（ニュースリリース）。今回の増…
2026.06.03
愛媛大，視野検査AIで検査時間短縮と高精度化を実現

愛媛大学の研究グループは，視野検査を制御する視野検査AIのViFT（Visual Field Transformer）を深層強化学習するフレームワークの構築を行ない，ViFTは従来の手法と比較して半分以下の時間で同等以上…
2025.09.25
NTT，微小な振動子間の同期を光でリアルタイム制御

日本電信電話（NTT）は，メガヘルツ帯の機械振動をレーザー光により自在に励起・制御できるオプトメカニカル素子を用いて複数の同期状態の生成に成功し，それらの間を瞬時に遷移させる技術を実証した（ニュースリリース）。独立な2…
2025.09.22
OIST，画像認識に量子計算プロトコルを初めて応用

沖縄科学技術大学院大学（OIST）の研究グループは，法医学から医療診断まで，多くの分野において重要な画像認識にボソンサンプリングを初めて実用的な応用例を発表した（ニュースリリース）。過去10年間以上にわたり，研究者たち…
- ニュース
- 研究開発
2025.06.27
NTT，情報と人間にかかわる最新技術について紹介

日本電信電話（NTT）のコミュニケーション科学基礎研究所は，最新のR&D関連の取り組みを紹介する技術イベントを5月21日～5月22日かけ，大阪にあるNTT西日本の本社ビルで開催する。これに先立つ5月13日，イベン…
2025.05.19