このほど、本学部の幾何学計算とスマートメディア技術研究チームが、コンピューター ビジョン分野のトップ カンファレンスで革新的な成果を達成した。CVPR2023カンファレンスで論文が受理され、参加チームがCVPR 2023ワークショップモバイルインテリジェント撮影及びイメージングコンペティション(MIPI)で優勝した。
本学部の王祎准教授、樊鑫教授とRuiliWang(ニュージーランドのマッセイ大学)、何祥健(寧波ノッティンガム大学)らが共著した論文「Pixels,Regions,and Objects:Multiple Enhancement for Salient Object Detection」は、画像の画素、領域、オブジェクトの視点から複雑なターゲットに対する認知を繰り返していく人間の能力をシミュレーションするための斬新な多重拡張ネットワーク(MEnet)を提案し、既存のほとんどの顕著なターゲット検出(SOD)方法が、ピクセルの視点から画像を解釈し、簡単なエンドツーエンドのトレーニング方法を使用していて、複雑なシーンにおいてターゲットの境界が不完全でぼやけしまうという問題があったが、それを解決した。
本学部の博士課程の劉宇チン氏と賈棋助教授は中国科学院自動化所、会社シャオミーと連携したチームに参加し、そのチームはCVPR 2023 Workshopモバイルインテリジェント撮影及びイメージングコンペティション(MIPI)で、「RGBWデータ連携重モザイク(Remosaic)、ノイズ除去」と「RGBWデータ連携フュージョン(Fusion)、ノイズ除去」の2つの部門で優勝した。
図1.RGBWデータ連携重モザイク、ノイズ除去スキーム
図2.RGBW連携フュージョン、ノイズ除去スキーム
CVPRはコンピュータビジョン分野でのトップカンファレンスだという。グーグル2022学術影響力ランキングでは、CVPRは総合ランキング4位(Nature1位、NEJM2位、Science3位)、H 5-index:389では、コンピュータサイエンスのすべてのジャーナル/カンファレンスで1位にランクされている。今回のCVPRの有効投稿は9155件あり、収録は2360件で、採択率は25.78%だった。