並列タイトル等Development of 1-chip CNN real-time processor for semantic segmentation, distance estimation, and motion estimation
タイトル(掲載誌)令和2(2020)年度 科学研究費補助金 基盤研究(C) 研究成果報告書 = 2020 Fiscal Year Final Research Report
一般注記金沢大学理工研究域電子情報通信学系
画像から周囲環境を認識するために物体輪郭推定と距離(視差)推定を同時に行う畳み込みニューラルネット(CNN)を考案し、FPGA(Field Programmable Gate Array; 手元で書き換え可能な集積回路)に実装した。輪郭検出を、従来の輪郭・非輪郭の二値分類ではなく、物体境界からの距離を推定する回帰問題へ帰着させ、視差推定とのマルチタスク学習を可能とした。そして二つの推定を同時に行う全重み共有のCNNを考案した。これを3ビットまで量子化したが、精度低下は僅かであった。FPGA実装の結果、250 MHzで動作し、480×320画素の画像に対するスループットは134 fpsであった。
We devised a convolutional neural network (CNN) that simultaneously estimates the contour of an object and the distance (parallax) in order to recognize the surrounding environment from an image, and implemented it on an FPGA (Field Programmable Gate Array). Contour detection is transformed to a regression problem that estimates the distance from the object boundary instead of the conventional binary classification of contour and non-contour, enabling multitask learning with parallax estimation. Then, we devised a CNN with full weight sharing that performs two estimations at the same time. This was quantized to 3 bits, but the decrease in accuracy was slight. As a result of FPGA implementation, it operates at 250 MHz and has a throughput of 134 fps for an image of 480 x 320 pixels.
研究課題/領域番号:18K11350, 研究期間(年度):2018-04-01 – 2021-03-31
出典:「SLAM用意味分割・距離推定・動き推定の実時間同時処理1チップCNN回路開発」研究成果報告書 課題番号18K11350(KAKEN:科学研究費助成事業データベース(国立情報学研究所)) (https://kaken.nii.ac.jp/report/KAKENHI-PROJECT-18K11350/18K11350seika/)を加工して作成
一次資料へのリンクURLhttps://kanazawa-u.repo.nii.ac.jp/?action=repository_action_common_download&item_id=52063&item_no=1&attribute_id=26&file_no=1
関連情報https://kaken.nii.ac.jp/search/?qm=30324106
https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-18K11350/
https://kaken.nii.ac.jp/report/KAKENHI-PROJECT-18K11350/18K11350seika/
連携機関・データベース国立情報学研究所 : 学術機関リポジトリデータベース(IRDB)(機関リポジトリ)