本文に飛ぶ

状態価値と状態の観測回数に基づく知識の選別による強化学習エージェントの学習高速化 (特集 知能メカトロニクス分野と連携する知覚情報技術)

記事を表すアイコン

状態価値と状態の観測回数に基づく知識の選別による強化学習エージェントの学習高速化(特集 知能メカトロニクス分野と連携する知覚情報技術)

国立国会図書館請求記号
Z16-795
国立国会図書館書誌ID
034358736
資料種別
記事
著者
小谷 直樹
出版者
東京 : 電気学会
出版年
2025-09
資料形態
掲載誌名
電気学会論文誌. C, 電子・情報・システム部門誌 = IEEJ transactions on electronics, information and systems 145(9):2025.9
掲載ページ
p.795-800
すべて見る

全国の図書館の所蔵

国立国会図書館以外の全国の図書館の所蔵状況を表示します。

所蔵のある図書館から取寄せることが可能かなど、資料の利用方法は、ご自身が利用されるお近くの図書館へご相談ください

その他

書誌情報

この資料の詳細や典拠(同じ主題の資料を指すキーワード、著者名)等を確認できます。

デジタル

資料種別
記事
著者・編者
小谷 直樹
著者標目
並列タイトル等
Learning Acceleration Method for Reinforcement Learning Agents by Knowledge Selection Based on the State Value and the Number of State Observation
タイトル(掲載誌)
電気学会論文誌. C, 電子・情報・システム部門誌 = IEEJ transactions on electronics, information and systems
巻号年月日等(掲載誌)
145(9):2025.9
掲載巻
145
掲載号
9