検索結果 405 件
紙デジタル図書
国立国会図書館全国の図書館
- 目次・記事...トレードオフ モデルフリー型の強化学習 モデルベース型の強化学習 関数近似を用いた強化学習 部分観測マルコフ決定過程 最......トレードオフ モデルフリー型の強化学習 モデルベース型の強化学習 関数近似を用いた強化学習 部分観測マルコフ決定過程 最近の話題
- 要約等強化学習で必要になる数理を広くカバーした。一貫したていねいな解説なの...
- 内容細目第1章 準備 1.1 強化学習とは 1.2 マルコフ決定過程......デル 第4章 モデルフリー型の強化学習 4.1 データにもとづく意思......ク法 第5章 モデルベース型の強化学習 5.1 問題設定の整理 5.......4 オンラインのモデルベース型強化学習 第6章 関数近似を用いた強化学習 6.1 概要 6.2 価値関......8章 最近の話題 8.1 分布強化学習 8.2 深層強化学習 付録A 補足 A.1 証明 A.2 ノルム A.3 線形計...
紙デジタル図書
国立国会図書館全国の図書館
- 目次・記事第1章 Pythonで強化学習を行うための環境構築 第2章 Pythonの基礎 第3章 強化学習の概要 第4章 マルコフ決定過......学習 第1章 Python で強化学習を行うための環境構築 1.1 オンラインサービスを利用する方...
- 要約等強化学習における基本的な考え方や計算手......扱う。 Pythonの基礎から強化学習の利用までを詳細に解説した充実の一冊。
紙図書
国立国会図書館全国の図書館
- 目次・記事強化学習の基礎/オフライン強化学習と資源割当問題への応用/リスク考慮型強化学習と金融への応用/安全性制約考慮型強化学習と制御系への応用
- 要約等本書は,強化学習の標準的な定式化と実問題との橋渡しとなるような定式化を体系的...
- 典拠情報(件名/「を見よ」参照)マシンラーニング 強化学習 Machine learning
紙図書
国立国会図書館全国の図書館
- 目次・記事第1章 強化学習と転移学習 第2章 強化学習の理論 第3章 強化学習のシミュレーション 第4章 転......の実装上の注意点 第7章 転移強化学習の応用 第8章 完全な自立的転移強化学習に向けて
- 要約等強化学習、転移学習の理論の初歩から丁寧に解説。Pythonでシミュレ...
- 典拠情報(件名/「を見よ」参照)マシンラーニング プログラミング (電子計算機) 強化学習 Machine learning コンピュータプログラミン...
紙図書
国立国会図書館全国の図書館
- 目次・記事...ゲーム、汎用ビデオゲーム、深層強化学習、RTS ## 1.1 ボード......ri-57 ## 1.3 深層強化学習とゲーム環境 Malmo、Op......層学習、RNN、自然言語処理、強化学習 ## 2.1 深層学習の基礎......処理の基礎知識 ## 2.4 強化学習の基礎知識 ## 2.5 まとめ # 3章 囲碁を学ぶAI ...
- 要約等...AI」をテーマとし、おもに深層強化学習の技術を取り上げます。深層強化学習は、いまの世の中で広く使われて......の領域に応用した技術です。深層強化学習には高性能なシミュレータが必要であり、ゲームをはじめとした架...
紙図書
国立国会図書館全国の図書館
- 目次・記事第1章 強化学習とは 1 – 1 強化学習の目的 1 – 2 解決すべ......収益の予測 参考文献 第2章 強化学習の基本的な問題設定 2 – 1......の改良例 第5章 モデルベース強化学習 5 – 1 世界モデルの学......グの改良例 5 – 3 残差強化学習 第6章 報酬設計の課題と対策...... 6 – 2 – 1 セーフ強化学習 6 – 2 – 2 多目的強化学習 6 – 2 – 3 階層強化学習 6 – 3 エキスパートの......期化 6 – 3 – 2 逆強化学習 6 – 4 学習難易度の調...... – 1 マルチエージェント強化学習 7 – 2 確率推論としての強化学習 7 – 3 生物の意思決定モデル 索引 著者紹介 "
- 典拠情報(件名/「を見よ」参照)マシンラーニング 強化学習 Machine learning
紙デジタル図書
国立国会図書館全国の図書館
- 目次・記事第1章 はじめに 第2章 機械学習と深層学習 第3章 強化学習の基礎 第4章 価値ベース手法による深層強化学習 第5章 方策勾配法による深層強化学習 第6章 モデルベース手法による深層強化学習 第7章 汎化性 第8章 オン......問題に特有の課題 第9章 深層強化学習のベンチマーク 第10章 MDPを超える深層強化学習 第11章 深層強化学習の展望 第12章 結論 付録:深層強化学習のフレームワーク 第1章 はじめに 1.1 なぜ強化学習? 1.2 本書の概要 第2章.......3 深層学習の手法 第3章 強化学習の基礎 3.1 形式的な枠組み......4章 価値ベース手法による深層強化学習 4.1 Q学習 4.2 当て...... 第5章 方策勾配法による深層強化学習 5.1 確率的方策勾配 5.......章 モデルベース手法による深層強化学習 6.1 純粋モデルベース法 ...... 経験再生の管理 第9章 深層強化学習のベンチマーク 9.1 ベンチマークの環境 9.2 深層強化学習ベンチマークにおけるベストプラクティス 9.3 深層強化学習のオープンソースソフトウェア 第10章 MDPを超える深層強化学習 10.1 部分観測性と関連す......ェントシステム 第11章 深層強化学習の展望 11.1 深層強化学習の成功 11.2 深層強化学習を実世界問題に適用する際の課題 11.3 深層強化学習と神経科学の関係 第12章 結論 12.1 深層強化学習の将...
紙図書
国立国会図書館全国の図書館
- 目次・記事1章 強化学習の位置づけ 2章 Python......築 3章 教師あり学習 4章 強化学習の問題設定 5章 基本のQ学習:tableQ 6章 ニューラ...
- 要約等本書は、基本のアルゴリズムからニューラルネットを使った応用まで、強化学習の理論と実装がわかる本です。
- 著者紹介...析に従事。動物の行動と脳活動を強化学習モデルで説明する研究を行う。現在は、民間企業にて機械学習やコ...