図書
ImageImageImage

Pythonで学ぶ強化学習 : 入門から実践まで 改訂第2版 (機械学習スタートアップシリーズ)

Icons representing 図書
The cover of this title could differ from library to library. Link to Help Page

Pythonで学ぶ強化学習 = Reinforcement Learning by Python : 入門から実践まで

改訂第2版

(機械学習スタートアップシリーズ)

Call No. (NDL)
M159-M194
Bibliographic ID of National Diet Library
029951878
Material type
図書
Author
久保隆宏 著
Publisher
講談社
Publication date
2019.9
Material Format
Paper
Capacity, size, etc.
297p ; 21cm
NDC
007.13
View All

Detailed bibliographic record

Summary, etc.:

「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。(Provided by: 出版情報登録センター(JPRO))

Author introduction:

久保 隆宏 TIS株式会社戦略技術センター所属。Twitter:@icoxfog417。 現在は、「人のための要約」を目指し、少ない学習データによる要約の作成・図表化に取り組む。また、論文のまとめを共有するarXivTimesの運営、『直感 Deep Learning』オライリージャパン(2018)...

Search by Bookstore

Table of Contents

  • Day1 強化学習の位置づけを知る  強化学習とさまざまなキーワードの関係  強化学習のメリット・デメリット  強化学習における問題設定:Markov Decision Process  Day2 強化学習の解法(1): 環境から計画を立てる  価値の定義と算出: Bellman Equation  動的計画法による状態評価の学習: Value Iteration  動的計画法による戦略の学習: Policy Iteration  モデルベースとモデルフリーとの違い Day3 強化学習の解法(2): 経験から計画を立てる  経験の蓄積と活用のバランス: Epsilon-Greedy法  計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference  経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs Policyベース Day4 強化学習に対するニューラルネットワークの適用  強化学習にニューラルネットワークを適用する  価値評価を、パラメーターを持った関数で実装する:Value Function Approximation  価値評価に深層学習を適用する:Deep Q-Network  戦略を、パラメーターを持った関数で実装する:Policy Gradient  戦略に深層学習を適用する:Advantage Actor Critic (A2C)  価値評価か、戦略か Day5 強化学習の弱点  サンプル効率が悪い  局所最適な行動に陥る、過学習をすることが多い  再現性が低い  弱点を前提とした対応策 Day6 強化学習の弱点を克服するための手法  サンプル効率の悪さへの対応: モデルベースとの併用/表現学習  再現性の低さへの対応: 進化戦略  局所最適な行動/過学習への対応: 模倣学習/逆強化学習 Day7 強化学習の活用領域  行動の最適化  学習の最適化

Holdings of Libraries in Japan

This page shows libraries in Japan other than the National Diet Library that hold the material.

Please contact your local library for information on how to use materials or whether it is possible to request materials from the holding libraries.

Northern Japan

Kanto

Kinki

  • 農林水産関係試験研究機関総合目録

    Search Service
    Paper
    You can check the holdings of institutions and databases with which 農林水産関係試験研究機関総合目録 is linked at the site of 農林水産関係試験研究機関総合目録.
  • CiNii Research

    Search Service
    Paper
    You can check the holdings of institutions and databases with which CiNii Research is linked at the site of CiNii Research.

Search by Bookstore

Publication bibliographic database Books Find a bookstore where you can purchase books from

Books is a database of the publishing industry with information provided by publishers. You can search for currently available paperbacks and eBooks.

Bibliographic Record

You can check the details of this material, its authority (keywords that refer to materials on the same subject, author's name, etc.), etc.

Paper Recording Media Digital

Material Type
図書
ISBN
978-4-06-517251-3
Title Transcription
パイソン デ マナブ キョウカ ガクシュウ
Author/Editor
久保隆宏 著
Edition
改訂第2版
Author Heading
久保, 隆宏 クボ, タカヒロ ( 001300203 )Authorities
Publication, Distribution, etc.
Publication Date
2019.9