これからの強化学習

森北出版 (2016年10月27日発売)

3.54

本棚登録 : 138人

感想 : 7件

購入ストアへ

サイトに貼り付ける

本ページはアフィリエイトプログラムによる収益を得ています

Amazon.co.jp ・本 (320ページ)
/ ISBN・EAN: 9784627880313

#強化学習 #tech #IT

作品紹介・あらすじ

◆強化学習は「ポストビッグデータ」の技術である！
人工知能，金融工学，ロボット制御，言語処理，生産現場やサービスの最適化，あらゆる分野に応用が広がる強化学習．十分なデータが与えられることが前提とされる他の機械学習法と異なり，「足りないデータを集めながら最適化すること」に力点を置く強化学習は，ビッグデータの先を行くための重要な技術となることが期待されます．

◆強化学習の「いま」を知り，「これから」を切り拓くための1冊．
本書では，この分野を代表する執筆陣が集い，強化学習の基礎・発展・応用を多面的に解説します．
・基礎：強化学習の動作原理と基本アルゴリズムを，初学者でも分かるように導入．
・発展：より複雑な問題に対処し，高度な研究に進むための，さまざまな発展的手法を解説．
・応用：マルチロボットシステムの制御，対話処理，医療データ分析，囲碁の対局など広範な応用例・研究事例を通して，強化学習の活用法を紹介．人間の行動や脳の動作を説明するモデルとしての理論・実験も解説．

――強化学習の基礎を学びたい方，発展的手法に触れたい方，応用可能性を一望したい方に最適な1冊！

感想・レビュー・書評

並び替え

いいね順
新着順

表示形式

リスト
全文

表示件数

絞り込み

別府さんの感想

フォロー

2023年5月16日

［編著］
グーグル株式会社博（理）牧野貴樹
筑波大学助教博（工）澁谷長史
横浜国立大学講師博（工）白川真一
［著者］
大阪大学教授工博浅田稔
産業技術総合研究所麻生英樹
千葉大学教授博士（工学）荒井幸代
京都工芸繊維大学准教授博（工）飯間等
沖縄科学技術大学院大学博(情報科学) 伊藤真
広島大学教授博（工）大倉和博
京都工芸繊維大学教授学術博士黒江康明
情報通信研究機構博（工）杉本徳和
日本IBM東京基礎研究所博（工）坪井祐太
沖縄科学技術大学院大学教授博（工）銅谷賢治
株式会社Preferred Networks 博（理）前田新一
中部大学准教授博（工）松井藤五郎
電気通信大学教授工博南泰浩
独立行政法人大学改革支援・学位授与機構准教授博（工）宮崎和光
NTTコミュニケーション科学基礎研究所目黒豊美
日本IBM東京基礎研究所博（工）森村哲郎
ATR脳情報研究所博（工）森本淳
富山大学准教授博（工）保田俊行
奈良先端科学技術大学院大学准教授博（工）吉本潤一郎
定価：¥ 4,620
ページ：320
判型菊
ISBN：978-4-627-88031-3
発行年月：2016.10

◆強化学習は「ポストビッグデータ」の技術である！
人工知能，金融工学，ロボット制御，言語処理，生産現場やサービスの最適化，あらゆる分野に応用が広がる強化学習．十分なデータが与えられることが前提とされる他の機械学習法と異なり，「足りないデータを集めながら最適化すること」に力点を置く強化学習は，ビッグデータの先を行くための重要な技術となることが期待されます．

◆強化学習の「いま」を知り，「これから」を切り拓くための1冊．
本書では，この分野を代表する執筆陣が集い，強化学習の基礎・発展・応用を多面的に解説します．
・基礎：強化学習の動作原理と基本アルゴリズムを，初学者でも分かるように導入．
・発展：より複雑な問題に対処し，高度な研究に進むための，さまざまな発展的手法を解説．
・応用：マルチロボットシステムの制御，対話処理，医療データ分析，囲碁の対局など広範な応用例・研究事例を通して，強化学習の活用法を紹介．人間の行動や脳の動作を説明するモデルとしての理論・実験も解説．

――強化学習の基礎を学びたい方，発展的手法に触れたい方，応用可能性を一望したい方に最適な1冊！
https://www.morikita.co.jp/books/mid/088031

【簡易目次】
はじめに　[i-ii]
目次　[iii]
執筆者一覧　[iv]

第1章　強化学習の基礎的理論
1.1　強化学習とは　002
1.2　強化学習の構成要素　014
1.3　価値反復に基づくアルゴリズム　029
1.4　方策勾配に基づくアルゴリズム　042
1.5　部分観測マルコフ決定過程と強化学習　056

第2章　強化学習の発展的理論
2.1　統計学習の観点から見たTD学習　072
2.2　強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化　112
2.3　逆強化学習（Inverse Reinforcement Learning）［荒井幸代］　127
2.4　試行錯誤回数の低減を指向した手法：経験強化型学習XoL　136
2.5　群強化学習法　148
2.6　リスク考慮型強化学習　165
2.7　複利型強化学習　177

第3章　強化学習の工学応用
3.1　高次元・実環境における強化学習　　190
3.2　連続的な状態・行動空間への拡張：マルチロボットシステムへの適用　199
3.3　対話処理における強化学習　214
3.4　マルチエージェント系の報酬設計　225
3.5　自然言語処理における逆強化学習・模倣学習の適用　237
3.6　医療臨床データ分析への応用　249
3.7　深層学習を用いたQ関数の学習：Atariと囲碁への応用　257

第4章　知能のモデルとしての強化学習
4.1　脳の意思決定機構と強化学習　284
4.2　内発的動機付けによるエージェントの学習と発達　295

おわりに（編者）　[309-310]
索引　[311-313]

0

詳細をみる
コメント0件をすべて表示
bl-iirさんの感想

フォロー

2021年1月20日

https://www.morikita.co.jp/books/book/3034

0

詳細をみる
コメント0件をすべて表示
休日は読書さんの感想

フォロー

2018年10月9日

プログラムをのせるより、論文みたい

0

詳細をみる
コメント0件をすべて表示
syikootwさんの感想

フォロー

2017年12月17日

前の本(速習の方)が難易度高かったのでもう一冊読んでみたらこっちも大変だった。解説も記載の幅も広く良著。ただ自分の力足らず。半分くらい理解。実用の中で適宜読み直そう。

0

詳細をみる
コメント0件をすべて表示
fraserlibさんの感想

フォロー

2016年12月7日

請求記号　007.1/Ma 35

0

詳細をみる
コメント0件をすべて表示