- Amazon.co.jp ・本 (320ページ)
- / ISBN・EAN: 9784627880313
作品紹介・あらすじ
◆強化学習は「ポストビッグデータ」の技術である!
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり,「足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.
◆強化学習の「いま」を知り,「これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説.
・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.
――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!
感想・レビュー・書評
-
[編著]
グーグル株式会社 博(理) 牧野 貴樹
筑波大学助教 博(工) 澁谷 長史
横浜国立大学講師 博(工) 白川 真一
[著者]
大阪大学教授 工博 浅田 稔
産業技術総合研究所 麻生 英樹
千葉大学教授 博士(工学) 荒井 幸代
京都工芸繊維大学准教授 博(工) 飯間 等
沖縄科学技術大学院大学 博(情報科学) 伊藤 真
広島大学教授 博(工) 大倉 和博
京都工芸繊維大学教授 学術博士 黒江 康明
情報通信研究機構 博(工) 杉本 徳和
日本IBM東京基礎研究所 博(工) 坪井 祐太
沖縄科学技術大学院大学教授 博(工) 銅谷 賢治
株式会社Preferred Networks 博(理) 前田新一
中部大学准教授 博(工) 松井 藤五郎
電気通信大学教授 工博 南 泰浩
独立行政法人大学改革支援・学位授与機構准教授 博(工) 宮崎 和光
NTTコミュニケーション科学基礎研究所 目黒 豊美
日本IBM東京基礎研究所 博(工) 森村 哲郎
ATR脳情報研究所 博(工) 森本 淳
富山大学准教授 博(工) 保田俊行
奈良先端科学技術大学院大学准教授 博(工) 吉本 潤一郎
定価:¥ 4,620
ページ:320
判型菊
ISBN:978-4-627-88031-3
発行年月:2016.10
◆強化学習は「ポストビッグデータ」の技術である!
人工知能,金融工学,ロボット制御,言語処理,生産現場やサービスの最適化,あらゆる分野に応用が広がる強化学習.十分なデータが与えられることが前提とされる他の機械学習法と異なり,「足りないデータを集めながら最適化すること」に力点を置く強化学習は,ビッグデータの先を行くための重要な技術となることが期待されます.
◆強化学習の「いま」を知り,「これから」を切り拓くための1冊.
本書では,この分野を代表する執筆陣が集い,強化学習の基礎・発展・応用を多面的に解説します.
・基礎:強化学習の動作原理と基本アルゴリズムを,初学者でも分かるように導入.
・発展:より複雑な問題に対処し,高度な研究に進むための,さまざまな発展的手法を解説.
・応用:マルチロボットシステムの制御,対話処理,医療データ分析,囲碁の対局など広範な応用例・研究事例を通して,強化学習の活用法を紹介.人間の行動や脳の動作を説明するモデルとしての理論・実験も解説.
――強化学習の基礎を学びたい方,発展的手法に触れたい方,応用可能性を一望したい方に最適な1冊!
https://www.morikita.co.jp/books/mid/088031
【簡易目次】
はじめに [i-ii]
目次 [iii]
執筆者一覧 [iv]
第1章 強化学習の基礎的理論
1.1 強化学習とは 002
1.2 強化学習の構成要素 014
1.3 価値反復に基づくアルゴリズム 029
1.4 方策勾配に基づくアルゴリズム 042
1.5 部分観測マルコフ決定過程と強化学習 056
第2章 強化学習の発展的理論
2.1 統計学習の観点から見たTD学習 072
2.2 強化学習アルゴリズムの理論性能解析とベイズ統計による強化学習のモデル化 112
2.3 逆強化学習(Inverse Reinforcement Learning)[荒井幸代] 127
2.4 試行錯誤回数の低減を指向した手法:経験強化型学習XoL 136
2.5 群強化学習法 148
2.6 リスク考慮型強化学習 165
2.7 複利型強化学習 177
第3章 強化学習の工学応用
3.1 高次元・実環境における強化学習 190
3.2 連続的な状態・行動空間への拡張:マルチロボットシステムへの適用 199
3.3 対話処理における強化学習 214
3.4 マルチエージェント系の報酬設計 225
3.5 自然言語処理における逆強化学習・模倣学習の適用 237
3.6 医療臨床データ分析への応用 249
3.7 深層学習を用いたQ関数の学習:Atariと囲碁への応用 257
第4章 知能のモデルとしての強化学習
4.1 脳の意思決定機構と強化学習 284
4.2 内発的動機付けによるエージェントの学習と発達 295
おわりに(編者) [309-310]
索引 [311-313]詳細をみるコメント0件をすべて表示 -
プログラムをのせるより、論文みたい
-
前の本(速習の方)が難易度高かったのでもう一冊読んでみたらこっちも大変だった。解説も記載の幅も広く良著。ただ自分の力足らず。半分くらい理解。実用の中で適宜読み直そう。
-
請求記号 007.1/Ma 35