【最新動向サーベイ】「イマドキノロボット基盤モデル」大規模言語モデルや視覚言語モデルなどの基盤モデルの発展に伴って、ロボティクスにおいても認識や制御の部分で基盤モデルを活用する事例、また、ロボティクス領域での基盤モデルを構築しようとする事例が見られるようになってきた。本稿では、ロボティクス領域での基盤モデル、すなわち、ロボット基盤モデルを構築することを目的とした研究事例を中心に紹介する。/「イマドキノCV for Earth」環境問題の解決に向けて、画像認識技術がどのように利用されているのか、生物多様性と動物保護、森林保護、廃棄物・汚染管理、持続可能な農業と食糧生産の4つの分野に焦点を当てて紹介。それぞれの分野において研究者たちがどのように課題と向き合い、データをとり、手法を適用していったのかを解説する。/「イマドキノ音声合成」ニューラルネットワークを用いた大規模言語モデルの進展に伴い、音声の離散表現に基づくテキスト音声合成(TTS)手法が数多く提案されている。これらの手法は、単に高品質なTTS を実現するだけでなく、数秒から数分の限られた音声から、モデルの再学習を必要とせずにその声質や話し方を忠実に再現するゼロショットTTS を可能にしている。本稿では、これまでのTTS 手法の変遷について紹介し、近年提案されている言語モデルに基づくTTS の研究動向の解説をする。/「イマドキノマルチエージェント経路計画」グラフ上の複数エージェントに対し、互いに衝突のない経路を計算する問題はマルチエージェント経路計画(MAPF)と呼ばれ、多数の魅力的な応用がある。人工知能・ロボティクス分野で大きな注目を集めているMAPF 研究について、その経緯と最新の動向を紹介する。
【チュートリアル】「ニュウモン実世界情報と基盤モデル」Vision and Language 技術の進展により、画像認識とテキスト理解の双方が求められる画期的な手法やデータセットが開発され、これまでの画像とテキストの理解を超えて、画像、3D、そしてロボティクスを言語モダリティと結合する機運が高まっている。本稿では、大規模言語モデルや視覚言語モデルについて、その性質や課題を参照表現理解などの視点から解説し、3D 理解や実世界理解、ロボット基盤モデルなどのより複雑なモダリティの理解およびインタラクションの研究へのアプローチについて議論する。
そのほか、国内外から注目を集めているSakana AIのインタビュー記事や、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」、漫画「電脳探偵メタデンコ」を掲載。
※この電子書籍は固定レイアウト型で配信されております。固定レイアウト型は文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
深層強化学習は、強化学習と深層学習の組み合わせである。この研究分野の発展により、従来機械で扱う範疇ではなかった広範囲の複雑な意思決定問題を解けるようになってきた。深層強化学習はヘルスケア、ロボティクス、スマートグリッド、金融工学、その他さまざまな領域において、新たな応用の可能性を切り拓きつつある。本書は、そのような深層強化学習に関し、強化学習の基礎から始まり、深層強化学習の主要なアルゴリズムや最先端の話題まで、豊富な参考文献も含めて幅広く網羅している。特に本書は、汎化性を向上させるノウハウや深層強化学習が実応用でどのように使われるかという観点に着目して執筆されている。
機械学習の基礎知識を有する大学生・大学院生や企業の研究者・技術者が、深層強化学習の概要を効率的に勉強したいと思ったときの最初の一冊として推薦できる構成となっている。
原著:An Introduction to Deep Reinforcement Learning、 2019