作ってわかる大規模言語モデルの仕組み

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。

ChatGPTが使う大規模言語モデル（LLM）「GPT」を一から作りながら、LLMの基本から実装まで体系的に学べます！

【本書の特徴】
●Transformerの基礎からGPTモデルまで一から作りながら学べる
●「人間の意図に沿った応答」を生成するアラインメント（SFT、DPO）の仕組みを実装で学べる
●最新の推論強化モデルまでカバー

【LLMの仕組みを3段階で理解】
●図解や平易な解説で直感的に分かる
●実際に動くPyTorchコードで理解
●理論的な背景は数式で補足

Transformerモデルを作った後、GPT-2相当のLLMを実装。さらにGPT-2だけでは実現できなかった「人間の意図に沿った応答」を生成するための技術（SFT、DPO）を、実際のコードで体験します。多数のGPUを使った大規模学習をするための分散学習についてもコードを示しながら解説します。

現代の大規模言語モデルがどのように作られているのか―、その本質をこの1冊で理解できます。

作ってわかる大規模言語モデルの仕組み

詳しい情報を見る

閲覧環境