あらすじ
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
生成AIの使いはじめを、やさしくわかりやすくサポートします!
生成AIで開発する方法、生成AIを使った機能を開発する方法について、ひとつひとつ身につけることができるように解説した入門書です。
〇マンガとイラストでイメージが掴みやすい!
〇手を動かしながら学べるハンズオン
〇超えてゆけ!著者の失敗エピソード
★読者特典★
すぐに始められるサンプルコード付き
【1章】生成AIの基礎や歴史を学びます。読み物としてお楽しみください。
【2章】いよいよ実践です。アプリ開発に欠かせない、プロンプトエンジニアリングの具体的なテクニックを「4つ」学びます。
【3章】LLMをAPI経由で呼び出し、あなたが開発する機能に組み込む方法を学びます。「試してみたい機能があるけれど、どうプログラムに組み込めばいいかわからない」「業務システムに生成AIを安全に導入したい」そんな悩みに答える章です。
【4章】LLMをAPI経由で直接呼び出す方法から一歩進んで、LangChainやLangGraphなどのフレームワークを活用する方法を学びます。API直接呼出しとどちらを使うべきか迷っている方にもおすすめです。
【5章】RAGを使って、「LLMが知らない情報を、調べてから答えさせる」仕組みを実現する方法を学びます。
【6章】生成AIアプリの本番運用に欠かせない、プロンプト管理とオブザーバビリティ(どこで何が起きたのかを知るための仕組み)について学びます。
【7章】最後の章です。これまで学んだことを全て組み合わせて、AIエージェントを実装します。
それぞれの章には、マンガとイラストをたくさん載せていますので、はじめてでもイメージを掴みながら読み進めることができます。
また、他の書籍にはあまりない「著者の失敗エピソード」をたくさん掲載しています。著者3人が失敗から得た知見を惜しみなく詰め込んでいますので、どうかリラックスして読み進めてください。
----「はじめに」より抜粋----
新しい技術を習得すること自体が大変だというのに、進化のスピードが速い生成AIについていくのなんてものすごく途方もない話に感じられるかもしれません。でもせっかく関わろうと思っていただけたのであれば全力で応援したい。生成AIって結構おもしろいんだぞ~というのを少しでも伝えたい。本書は「生成AIを使い始めるところから開発するところまで」の初心者に向けて、わかりやすく解説する本を目指しました。
しかも今回はなんと! 生成AIを使いながら生成AIの機能開発している3名がそれぞれの普段の業務を通して学んだことをベースに解説しています。「こういう技術って、実際に使えるんだろうか?」という疑問に対しそれぞれハマったポイントなどを書いていますので、ぜひ楽しみに読み進めていただければと思います。
流れが速く、潮目が変わりやすい生成AIという技術領域に対して、すでにもがいて溺れた経験のある私たちの知見がどうかみなさまの船出を少しでも安定したものにできればと思っています。
感情タグBEST3
Posted by ブクログ
生成AIを使ったアプリケーション開発に必要な要素をわかりやすく解説している書籍。生成AI系の入門はここ最近色々出ているけど、わかりやすさと実践のバランスとしてこれは入門系の決定版じゃないかと思う。おすすめポイントは以下。
- LangChain、LangGraph、Langfuseといった生成AI関係でよく聞くツールの使い方が理解できる
- オブザーバビリティやガードレールといった生成AIアプリケーションを運用していくと重要になってくる考えを学べる
- 最終的にはAIエージェント実装まで行っており自分で生成AIアプリケーション開発をする際の土台ができる
- 著者の詰まりポイントの解説で一歩踏み込んだ内容を知れる
- おとうふくんが可愛い
Posted by ブクログ
ざーっと目を通したくらい
### **Chapter 1: 生成AIのきほん**
生成AIの基礎知識と歴史、そしてエンジニアが活用すべきツールについて解説しています。
* **生成AIの概要:** テキストや画像などを生成するAIの仕組みと、第1次〜第3次AIブーム(機械学習・深層学習)から現在の第4次ブーム(LLMなど)に至る歴史を振り返ります。
* **主要モデルとサービス:** 大規模言語モデル(LLM)や拡散モデル、およびChatGPT、Claude、Geminiなどのチャットサービスを紹介しています。
* **開発支援ツール:** 「Cursor」などのコーディングエージェントや、外部ツールと接続する「MCP(Model Context Protocol)」の活用方法を紹介し、実際に開発環境をセットアップする手順を解説しています。
### **Chapter 2: プロンプトエンジニアリングに入門してみよう**
LLMから望む回答を引き出すための指示(プロンプト)の設計技術を学びます。
* **基礎:** トークンの概念や、創造性を調整するパラメータ(Temperature)について解説しています。
* **主要テクニック:**
* **Role:** System/User/Assistantの役割定義。
* **Few-Shot:** 例示を与えて出力形式を固定する方法。
* **Chain-of-Thought (CoT):** 思考過程を出力させて論理的推論の精度を高める手法。
* **Self-Consistency:** 複数の推論経路から多数決をとる手法。
* **Least-to-Most:** 複雑な問題を小タスクに分解して順に解く手法。
### **Chapter 3: LLMをAPIで呼び出してみよう**
LLMをアプリケーションに組み込むためのAPI利用法を実践します。
* **APIの基礎:** OpenAI APIなどを例に、Pythonを使った基本的な呼び出し方、認証、パラメータ設定(`response_format`や`seed`など)を学びます。
* **実践開発:** 翻訳プログラムの開発を通じて、コンテキストを考慮した翻訳や自動評価(LLM-as-a-Judge)を実装します。
* **運用技術:** エラーハンドリング(レート制限、認証エラー)、トークン節約のためのキャッシュやストリーミング処理、プロンプトインジェクション対策などのセキュリティについて解説しています。
### **Chapter 4: LangChainとLangGraphでもっと便利に実装してみよう**
LLMアプリ開発を効率化するフレームワーク「LangChain」と「LangGraph」の使い方を学びます。
* **LangChain:** プロンプト管理、Chain(処理の連結)、Memory(会話履歴の保持)、OutputParserなどの主要コンポーネントを使い、チャットボットを実装します。
* **LangGraph:** 複雑なワークフローを構築するためのグラフ構造ベースのライブラリです。条件分岐、並列処理、人間が介入するフロー(Human-in-the-loop)の実装方法を解説しています。
### **Chapter 5: RAGを実装してみよう**
社内ドキュメントなどの外部知識を検索して回答生成に利用する「RAG(検索拡張生成)」システムを構築します。
* **検索手法:** キーワード検索(BM25)、ベクトル検索(埋め込みモデル)、およびそれらを組み合わせたハイブリッド検索(RRF)の違いと実装を学びます。
* **実装:** ベクトルデータベース「Chroma」を使用し、ドキュメントの読み込みから検索、回答生成までの一連のパイプラインを作成します。また、回答に出典を明記させる方法も解説しています。
### **Chapter 6: プロンプト管理とオブザーバビリティを学ぼう**
LLMアプリの品質改善と運用監視(オブザーバビリティ)について学びます。
* **プロンプト管理:** プロンプトのバージョン管理やテストの重要性について解説しています。
* **オブザーバビリティ:** トレース、メトリクス、ログの3本柱を中心に、アプリの挙動を可視化する方法を学びます。
* **Langfuseの活用:** OSSの分析ツール「Langfuse」を導入し、実行トレースの記録、データセットを使ったテスト、LLMによる自動評価のフローを実践します。
### **Chapter 7: AIエージェントを開発してみよう**
自律的に計画を立ててタスクを実行する「AIエージェント」を開発します。
* **エージェントの仕組み:** 「ツール」「ループ(思考・行動・観察)」「ゴール」の3要素と、ワークフローとの違い(自律性の有無)を理解します。
* **実装パターン:**
* **ReAct:** Web検索ツールを使って自律的に調査・回答するエージェントを実装します。
* **LangGraphでの制御:** 状態管理を行い、ループ回数の制限やツール呼び出しの制御をより堅牢にします。
* **RAGエージェント:** 社内データ検索(RAG)とWeb検索を、信頼度スコアに応じて使い分ける高度なエージェントを構築します。
* **ガードレール:** 暴走を防ぐための実行回数制限や予算管理などの安全策について解説しています。