無料マンガ・ラノベなど、豊富なラインナップで100万冊以上配信中!
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
※この電子書籍は紙版書籍のページデザインで制作した固定レイアウトです。
「図表を読めるRAG」を作る
近年、テキストだけでなく、図・表・グラフといった画像を含む資料からも情報を検索・活用できる「マルチモーダルRAG(Retrieval-Augmented Generation)」の重要性が高まっています。従来のRAGが扱える情報はテキストデータに限定されており、実務現場で扱う文書──技術報告書・研究論文・プレゼン資料──のように、図表を多く含むデータには十分対応できませんでした。本書は、この課題を踏まえて、実務文書にも対応できるマルチモーダルRAGについて体系的に解説します。
本書では、自分の手でマルチモーダルRAGを構築できるようになることを目指します。全体を通して、手を動かしながら理解できるよう、再現可能なコード例を多数提示しています。
【主要目次】
Chapter 1 テキストベースのRAG
Chapter 2 Responses APIのfile searchによるRAG
Chapter 3 標準的なマルチモーダルRAG
Chapter 4 ColPaliを利用したマルチモーダルRAG
Chapter 5 エージェントによる自律制御を組み込んだMMA-RAG
Chapter 6 VQAを中核としたマルチモーダルRAG
※アプリの閲覧環境は最新バージョンのものです。
※アプリの閲覧環境は最新バージョンのものです。