情報科学 - インプレス NextPublishingの検索結果

  • 実践!AI動画検索 RAGで実現する検索システム
    NEW
    -
    本書は、AIを活用して動画の内容そのものから検索を可能にする技術の実装方法を扱います。現在の動画検索がタイトルや説明文といったメタデータに依存し、動画の中身を直接検索できないという課題に対し、本書は映像・音声・テキストのマルチモーダル解析による動画理解の仕組みと、従来の検索方法との違いを明確に提示します。動画からシーン検索を実現するための基礎パイプライン構築では、動画の読み込みとメタデータ取得から始まり、シーン境界の検出、音声認識とOCRによるテキスト抽出、画像キャプション生成、そしてマルチモーダル埋め込みを経て検索インデックスを構築するまでの一連の流れを、実際に動作するコードとともに紹介し、さらに埋め込みベクトルの概念や類似度計算、効率的な検索を実現するベクトルデータベースの活用方法を詳述します。加えて、RAGの基本的な仕組みとその動画検索への応用を通じて、検索と生成を組み合わせることでより精度の高い検索結果を提供できる理由を解説し、デモアプリケーションを使って動画のアップロードからシーン解析、ベクトル登録、自然言語検索までを一気通貫で試せるよう構成されています。 動画解析やマルチモーダルAIに興味がある方には必見の一冊です。
  • MPEGの魔法 映像と音声圧縮の完全ガイド
    NEW
    -
    本書は、MPEGという「魔法」のような映像圧縮技術が、その誕生から現代、そして未来へとどのように進化してきたのかを物語る一冊です。1980年代後半に約650MBのCDに映画を収録するという目標が掲げられ、フルHD映像を非圧縮で保存すると1秒間で約190MB、1時間では約680GBものデータ量になるという課題に対し、世界中の技術者が数々の発明と工夫を重ねてMPEGが生まれました。35mmフィルムとブラウン管から始まったアナログ時代から映像のデジタル化、そしてインターネット時代の到来を経て、現代ではスマートフォンからのSNS動画アップロードやNetflixでの映画ストリーミング、ビデオ会議が当たり前の光景となっています。この日常の裏側には、映像データを劇的に小さくするMPEGという「魔法」のような技術が存在し、映像と音声のデジタルデータ表現の基礎、情報量制御技術、色差成分を利用したデータ削減といった知恵が凝縮されています。本書では、MPEGだけでなく、H.261、AV2、DivXといった関連技術も網羅し、その進化の物語を通じて、現代のデジタル映像を支える知恵の数々を紐解いていきます。
  • データベース初心者のためのPostgreSQL教室
    -
    本書はデータベース初心者およびPostgreSQL初心者向けの入門書です。データベースとは何か?からPostgreSQLのインストール、SQLの実行、トランザクションについて、レプリケーション、バックアップまでを解説しています。
  • マウスが変えたコンピュータ史 エンゲルバートからMacへ
    NEW
    -
    コンピュータがまだ巨大な計算機だった時代、アメリカの研究者ダグラス・エンゲルバート(Douglas Engelbart)は、コンピュータをまったく別の視点から見ていた。彼はコンピュータを「人間の知能を拡張する道具」として考えていたのである。その研究の中で生まれた装置が、後に「マウス」と呼ばれることになる。  1968年、エンゲルバートは歴史的なデモンストレーションを行い、マウスを使って画面上の情報を操作してみせた。そこには、ハイパーテキスト、ウィンドウ、共同編集など、現代のコンピュータの基本的な概念がすでに含まれていた。  しかし、この革命的な研究はすぐには世界に広がらなかった。  その後、カリフォルニアのゼロックス・パロアルト研究所(Xerox PARC)で研究が発展し、さらに1980年代にはAppleがパーソナルコンピュータの世界にマウスを持ち込むことで、ようやく一般の人々の机の上に広がっていくことになる。  今日、マウスはありふれた装置のように見える。しかしその背後には、人とコンピュータの関係を変えようとした研究者たちの情熱と長い試行錯誤の歴史がある。  本書では、マウスという小さな装置の誕生から現在までの歩みをたどりながら、コンピュータの歴史と、人間と機械の関係の変化を見つめていく。
  • コールセンターと日本製AIの話
    -
    本書では、筆者自身がコールセンターで直接1万本のクレーム電話を受電し、大半の顧客はAI対応でも容認し得るだろう事を検証し、具体的にどの様にAIを導入するかについて解説しています。  日本企業が技術や展開ボリュームでGAFAに対抗する事は難しいものがあります。しかし、日本語によるAI対応能力開発なら、まだ日本人が外国人に優っているでしょう。問題は、企業サービスのAI化ではスマホとの親和性が絶対条件になりつつあるにも関わらず、日本企業の多くを占める中小企業でAI導入を実行できず、日本製AI技術のスタンダードが何であるかが未だ見えて来ないことにあります。  そして、AI対応へのノウハウを積み上げるには時間がかかるため、少しでも早いAI化取り組みが必要な事も理解されていません。ここでいうAI化取り組みとは、日本製AI利用、すなわちユーザーとなる企業を増やすことが必要です。
  • 人工偽脳 AIがつくるのは偽の脳
    -
    【AIの実体は大したことはないので、何も恐れることはありません】 「最近はすごい人工知能も登場していますが、その背景にはコンピューター性能の飛躍的な向上があります。  人工知能は脳科学という観点からは偽脳つまり偽の脳にすぎず、真の脳ではありません。偽脳では印象は悪いかもしれませんが、「本物か偽物か」となれば「偽物」と言っていいでしょう。人間の脳を模した擬似的な脳になるなら、偽脳は十分役に立ちますし、特定の分野では人間の能力をはるかに超える力を持っています。」 「偽脳を人工知能でつくる技術の変遷はコンピューターの歴史そのものです。ですから、コンピューターの発展と同じようなものですが、技術にはブレークスルー的な変化があるため、ブームという表現が用いられます。  人工知能はコンピュータープログラムの1つですから、コンピューターの実用化が始まった1950年代から研究されてきましたし、そのころすでに人工知能のブームはありました。」 《第0次AIブーム(1955年ごろからの10年間)~人工知能の原理がつくられた時代》 《第1次AIブーム(1985年ごろからの10年間)~人工知能プログラミング基本の時代》 《第2次AIブーム(2015年ごろから現在進行中、2025年ごろまで?)~人工知能プログラミング実用化の時代》 「筆者は第0次ブームの終焉期から人工知能コンピューターの研究に関与してきましたので、今回のブームの“終焉”を2025年と予想しています。」 「ごく大雑把に今回のブームの骨幹をまとめると、人工神経回路網つまりニューラルネットワークでの学習方法が進歩したこと。と同時にコンピューターの発達により、ビッグデータ処理が可能になりました。  ここで人工知能の教科書を書くつもりではありませんので、メディアで取り上げられるような項目、つまり人工知能の応用分野から眺めるようにします。」 (「プロローグ」より)
  • 実践コンテキストエンジニアリング グラフDBとRAGの実践ガイド
    6/19入荷
    -
    本書は、生成AIにおけるコンテキストエンジニアリングの実践的な手法と、宣言型プログラミングによるRAGの実装事例を最新の情報で解説した技術書です。近年、LLMに与える情報の密度が高まりコンテキストウィンドウが巨大化すると、モデルの推論能力が低下するコンテキスト・ロットという現象が知られており、本書はこの課題に対する解決策としてRLMの設計思想を詳述します。RLMはすべてのデータを直接プロンプトに入力するのではなく、コンテキストを外部データとして扱い、LLMが必要な情報のみを動的にコードの実行や再帰的な呼び出しを通じて探索・検証するように設計されているため、従来の静的なアプローチとは異なる柔軟な情報取得が可能になります。また、グラフDBを活用したRAGの実装方法や、RAGで活用されるサービスにおける具体的な適用例について、実践的なコードを交えて紹介しており、開発者がシステム設計において直面する複雑なデータ連携の問題を解決するための具体的な指針を提供します。さらに、RAGでの回答生成に至るLLMのトレース方法についても言及しており、ブラックボックス化しがちな生成プロセスの可視化と検証を通じて、信頼性の高いAIアプリケーションの開発を支援する包括的な内容となっています。

    試し読み

    フォロー

最近チェックした作品からのおすすめ