ブックライブでは、JavaScriptがOFFになっているとご利用いただけない機能があります。JavaScriptを有効にしてご利用ください。
無料マンガ・ラノベなど、豊富なラインナップで100万冊以上配信中!
来店pt
閲覧履歴
My本棚
カート
フォロー
クーポン
Myページ
7pt
対話型サービスChatGPTは驚きをもって迎えられ,IT企業間で類似サービスをめぐる激しい開発競争が起こりつつある.それらを支える大規模言語モデルとはどのような仕組みなのか.何が可能となり,どんな影響が考えられるのか.人の言語獲得の謎も解き明かすのか.新たな知能の正負両面をみつめ,今後の付き合い方を考える.
ブラウザ試し読み
アプリ試し読みはこちら
Posted by ブクログ
大規模言語モデルの現状、展望、問題点が平易ではあるが、かなり広く深く書かれている。 著者は若い起業家であり、数式に頼らずにうまく概念を説明している。事例もビジネスの現場の最先端から引用されている。この辺りが学者が書いたものとは全く異なり、かなりリーダブルな本となっている。
一回AIとはどういうものかをかじって概略の知識があり、さらにそのかじった時にニューラルネットワークについてある程度かじった人には、とても具体的でわかりやすい本だと思います。『ChatGPTの全貌 何がすごくて、何が危険なのか? (光文社新書 1267)』などを読んだ後に読むとよいのでは。
大規模言語モデル(LLM)について、またいわゆる(人口)知能とは、どのような理屈で動作しているのか?、について、その大まかな歴史、また正確な理論の解説と、わかりやすい(ただ決して万人向けではないが…)、技術的な興味を惹かれる記述を含む形で書かれた、優れた技術書であると思う。 私はかつて、学卒後約8...続きを読む年、いわゆるIT業界に身を置き、またその後業界こそ異なれどITに関わる仕事に長年従事してきた。ただ数年前にセミリタイアのような形でかの業界からは身を引き、ちょうど時を同じくしてChatGPTに代表されるような人工知能(AI)(LLM)が世間の耳目を集める時代になったように思う。そのような「自分の仕事とは関わりのない」「仕事を通じて触れる事のできない」LLMという概念をその基礎から知ることができず、ずっともやもやとした気分でいた。余談だが1995年のいわゆるウィンドウズショック、インターネット元年、その後の一連のIT革命(と勝手に私が呼んでいる)をまさに公私に渡って体験してきた身ではある。 そのようなLLM、について、学ぶ資料、書籍、になかなか出会うことが出来なかった。尤も、いわゆる親切な絵柄や過剰な色彩、それこそ「万人向け」の「ムック本」ならば、いくらでも書店に並んでいるだろう。ただ私は決してそのような形で(AIについて)学びたいとは思わなかった。実際、もしそのような形で触れていれば、下記のような発見はなかっただろう。 私が本書を通じて得た「発見」とは、「AIについてその技術を進化させようとする研究、行為、開発作業、は、人間の脳について、より深くその動作原理を知ろうとすることではないか?」という事である。私が冒頭で、「(人口)知能」とあえてカッコで括った事はそれを意味している。当たり前の事だが、私たちは常に考え、行動し、反省し、よりよく行動しようと、という日常を意識する事なく繰り返しているはずである。それは全く文字通り「無意識」の行動であり、その「命令」は殆ど「脳」がやはり無意識に「発信」していると思う。ではその無意識な行動は具体的にどうやって、どういう理屈で、どういう経験則に従って命令が発せられたのか?、もっとわかりやすい(と私が勝手に考えだした)例を挙げれば、テレビ番組に出てくるお笑い漫才師の演芸、その間合いとセリフが、なぜ我々はまさにその瞬間に面白いと感じるのか?、そこにAI、或いは人間の脳、というものの動作を理解するヒントがあるのではないかと、本書を読むことを通じて、私は発見させられたように思う。すなわち、AIの研究とは人間の脳の研究では無いかと。 最後に、本書の終末あたりの一文をそのまま引用する。まさにこの事がAIと人間の未来を表しているのでは無いかとも思う。 「結局のところ、人は異なる知能をもった存在によって、初めて自分たち自身を理解できるのかもしれない。人工知能が人間の自己理解に貢献していくと考えられる。」
大規模言語モデルが現在どこまで辿り着いているよかが平易な文章でよく理解できました。 通常は学習させればさせるほど、データ量が多ければ多いほど過学習が起こり、汎用的なモデルにならない所が、ブレイクスルーできている点が最も大きい。汎用的な知識に近いものが獲得できている所がすごい。あとはハルシネーション...続きを読むに対する対応がどうなるか次第だと思います
大規模言語モデルを「数式を使わず」に(つまり、数学分からない人間に)解説するもの。 その意味でわかり良い本の最高のものとおもいました。 二回、読みました。 数ヶ月したら「続編」(この分野は激しく変わっていくので)を出して欲しい。この内容をより充実させ、新しい状況に対応したものを期待したい。
大規模言語モデルに関する最初の一歩としては、質量共に十分な一書。 できること、リスク、背景技術、歴史など肝を押さえた記述だ。 これからの利用にあたっても、背景技術が分かると、さらに効果的な使い方ができることを予感できた。
一般向けの書籍としてPFN代表が著した本書。無駄な誇張がなく、現実的な未来ある技術として地に足のついた理解が進んだ。 大規模言語モデルは、答えを設定してテストドリブンで開発する手法とは違い、複雑なアルゴリズムを組んでデータを読ませてみて、その結果を分析したり研究したりする手法だったのか。
ChatGPTをはじめとするAIチャットサービスの裏側を一般向けにわかりやすく解説していた。難しい内容だが図解も使ってかなり理解しやすかった。
幻覚の克服はできるのか…頻度を減らすことはできるのだろうけど、ゼロにはできないのだろうなと思う。GoogleのBERTモデルの基本思想が分かった。「苦い教訓」面白そうで読んでみたい。結局、モデルとか手法を人知を加えてこねくり回すより計算能力(とデータ量?)で殴った方が良い精度が出るっぽい、ということ...続きを読むか。モデルサイズの冪乗則と創発現象。モデルの重みパラメータは学習時以降固定だが、自己注意機構がパラメータを一時変更したかのように挙動するためメタ学習として本文中学習が可能となる。そしてRLHFによるモデル修正。 AIの適切な利用には人類の倫理観の成長が求められるフェーズになってきているが、この分野を中心とした科学技術全般の発展が楽しみで仕方ない。限りある人生の中でその劇的な発展を見届け、あわよくば貢献できればと思った。
初学者向けに現在の大規模言語モデルの潮流と技術的背景、リスクなどをわかりやすく解説した書籍。 非常に興味深く読ませてもらった。今後の技術発展が気になるところ。
レビューをもっと見る
※アプリの閲覧環境は最新バージョンのものです。
新刊やセール情報をお知らせします。
大規模言語モデルは新たな知能か ChatGPTが変えた世界
新刊情報をお知らせします。
岡野原大輔
フォロー機能について
「岩波科学ライブラリー」の最新刊一覧へ
「学術・語学」無料一覧へ
「学術・語学」ランキングの一覧へ
AI技術の最前線 これからのAIを読み解く先端技術73
オンライン機械学習
試し読み
拡散モデル データ生成技術の数理
深層学習
ディープラーニングを支える技術——「正解」を導くメカニズム[技術基礎]
ディープラーニングを支える技術〈2〉——ニューラルネットワーク最大の謎
Learn or Die 死ぬ気で学べ プリファードネットワークスの挑戦
「岡野原大輔」のこれもおすすめ一覧へ
▲大規模言語モデルは新たな知能か ChatGPTが変えた世界 ページトップヘ