【感想・ネタバレ】大規模言語モデルは新たな知能か　ＣｈａｔＧＰＴが変えた世界のレビュー

1,540円 (税込)
7pt

Posted by ブクログ

大規模言語モデルの現状、展望、問題点が平易ではあるが、かなり広く深く書かれている。
著者は若い起業家であり、数式に頼らずにうまく概念を説明している。事例もビジネスの現場の最先端から引用されている。この辺りが学者が書いたものとは全く異なり、かなりリーダブルな本となっている。

0

2024年04月02日

Posted by ブクログ

一回AIとはどういうものかをかじって概略の知識があり、さらにそのかじった時にニューラルネットワークについてある程度かじった人には、とても具体的でわかりやすい本だと思います。『ＣｈａｔＧＰＴの全貌　何がすごくて、何が危険なのか？ (光文社新書 1267)』などを読んだ後に読むとよいのでは。

0

2023年11月10日

Posted by ブクログ

大規模言語モデル（LLM）について、またいわゆる（人口）知能とは、どのような理屈で動作しているのか？、について、その大まかな歴史、また正確な理論の解説と、わかりやすい（ただ決して万人向けではないが…）、技術的な興味を惹かれる記述を含む形で書かれた、優れた技術書であると思う。

私はかつて、学卒後約8年、いわゆるIT業界に身を置き、またその後業界こそ異なれどITに関わる仕事に長年従事してきた。ただ数年前にセミリタイアのような形でかの業界からは身を引き、ちょうど時を同じくしてChatGPTに代表されるような人工知能（AI）（LLM）が世間の耳目を集める時代になったように思う。そのような「自分の仕事とは関わりのない」「仕事を通じて触れる事のできない」LLMという概念をその基礎から知ることができず、ずっともやもやとした気分でいた。余談だが1995年のいわゆるウィンドウズショック、インターネット元年、その後の一連のIT革命（と勝手に私が呼んでいる）をまさに公私に渡って体験してきた身ではある。

そのようなLLM、について、学ぶ資料、書籍、になかなか出会うことが出来なかった。尤も、いわゆる親切な絵柄や過剰な色彩、それこそ「万人向け」の「ムック本」ならば、いくらでも書店に並んでいるだろう。ただ私は決してそのような形で（AIについて）学びたいとは思わなかった。実際、もしそのような形で触れていれば、下記のような発見はなかっただろう。

私が本書を通じて得た「発見」とは、「AIについてその技術を進化させようとする研究、行為、開発作業、は、人間の脳について、より深くその動作原理を知ろうとすることではないか？」という事である。私が冒頭で、「（人口）知能」とあえてカッコで括った事はそれを意味している。当たり前の事だが、私たちは常に考え、行動し、反省し、よりよく行動しようと、という日常を意識する事なく繰り返しているはずである。それは全く文字通り「無意識」の行動であり、その「命令」は殆ど「脳」がやはり無意識に「発信」していると思う。ではその無意識な行動は具体的にどうやって、どういう理屈で、どういう経験則に従って命令が発せられたのか？、もっとわかりやすい（と私が勝手に考えだした）例を挙げれば、テレビ番組に出てくるお笑い漫才師の演芸、その間合いとセリフが、なぜ我々はまさにその瞬間に面白いと感じるのか？、そこにAI、或いは人間の脳、というものの動作を理解するヒントがあるのではないかと、本書を読むことを通じて、私は発見させられたように思う。すなわち、AIの研究とは人間の脳の研究では無いかと。

最後に、本書の終末あたりの一文をそのまま引用する。まさにこの事がAIと人間の未来を表しているのでは無いかとも思う。

「結局のところ、人は異なる知能をもった存在によって、初めて自分たち自身を理解できるのかもしれない。人工知能が人間の自己理解に貢献していくと考えられる。」

0

2023年11月10日

Posted by ブクログ

大規模言語モデルが現在どこまで辿り着いているよかが平易な文章でよく理解できました。

通常は学習させればさせるほど、データ量が多ければ多いほど過学習が起こり、汎用的なモデルにならない所が、ブレイクスルーできている点が最も大きい。汎用的な知識に近いものが獲得できている所がすごい。あとはハルシネーションに対する対応がどうなるか次第だと思います

0

2023年11月07日

Posted by ブクログ

大規模言語モデルを「数式を使わず」に(つまり、数学分からない人間に)解説するもの。
その意味でわかり良い本の最高のものとおもいました。
二回、読みました。
数ヶ月したら「続編」(この分野は激しく変わっていくので)を出して欲しい。この内容をより充実させ、新しい状況に対応したものを期待したい。

0

2023年08月27日

Posted by ブクログ

大規模言語モデルに関する最初の一歩としては、質量共に十分な一書。

できること、リスク、背景技術、歴史など肝を押さえた記述だ。

これからの利用にあたっても、背景技術が分かると、さらに効果的な使い方ができることを予感できた。

0

2023年08月26日

Posted by ブクログ

一般向けの書籍としてPFN代表が著した本書。無駄な誇張がなく、現実的な未来ある技術として地に足のついた理解が進んだ。
大規模言語モデルは、答えを設定してテストドリブンで開発する手法とは違い、複雑なアルゴリズムを組んでデータを読ませてみて、その結果を分析したり研究したりする手法だったのか。

0

2023年07月30日

Posted by ブクログ

ChatGPTをはじめとするAIチャットサービスの裏側を一般向けにわかりやすく解説していた。難しい内容だが図解も使ってかなり理解しやすかった。

0

2023年07月29日

Posted by ブクログ

幻覚の克服はできるのか…頻度を減らすことはできるのだろうけど、ゼロにはできないのだろうなと思う。GoogleのBERTモデルの基本思想が分かった。「苦い教訓」面白そうで読んでみたい。結局、モデルとか手法を人知を加えてこねくり回すより計算能力(とデータ量？)で殴った方が良い精度が出るっぽい、ということか。モデルサイズの冪乗則と創発現象。モデルの重みパラメータは学習時以降固定だが、自己注意機構がパラメータを一時変更したかのように挙動するためメタ学習として本文中学習が可能となる。そしてRLHFによるモデル修正。
AIの適切な利用には人類の倫理観の成長が求められるフェーズになってきているが、この分野を中心とした科学技術全般の発展が楽しみで仕方ない。限りある人生の中でその劇的な発展を見届け、あわよくば貢献できればと思った。

0

2023年07月28日

Posted by ブクログ

初学者向けに現在の大規模言語モデルの潮流と技術的背景、リスクなどをわかりやすく解説した書籍。

非常に興味深く読ませてもらった。今後の技術発展が気になるところ。

0

2023年07月15日

Posted by ブクログ

話題のChatGPTに使われるLLMをわかりやすく説明した良書．私にとっては第6章が一番興味深い内容であった．MLPと注意機構の役割が説明されているのを見るのは，本書が初めてである．数式がないので，文系の人を含めて多くの人にお勧めできるが，内容はかなり高度である．

0

2023年07月01日

Posted by ブクログ

LLMについて、そのすごさは触ることで感じ取ることができるが、なぜすごいのか、どのような仕組みになっているか理解することは難しい。前提となる知識があまりに多いのだ。
しかし本書ではわずか130ページ程度のボリュームにエッセンスを凝縮し、しかも数式を使わずにわかりやすく解説するという離れ業に挑戦し、成功している。

0

2023年06月30日

Posted by ブクログ

大規模言語モデルを一般向けにやさしく解説した本です。130ページなのですぐに読めます。特に興味を持ったのは、チョムスキーの普遍文法との関係ですね。チョムスキーは、人は生まれつき何らかの普遍文法を持っていると主張しました。一方、著者は、大規模言語モデルの成功を受けて、言語は学習しやすいデータであり、ひとはそれを学習できる汎用学習器を生まれつき持っていると言います。

0

2023年06月25日

Posted by ブクログ

大規模言語モデル、いわゆる生成AIの仕組みと今後の課題等が素人にもわかりやすく解説されている。
開発者自身も大規模言語モデルがこれだけ上手く行っているのか、まだ分かっていない部分があるとの記述に驚いた。
人間の言語習得の仕組みとの違いがあるのか無いのか、はたまた知能そのものの獲得は可能なのか、今後学習するデータが更に増えていった時に何が起こるのか興味は尽きない。
ただ、悪用されたり暴走したりしないように、しっかりウォッチしていく事が必要だろう。

0

2024年05月08日

Posted by ブクログ

ChatGPTを実現した大規模言語モデルの解説書だが、難しい！概念だけでも理解しようと本書を繙いたが、初めて出会う用語が大量に出てくる．汎化、幻覚、目標駆動学習、自己注意機構、本文中学習などなど．次の単語を予測するというタスクを解くために、自己注意機構というモデルは設計者も想定していなかった働きを獲得していたという記述があったが(p117)、画期的なことだと感じた．大規模言語モデルを新しい道具としてとらえ、人とは違う新たな知能を持ったシステムと考える著者のコメントに共感を覚える．難しかった．

0

2024年02月11日

Posted by ブクログ

一般ユーザーの触れる諸サービスに限らず日進月歩の研究が人工知能界隈で尚進められているものと思うが
その動きを大仰にビジネス書チックに扱うのではなく、質実に比較的紙幅の限られる中で辿ったという感じ。

取り上げられるトピックに目新しさは少ないが、本書を専門知識の入り口とするには端的にまとまっている。

0

2023年09月03日

Posted by ブクログ

言語モデルが意味や構造を理解していると想定できると書かれていた。意味が分かるとは思っていなかったが、意味が分かっているという結果が出ているようだ。内部構造を分析することが難しいようだが、ぜひどうやって言語モデルが考えているのかを解明してもらいたい。

0

2023年08月24日

Posted by ブクログ

ネタバレ

著者の前作（AI技術の最前線）は全く理解不能な内容だったが今回は一般読者向けを意識したのか、最新の技術が平易に解説されている

・LLMは、人間のように家族がいることなどによる価値観を有しておらず、身体性をもつことから生じる世界の理解もない。おそらくこのシステムが人間の知能と同じになることはない

・価値観や偏見をめぐる判断は人間のフィードバックによる強化学習で行っている

・LLMが次の単語を選ぶメカニズムとしては、英語の穴埋め問題を思い浮かべるとよい、というのはなんとなく腑に落ちる。確かに、あれは周辺情報から次の単語を高い確率で選ぶ例になっている。

・モデルとしては、小さいもののほうが効率よく学習できていると思われていたが、大きいものほど効率的であることがわかった。今後もよりパラメータの多い、大規模モデルの開発が予想される。

0

2023年08月15日

Posted by ブクログ

ChatGPTのベースになるLLM (大規模言語モデル)についてとても簡潔に解説された本。著者はPreferred Networksの創業者の方で、同社のエンジニアからも多くフィードバックをもらったとのことで、その点でも安心できる。

LLMの成功の鍵となる各要素、自己教師あり学習、汎化、言語モデルのべき乗則、創発、宝くじ仮説、目標駆動学習(RLHF)、自己注意機構、本文中学習、メタ学習、などの説明は簡潔でわかりやすい。

幻覚の課題は大きいが、実際にはChatGPTなどプロンプト事例を引きながら使い倒していくのが、まずは個人的観点からは最初の第一歩になるだろう。実社会では、特定用途への最適化、学習のローカライズ、プライバシーの課題のためにいったんは多くのLLM対応のSI事業が出てくるのではなるのかもしれない。インターネットの黎明期にWebサイト構築業者が出てきて、そして集約されていったのと似たようなことが起きるのだろうなと思う。

予測モデルのフィードバックがLLMでも有効であることなどは、フリストンらが提唱する自由エネルギー原理などの脳や意識の仕組みとの類似性がこの本でも色濃く感じられた。著者も指摘するように、大規模言語モデルがこれだけうまく働くことから、大規模言語モデルを研究することで、人が言語をどのように理解し、それを用いて世界をどのように認識をしているのかを理解できることを期待している。驚くほどの類似が、意外に正解に近づいているのではないかと思わせるのだ。

ひとまず、大規模言語モデルを短期間で理解するには最適な本のひとつ。

0

2023年08月12日

Posted by ブクログ

大規模言語モデル(LLM)のことを数式を使わずに説明してくれている。
LLMとは、次の単語を予測する予測マシーンとのこと。連続で次の単語を予測していって文章になると。
6章を読めば、LLMがどう動いているのかがザックリと理解できる。

この本を読んで、人間がどうやって言語を習得していくのか、興味を持った。

0

2023年07月26日

Posted by ブクログ

PFN副代表である岡野原氏による、大規模言語モデルの平易な(=数式を使わない)解説書。巷でよく言われているような主張(AIが今の仕事を置き換えるかもしれないが別の仕事を生み出す、LLMには責任は取れないが最初の相談相手としての価値はある、等)も多かったが、それを専門家である岡野原氏が語っているところに一つの価値があるように感じた。
個人的に面白かったのが、人間が作り出したはずのAIにおいて「なぜそういう挙動をするのか分からない」という事象が沢山あるということ。「一般にモデルのパラメータは多すぎると過学習を起こすが、深層学習等はモデルパラメータ数が大きければ大きいほど精度があがる、その理由は明確には分かっていない(仮説が幾つかある)」といった話は、この手の分野では起こる事象が全て説明可能であるイメージが強かった自分にとっては新鮮だった。
この分野は動きも早いため、今後も継続的に注視していきたい。

0

2023年07月23日

Posted by ブクログ

大規模言語モデルの正負両面について専門家が初心者向けに書いた本。
序章で初心者向け、とは書かれていたがIT完全初心者の私にはところどころわからないところがあった。
実際には、ある程度ITにかかわる仕事をしていたり、興味を持っている方向けの難易度だと思われる。

本書の中で何度も繰り返されていたことは、
①大規模言語モデルは間違える（存在しない記憶を作り出す）ことがある
　⇒機械以外の第三者の裏どり、間違っている可能性をもって自分で考える必要性
②大規模言語モデルは「道具」であり「人間」ではない
　⇒うまく使えば有益であるが、機械であるが故に基本的な常識や価値観がかけていることを理解した上で使う必要がある

0

2024年01月06日

Posted by ブクログ

開始: 2023/12/27
終了: 2024/1/5

感想
人と異なる知能。圧倒的だが弱点も多数存在する。彼らは言葉の意味を真に理解しているのだろうか。情緒的なアドバイスに空恐ろしさを覚える。

0

2024年01月05日

Posted by ブクログ

大規模言語モデルについて、素人にもわかるようにまとめた本。

確かに、わかりやすく噛み砕こうとしてくれている感じはあり、なんとなく雰囲気を掴むことはできた。しかし、それでも内容は難しく、十分に理解したとは言えない。
ところどころ、文章として読みにくい箇所があった点は惜しい。

0

2023年11月16日

Posted by ブクログ

タイトルにある通り、
「知能」とは何か、を定式化し、大規模言語モデル(LLM)が
それを満たすといえるのかを問うたり、
あるいはLLMのふるまいから「知能」とは何かを考える
道筋をつけるものかと思って購入したが、
そういうのはほとんどなかった。
帯にあたる部分に書いてある、
「何が可能か」「どんなリスクがあるか」「どう付き合うか」
がメイン。
LLMやその他の言語学習モデルが簡単に説明されている。
同シリーズの「クオリアはどこからくるのか？」を
先に読んでいたので、そういった内容を期待して
肩透かしを食らってしまったが、
ChatGPTなどの啓蒙書としてはちょうどいいかも。

0

2023年11月06日

Posted by ブクログ

私もChatGPTを使い始めたが、まだ、日本の地方やマニアックな話題は難しそうである。ただ、上手く使えば使い道はあると思った。
このまま性能が上がれば、世の中は変わっていくだろう。

0

2023年10月24日

Posted by ブクログ

【星:3.5】
本書のテーマに対する私の知識不足が原因と思われるが、色々分からないところがあった。

本書は一般向けとの事であるが、多分AIとかに一定レベルの知識を持った一般の方向けというこだと思う。

ただ、理解出来た部分については色々と参考になり、今後AIについての一定程度の知識が必須となることは肌身で感じることができた。

0

2023年10月04日

Posted by ブクログ

成功のキーは「大規模」であった。画期的な新しい方式をとったわけではない。なんとなく思っていた通りだ。ただ、なんと実現した人達もなぜうまく行ったかわかってない、というのは驚き。

0

2023年08月28日

感情タグBEST3

「学術・語学」ランキング

【感想・ネタバレ】大規模言語モデルは新たな知能か ＣｈａｔＧＰＴが変えた世界のレビュー

感情タグBEST3

「学術・語学」ランキング

【感想・ネタバレ】大規模言語モデルは新たな知能か　ＣｈａｔＧＰＴが変えた世界のレビュー