【感想・ネタバレ】ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズムのレビュー

\ レビュー投稿でポイントプレゼント / ※購入済みの作品が対象となります
レビューを書く

感情タグBEST3

Posted by ブクログ

ネタバレ

LDA(潜在的ディリクレ配分法)でトピックモデリングを実施し、その本にどういうトピックが含まれているか、またその他機械学習で売れている本とそうでない本の違いを解析した結果が書かれている。
アルゴリズムが選んだベストセラーになる確率が一番高い本は「デイヴ エガーズ」の「ザ・サークル」だったそう。
ジョン・グリシャム、ダニエル・スティールは多くのベストセラーがあるが、アルゴリズムでも説明できたんだそう。
ニューヨーク・タイムズのベストセラーリストから売れている小説を500冊ほど、それほど売れてない小説を4,500冊ほど選び、それを学習させモデルを作った。4年ぐらい掛けたらしい

0
2017年06月09日

Posted by ブクログ

小説を統計処理するとそれでベストセラーになるのかどうか判断できるか?ってもので、具体的には使われている単語によるセンチメント分析でそのセンチメントのゆらぎがどのように流れるものがよいのか?ってところとか。タイトルとかテーマとかの部分はどこまで?って感じがするけどセンチメントとか、!の用法とか、しゃべるってのの言い方をいくつも使ったほうがよいのかよくないのか?ってところとかがデータを用いて明確にわかるってのはすごい。解説の人はこの本はあまり好きじゃないみたい。ぎりぎりの上手いバランスのところに着地している面白い本

0
2018年10月13日

Posted by ブクログ

最新の自然言語処理技術と機械学習を用いて、「ニューヨーク・ベストセラーズ」にランキングされるために必要な小説の要素を分析した一冊。使われている技術は(基礎研究としては)特にこれといって新奇性のあるものではないし、分析の結果判った「ベストセラーになる要素」も特にこれと言って奇妙なものはない。しかし、基礎研究成果の丹念かつ有意義な応用という意味では非常に興味深い。著者たちはコンピューターが小説を書くことに関してはまだまだ懐疑的だが、良い小説を判定できるのであれば、良い小説を書くところまではもうあと 1ステップだという気がする。

0
2018年06月14日

Posted by ブクログ

500冊のNYタイムズベストセラーとその他のノンベストセラーを読み込んだ傾向と対策の分析。
プロット(感情の上下で示す)に特定のパターンはないが、上下はリズミカルである。もっともそれが優れているのがダヴィンチコードである。多くのテーマはなく、2、3のテーマが物語の1/3までで出てくる。そのテーマは普遍的なもの特に人間関係が多く、複数のテーマ間で対立が描かれることになる。
主人公は、能動的でシンプルな動詞を使う。最近のGIRLが主人公のブームは、女性という今でも制約が多いと思われる状況で、規範から外れた行動と意思を示すことで物語をドライブしていく。
言葉は口語により近く、大仰な言葉遣いは避けられている。設定はあまり関係なく、状況や舞台が物語をドライブすることはない。

0
2017年08月26日

Posted by ブクログ

購入。

アメリカのベストセラーを分析して、その特徴を解説する。

テキストマイニングと機械学習によりニューヨークタイムズ紙のベストセラーリスト掲載書籍とベストセラーにならなかった書籍の違いを分析している。
分析の手法については概要を述べるに留まるので、専門知識がなくても理解できるように書かれている。手法について興味があれば、どのような用語を調べればいいかが解説で案内される。

ジャンルとトピックのどちらを分析に使うべきか、という部分に気づきがあった。また分析には使われていないがBISACという書籍の内容を示すコードがある。この存在を初めて知った。

0
2017年06月26日

Posted by ブクログ

ネタバレ

印象的な箇所のまとめ

・作家にはその作家特融のトピックがあり、読者はそれを求めている。トレードマークのトピックで3分の1を埋めた後は、残りの3分の2を別のトピックでうめて変化をつければ、それまでの本とは違う印象になる。この方程式はずっと続けてていくことができるし、実際、見事に守られている。大切なのは割合だ。3分の1は同じトピック、3分の2は別のトピック。

・小説の語る内容でなく、小説が体験させてくれる内容に大半の読者は反応する。

・ベストセラーの登場人物は積極的に行動し、感情を表現する。そうでない小説の登場人物は受動的。

・ベストセラーのキャラクターは正しいこtこを正しい方法で行うだけでなく、正しく話す。「彼女は言った」と表現すればすむところを他の言い回しで表現しようとすることは、作家にとっては地獄への第一歩。キャラクターが話す時は文脈で読めるようにすべきであって、派手な動詞で無闇やたらに飾り立てる必要はない。

・ベストセラー作家には女性作家が多い。またライター経験者が多い。ライター経験者は読者に伝わるわかりやすい言葉で小説を書く。

0
2017年06月18日

Posted by ブクログ

AIを使ってベストセラーとそうでない本を自動的に文章から分類するアルゴリズムを作ったという話。どんな特徴を持つ本をAIはベストセラーと判断したかという結果よりも、AIを用いて文章から本の良し悪しを見分けるという発想が面白いと思った。

0
2020年04月12日

Posted by ブクログ

ベストセラーとなる小説にアルゴリズムは存在するのかをITを使って突き詰めた本。それらしい法則が提示されるが、自分は腹に落ちたわけではない。むしろ、日本語で書かれた小説の場合はどうなのか気になった。言語に関係ない法則(三幕構成にすること、規則的な力強い鼓動があることなど)もあるのだが、それを導いた経緯が説明されないので、なんとなく研究者自身が欲しい結果ありきで結論を出しているかのように誤解してしまう(そのようなことはないのだろうけど)。根拠が乏しいので、納得できないのが残念なところ。とはいえ、その分野の研究は面白そうだ。日本の小説をターゲットにした本を読みたい。

0
2019年08月05日

Posted by ブクログ

テキスト・マイニングと機会学習によって、米国におけるベストセラー本が持つ特徴を抽出し、過去に出版された本がベストセラーだったかそうでなかったかをその本の内容(テキスト、文体、トピック等)のみで(尤もらしさとともに)判定するアルゴリズムを開発した研究者による著作。
結果(ベストセラー本である(確率が高いと)とアルゴリズムによって判定された本の特徴)そのものは「なるほど、確かにそうかもしれない」と思われるようなもの(三幕構成のように感情の波がある物語、現実的かつ著者自身が詳しいトピックの選択など)が多いが、それがはっきりと言語化(結果データに対する著者の解釈ではあるが)されている点で深みがあると言える。
データ・サイエンティストを目指す立場の視点としては、最終章で言及されている、将来におけるコンピュータによる著作の可能性や、本研究で用いたアルゴリズムの解説の箇所が面白く、勉強になった。後書きで統計家の西内氏が記述するように、形態素解析後のデータから「Iとhimの距離」のような文章の特徴を考えさらなる加工を行う部分などの計り知れない苦労の上に示された結論であることを踏まえると、著者に対して畏敬の念を覚える。
本書を単純に読みものとして読む場合、本書で紹介されている結論は因果関係を示したものではない(「現状」はいずれのタイミングで変わる可能性が多分にある)という点には注意が必要である。

0
2018年08月07日

「小説」ランキング