ジョディ・アーチャーのレビュー一覧
-
-
Posted by ブクログ
ネタバレLDA(潜在的ディリクレ配分法)でトピックモデリングを実施し、その本にどういうトピックが含まれているか、またその他機械学習で売れている本とそうでない本の違いを解析した結果が書かれている。
アルゴリズムが選んだベストセラーになる確率が一番高い本は「デイヴ エガーズ」の「ザ・サークル」だったそう。
ジョン・グリシャム、ダニエル・スティールは多くのベストセラーがあるが、アルゴリズムでも説明できたんだそう。
ニューヨーク・タイムズのベストセラーリストから売れている小説を500冊ほど、それほど売れてない小説を4,500冊ほど選び、それを学習させモデルを作った。4年ぐらい掛けたらしい -
-
-
Posted by ブクログ
500冊のNYタイムズベストセラーとその他のノンベストセラーを読み込んだ傾向と対策の分析。
プロット(感情の上下で示す)に特定のパターンはないが、上下はリズミカルである。もっともそれが優れているのがダヴィンチコードである。多くのテーマはなく、2、3のテーマが物語の1/3までで出てくる。そのテーマは普遍的なもの特に人間関係が多く、複数のテーマ間で対立が描かれることになる。
主人公は、能動的でシンプルな動詞を使う。最近のGIRLが主人公のブームは、女性という今でも制約が多いと思われる状況で、規範から外れた行動と意思を示すことで物語をドライブしていく。
言葉は口語により近く、大仰な言葉遣いは避けられ -
Posted by ブクログ
購入。
アメリカのベストセラーを分析して、その特徴を解説する。
テキストマイニングと機械学習によりニューヨークタイムズ紙のベストセラーリスト掲載書籍とベストセラーにならなかった書籍の違いを分析している。
分析の手法については概要を述べるに留まるので、専門知識がなくても理解できるように書かれている。手法について興味があれば、どのような用語を調べればいいかが解説で案内される。
ジャンルとトピックのどちらを分析に使うべきか、という部分に気づきがあった。また分析には使われていないがBISACという書籍の内容を示すコードがある。この存在を初めて知った。 -
Posted by ブクログ
ネタバレ印象的な箇所のまとめ
・作家にはその作家特融のトピックがあり、読者はそれを求めている。トレードマークのトピックで3分の1を埋めた後は、残りの3分の2を別のトピックでうめて変化をつければ、それまでの本とは違う印象になる。この方程式はずっと続けてていくことができるし、実際、見事に守られている。大切なのは割合だ。3分の1は同じトピック、3分の2は別のトピック。
・小説の語る内容でなく、小説が体験させてくれる内容に大半の読者は反応する。
・ベストセラーの登場人物は積極的に行動し、感情を表現する。そうでない小説の登場人物は受動的。
・ベストセラーのキャラクターは正しいこtこを正しい方法で行うだけ -
-
Posted by ブクログ
ベストセラーとなる小説にアルゴリズムは存在するのかをITを使って突き詰めた本。それらしい法則が提示されるが、自分は腹に落ちたわけではない。むしろ、日本語で書かれた小説の場合はどうなのか気になった。言語に関係ない法則(三幕構成にすること、規則的な力強い鼓動があることなど)もあるのだが、それを導いた経緯が説明されないので、なんとなく研究者自身が欲しい結果ありきで結論を出しているかのように誤解してしまう(そのようなことはないのだろうけど)。根拠が乏しいので、納得できないのが残念なところ。とはいえ、その分野の研究は面白そうだ。日本の小説をターゲットにした本を読みたい。
-
Posted by ブクログ
テキスト・マイニングと機会学習によって、米国におけるベストセラー本が持つ特徴を抽出し、過去に出版された本がベストセラーだったかそうでなかったかをその本の内容(テキスト、文体、トピック等)のみで(尤もらしさとともに)判定するアルゴリズムを開発した研究者による著作。
結果(ベストセラー本である(確率が高いと)とアルゴリズムによって判定された本の特徴)そのものは「なるほど、確かにそうかもしれない」と思われるようなもの(三幕構成のように感情の波がある物語、現実的かつ著者自身が詳しいトピックの選択など)が多いが、それがはっきりと言語化(結果データに対する著者の解釈ではあるが)されている点で深みがあると言