東雲製作所

東雲長閑(しののめのどか)の投資と評論サイトです。ジオシティーズ(http://www.geocities.jp/shinonomenod/)から移転してきました。

コンピューターにできること――ベストセラーコード感想

 『ベストセラーコード 「売れる文章」を見きわめる驚異のアルゴリズム』(ジョディ・アーチャー&マシュー・ジョッカーズ著、解説西内啓、川添節子訳、日経BP社)はアメリカのベストセラーをコンピューターを用いて分析した本だ。テーマ、プロット、文体、キャラクターの4つの観点からベストセラーとそうでない作品を分析し、ベストセラーに固有の特徴を抽出している。
 コンピューターが導き出したベストセラーの特徴は下記の通りだ。

1)テーマ:1/3は結婚、死、税金、テクノロジーなど市場の本流で受けるメイントピックにあてる。2番め以降のトピックは現状を脅かすような衝突を示すものが良い。
2)プロット:規則的で力強く感情がアップダウンするプロットにする。
3)文体:普通の人々の日常の言葉で書く。
4)キャラクター:主体的に行動し、強い推進力を持ったキャラクターを主人公にする。

 結論だけ聞くと、まあそうだろうな、と思うものばかりだ。本書が面白いのは、コンピューターにテーマ、プロット、文体、キャラクターの違いを把握させる方法の部分だ。人間なら簡単に判断できることでも、コンピューターにやらせるには工夫が必要だ。

 テーマの判別には単語に複数の意味があるということが障害となる。例えば、 bankという単語には「銀行」の他に「岸」という意味もあるので、単語だけではどういうテーマなのか判断できない。本書では複数の関連する単語を用いて判断するという手法を用いている。bankのそばにmoneyといった語があれば金融に関する内容であり、river,fishといった語があれば釣りに関するトピックだと判断したのだ。

 キャラクターの分析は筆者が最も難しかったと記している。確かにキャラクターが魅力的かどうか定量的に示してくれと言われたら、頭を抱えてしまう。本書では、キャラクターの名詞・代名詞といっしょに使われる動詞を調べるという手法で、キャラクターがどのように行動しているかの分析を行った。その結果、ベストセラーではneed,wantという欲求に関する動詞が非ベストセラーの二倍も使われていることが分かったのだという。

 私が最も刺激を受けたのがプロットの分析だ。プロットの分析にはポジティブな感情をあらわす言葉とネガティブな感情をあらわす言葉に注目しながら物語を読むというセンチメント分析の手法が用いられた。
 プロットの分析と言うと、通常は各シーンの構造を分析し「日常の世界」「第一関門突破」「最も危険な場所への接近」といった抽象的なパターンに当てはめていくので、コンピューターには手に負えないのではないかと思っていた。だが、本書ではポジティブ、ネガティブというたった一軸の分析だけで、物語を「喜劇」「悲劇」「成長物語」「再生」「旅と帰還」「探求」「モンスター退治」の七パターンに分類してしまった。脱帽だ。
 ただ、ポジティブ、ネガティブの一軸だけで判断できるのは、人間の作家がある程度のストーリーの整合性を整えているからだろう。単にポジティブ・ネガティブな単語だけで判断するなら、光り輝く部屋と真っ暗な部屋を一分ごとに行ったり来たりしているだけの小説でもコンピューターは満点だと判断してしまうのではないか。

 本書にはコンピューターが選んだベストセラーの条件への一致度が高い小説ベスト100も掲載されている。面白いのは必ずしもベストセラーの条件への一致度が高い程売れているわけではないことだ。
 トップ10のうち、2~5,7,8位は邦訳がない。1位はデイヴ・エガーズザ・サークル』(吉田恭子訳、早川書房)で、エマ・ワトソントム・ハンクス主演で映画化されたそうだが、原作ともどもヒットしたとは言いがたいだろう。24位の『ゴーン・ガール』より上位には聞いたことがある作品が一つもなかったし、世界的ベストセラーの『ダ・ヴィンチ・コード』はトップ100に入ってすらいない。
 この結果から分かることは、おそらく、ベストセラーになるにはある程度ベストセラーの条件を満たしている必要があるが、条件への一致度が高ければ高い程売れるわけではないと言うことだ。
 ベストセラーの条件とベストセラーが一致していないのは何故なのか。宣伝など外部条件のせいであり、著者名を伏せて読ませたら『ザ・サークル』がベストだと考える人が最も多くなるのか。それとも、コンピューターが分析しきれていない他の重要な要素があるのだろうか。

 大ベストセラーには、今までの本にはない、革新的な部分が含まれている。例えば、『ハリーポッター』はファンタジー小説に最新のエンタメテクニックを導入してアップデートした点が革新的だった。既存の児童文学のようなファンタジーではなくもっとエンターテイメント性が高いファンタジーが読みたいというティーンの欲望を捉えたおかげで、世界的大ベストセラーになったのだ。
 爆発的に売れるのは、読者のニーズはあるのに今まで存在していなかった本だ。大ベストセラーを産みだすには読者の潜在的なニーズを読み取る必要がある。

 本作には機械が小説を書く試みについても記されているが、読者の潜在的ニーズを捉えた革新的なアイデアを産みだすのは機械が小説を書く際の高いハードルになるのではないだろうか。潜在的ニーズは過去の作品の分析からは見出すことができない。コンピューターが読者の潜在的ニーズを捉えるためには、過去の人間ではなく今生きている人間がどのような不満や欲望を感じているか知る必要があるからだ。

 ボードゲームでAIが急速に進化したのは、勝利条件が明確であり、コンピューターが自ら良い手かどうかを判断して自己学習を積み重ねることができるからだ。一方、小説はコンピューターが自ら生み出した作品を面白いかどうか自分で判断することができない。過去の作品の分析に則って考えれば面白いだろうと推測することは出来ても、今の読者にとって本当に面白いかどうかは人間が読んで確かめねばならないのだ。そこが創作AI進化のボトルネックになるのではないだろうか。

 

ベストセラーコード

ベストセラーコード