Размер шрифта
-
+

Код бестселлера - стр. 25

[51], пока не догадаетесь, что все это – сленг из романа Энтони Берджесса «Заводной апельсин». Однако гораздо чаще тематическое облако выглядит примерно как на нашем рис. 2.


Рис. 2


Такие существительные, как глаза, рот, рука, голова, говорят о том, что тема имеет какое-то отношение к телу. Однако просто тело – недостаточно конкретное название. Тело может фигурировать, например, в описании сцены убийства, но это явно не наш случай. Образующие контекст слова на самом краю облака – поцелуи, наслаждение, улыбка, дыхание, постель, ритм, жар – указывают на то, что эта группа существительных описывает любовную сцену. Но это тоже слишком общее выражение. Любовные сцены бывают разные. Большинство писателей утверждает, что правильно описать секс – нелегкая задача, за которую они берутся безо всякого удовольствия. Каждый автор решает ее по-своему, с большим или меньшим успехом. В данном случае нужно заметить, что выбор слов указывает на довольно сдержанный стиль писателя – он явно не злоупотребляет грубостью или откровенностью. Словесные облака, созданные из описаний любовных сцен, показывают, что эти описания сильно различаются: от таких, которые можно не смущаясь читать вслух собственной бабушке, – до таких, какие выдержит лишь закаленный читатель.

Благодаря алгоритму моделирования тем мы получаем два важных результата. Во-первых, компьютер сообщает, какие темы есть в нашем корпусе текстов (в том числе – какие слова составляют каждую из них; примеры мы только что видели в словесных облаках слов «бар» и «тело»). Во-вторых, компьютер определяет долю содержания каждой темы в каждой книге. Мы задали список из пятисот возможных тем, так что вариации тематического состава могут быть огромны. Узнав эти пропорции, мы можем начать поиск закономерностей, типичных для бестселлеров. Это нечто вроде обратного конструирования. Возьмем в качестве метафоры тарелку супа. Компьютер сначала делит его на составляющие – мясо, бульон, капуста, лук, специи, – а затем тщательно измеряет количество каждого ингредиента.

Измерив таким образом содержание ингредиентов, мы начинаем задавать вопросы. Например, можно спросить, какие банки чаще попадаются на страницах бестселлеров – те, что с деньгами, или те, что с вареньем. Или какого типа описания секса чаще встречаются в бестселлерах – совсем откровенные или более сдержанные. Кстати, если вам интересно: чтобы попасть в список бестселлеров NYT, лучше выбирать банки с деньгами, а любовные сцены (если уж без них никак нельзя) – те, которые рисуют душевную близость, а не насилие. Откровенная сцена поможет попасть в бестселлеры, если она продвигает вперед сюжет и взаимоотношения между персонажами. Если сцена добавлена автором для «оживляжа» и на самом деле не нужна для развития сюжета, она, скорее всего, не поможет книге продаваться и, следовательно, лишняя. Возможно, это объясняет, почему доля сексуальной темы в бестселлерах немного ниже по сравнению со всем корпусом текстов.

Страница 25