В статье Gum-фикшн Кирилл Куталов пишет "Под репликой здесь следует, по-видимому, понимать достаточно широкий спектр текстов, начиная с собственно реплик в гостевых и заканчивая философскими и формально философскими статьями".
Здесь мы и рассмотрим спектры длин некоторых текстов. Ниже приведен спектр размеров откликов в гостевых.
Использовались 20 тысяч сообщений из гостевых Тенет-Ринета'2000. Жирная желтая линия изображает суммарные данные, двадцать тонких черных линии - данные по каждому множеству из 1000 последовательных сообщений.
Наиболее типичный размер отклика ("мода") -- 10-15 слов. Это отклики длиной в одно предложение. Средняя же длина отклика составляет 86 слов. Среднее значение для этого распределения превосходит самое частое ("модальное"), это связано с "хвостом" длинных сообщений. Реплики в пьесах, возможно, распределены компактнее, это можно проверить. Для диалогов "Тенет" характерны очень длинные монологи, возможно, за счет интенсивного цитирования. Медианное значение достигается на сообщениях из 30-ти слов.
Тип распределения - логнормальный. Сходным образом распределены длины предложений и длины абзацев.
В среднем отклик равен по размеру 1.5-2 "абзацам" Льва Толстого. Тип распределения легко объяснить, исходя из закона Вебера-Фехнера. Человек отчетливо воспринимает сигналы как различные, когда характеристики этих сигналов, например, частота или интенсивность отличаются на порядок. То есть внутри наших органов чувств сидит логарифмирующее устройство, которое оценивает "порядок величины". Можно предположить, что размеры текстов мы тоже оцениваем как "маленькие", "средние" и "большие", при этом размеры эти различаются на порядок. Например, до 36-ти слов -- "маленькие" (15 слов -- это "одно предложение", 36 слов - средний абзац у Льва Толстого, считая абзацами и реплики диалогов), до 360 слов, т.е. 2-10 абзацев -- "средние" и от 360 и выше - "большие". Все ткие классификации довольно условны. Существует некоторый "оптимальный" средний размер сообщения, и около
С чем связаны такие размеры откликов? Возможно, со "скромностью" читателей, которые не рискуют сказать больше одного-двух предложений. Хотя при чтении гостевых атмосфера общей "скромности" как-то не чувствуется. Возможно, это связано с принципом наименьшей затраты труда. Читатель способен передать суть отклика в одной-двух фразах, зачастую, весьма эмоционально. Или это связано с привычкой за одно сообщение выразить одну мысль.
Любопытно, что те же средние размеры характерны для анекдотов. Однако, разброс размеров анекдотов намного меньше (логарифмическая дисперсия составляет 0.68, в то время, как у откликов она вдвое выше - 1.2-1.8, что означает в десятки (точнее?) раз больший разброс размеров).
Кумулятивный или "накопленный" спектр:
Выводы: 75% всех сообщений имеют размер, не превосходящий 100 слов. На таких сообщениях не включается худломер. Худломер включается для 25% сообщений, то есть для каждого четвертого. По-видимому, это избыточное число. Если включать худломер только на сообщениях длинее 200 слов, то он будет измерять характеристики только 10% сообщений. Увы, худломер не является особенным стимулом, поощряющим писать длинные сообщения. Длина 60% сообщений не превосходит 50 слов. Таким образом Зиновий Гольдберг, который включался для длин сообщений между 50 и 100 слов, отвечал на 15% постов.
Следует отметить, что типичные длины откликов многократно уступают традиционной критической "статье", что легко видеть, если хотя бы измерить длины статей в разделе "Литературно-критические статьи". Или, скажем, обзоры Кирилла Куталова, Льва Пирогова, Макса Фрая, Сергея Чернодятлова. Правда, если измерить отдельно длины отзывов на каждую работу, то вряд ли их распределение будет отличаться от распределения длин откликов в гостевых. Статьи становятся "длинными" за счет обзоров, и если Куталов посвящает статью, как правило, двум работам, то Пирогов и Фрай рассматривают десяток.
Традиционные статьи, вероятно, можно уподобить "длинным словам", они редки, и сравнительно "новы", то есть очень содержательны. Возможно, процент длинных откликов и статей коррелируется с общей "серьезностью" или стилем дискуссии.
Впрочем, число статей критиков не создает сильной аномалии на фоне 15 тысяч откликов. Они сравнительно "длинные" (например, в статье Кирилла Куталова "Gum фикшн" более 1000 слов), и судя по графику, должны появляться не часто. Написать 15 тысяч статей статей о сетературе -- это было, конечно, здорово, но это не кажется реальным в ближайшие 15 лет. Этих статей не 1.5 тысячи, не 150, их около 50. То есть аномалия, конечно, есть, но не очень сильная. Наблюдается вот какая инверсия. Раньше первыми читали книгу критики, opinion leaders. Они начинали дебатировать о какой-нибудь книжке, испуская сигналы в виде статей и призов, СМИ распространяли их мнения, затем книжки читала публика. В Тенетах-Ринете'2000 получилось иначе. Сама публика, сама читающая среда, активно читает некоторый процент текстов и поднимает вокруг них шум. Параллельно критики обсуждают совсем другие работы. По поводу горячо обсуждаемых работ, кто-то высказался, что опасается их читать, пока не стихнут дебаты, чтобы на впечатление от работы не наложились впечатления от дебатов. (И правда, задача критиков -- воздействовать на читателей, а не самим подвергаться их воздействию :) У тех, кто прочитал и отозвался уже, отзывы критиков вызывают умеренный резонанс. Нет даже особенной полемики. По всей видимости, критики воздействуют в первую очередь тех, кто еще НЕ читал.
Естественно также предположить, что разные авторы пишут, как правило, сообщения разного размера. Например, Дорфман, Вербицкий и Радуга пишут развернутые отзывы, в то время, как КШ зачастую ограничивается короткой репликой.
Желтая линия - суммарное распределение, красная сплошная - Дорфман, красный пунктир - Вербицкий, черная сплошная - КШ, а также еще один автор. Суммарное распределение практически совпадает с распределением для Федора Меркурьева и Леонида Делицына (у Делицына в среднем сообщения немного длиннее). Можно предположить, что Дорфман и Вербицкий специально пишут только длинные, содержательные сообщения ("монологи"), не вступая в перепалку ("диалоги"). В то же время КШ и ряд других авторов, наоборот, предпочитают короткие реплики. Размер их сообщений редко превышает 100 слов и почти никогда не превышает 200 слов.
Таким образом дискурс представляет собой сумму сообщений авторов, "вещающих" в полосе разной ширины (Делицын и Меркурьев - "широкополосные", Вербицкий, Дорфман, Шаповалов - "узкополосные"), а также с разной интенсивностью. Например, только 100 сообщений принадлежат Дорфману, Вербицкому - 200, Меркурьеву - 700, Делицыну - 2 тысячи.
Существуют тэги для разметки дискурсов и софт для их исследования, но я не успел еще в этом разобраться.
Встает вопрос об оптимальном размере гостевой книги. Кажется правильным подбирать такой размер гостевой, чтобы в нее попадал хотя бы один, достаточно длинный, отзыв.