23/04 ТЕАТР ТЕНЕТ (c) Барышня Анюта 22/07 Обновлено.
Активность действующих лиц мистерии Тенета-Ринет'2000

(таблицы здесь)

Красным цветом показаны результаты за 22 июля (30 тысяч откликов), зеленым - за 23 апреля (10 тысяч откликов). По вертикали отложена относительная частота высказываний авторов. Я попытался учесть псевдонимы. Кроме того, использовались только два первых слова каждого псевдонима.

Очевидно, что за прошедшие три месяца несколько ослабла относительная интенсивность ведущей "десятки". По всей видимости, за короткий период времени интенсивность "десятки" может быть высока, а затем рецензент может на длительный срок покинуть обсуждения. Постоянной сохраняется активность только у "служебного персонала" (крайняя левая верхняя точка) и "среднего пользователя" (прямолинейный участок справа внизу).

Несколько наблюдений:

Не исключено, что изменить характер распределения нельзя. В любом, достаточно длинном тексте частоты слов распределены по закону Ципфа, этот закон максимизирует объем переданной информации при постоянной длине сообщения. Или, иными словами, минимизирует длину сообщения при заданном объеме информации. При этом некоторым "словам" или "действующим лицам" приходится выполнять роль служебных, оставлять служебные сообщения.

Возможно, это свидетельствует о необходимости "двигателей" или "детонаторов" дискуссий. Возможно, это означает также невозможность увеличить активность действующих лиц без специального, активного вовлечения участников в обсуждения звездами. До тех пор, пока читатель не промолвил хотя бы одно слово, его нельзя втянуть в дискуссию. После того, как в дискуссию втянуто семь новых читателей и "звезда" ответила на пост каждого, получаем повторение закона Ципфа, то есть ведущему приходится работать "за семерых". 12/05. Суммарные гистограммы оценок для авторов разной степени раскрученности.

По горизонтали: оценки. По вертикали: число поставивших такую оценку.
Красная линия - "не знаю этого автора" (3370 голосов, средняя оценка 3.5, дисперсия: 3.77:)
Зеленая линия - "знаю этого автора" (4012 голоса, средняя оценка 4.097, дисперсия 4.86)
Синяя линия - общее число заданных вопросов (8381 голосов)
(еще некоторое количество опрошенных на вопрос не ответили) 9/05. Гистограммы оценок для авторов разной степени раскрученности.

По горизонтали: оценки. По вертикали: число поставивших такую оценку.
Черный пунктир - "не скажу" (801 голос)
Красная линия - "не знаю этого автора" (2906 голосов)
Зеленая линия - "знаю имя" (644 голоса)
Синяя линия - "читал(а)" (898 голосов)
Желтая линия - "читал(а), нравилось" (1373 голоса)

ВЫВОДЫ:
Равномерное распределение оценок для "нейтральных" случаев: Распределение оценок для ответов "читал", "знаю имя" и "не скажу" -- близко к равномерному, на оценке "6" наблюдается небольшой "провал".
Тройки -- новичкам. Много новых авторов. Типичная оценка нового автора - "3". Может быть связана со средним уровне работ таких авторов, а может -- с их неприятием.
Семерки - фаворитам. Если предположить, что влияние накруток невелико, то можно сделать вывод, что за фаворитов читатели голосуют в 1.5 раза охотнее, чем за тех авторов, которых читали без особенного удовольствия или тех, про кого слышали, но не читали.
Колы в спину старым знакомцам: Авторам, которых голосующие уже читали без удовольствия, в 2-3 раза чаще ставят "единицы". При этом число пятерок и семерок не превышают число других оценок, т.е. уже известному автору сложно "восхитить" тех, кому он не нравился раньше. Реабилитироваться сложно.

5/05. Распределение числа поданных работ по городам.

Города отсортированы по убыванию числа поданных работ. По оси x - порядковый номер города, по оси y - число работ. Города, общим числом 87, были указаны при номинации 580 работ. Это 60% от общего числа номинаций. Можно предположить, что всего городов более 100, и этот прогноз обозначен красной пунктирной линией. Из 36 городов подано не менее 2-х работ. Вот их список:

Москва и обл. 124
Петербург 30
Киев 16
Казань 14
Екатеринбург 14
Таллинн 8
Нью-Йорк 8
Новосибирск 7
Херсон 6
Иерусалим 6
Амстердам 5
Базель 5
Алма-Ата 5
Омск 5
Пермь 4
Луганск 4
Одесса 3
Нижний Новгород 3
Петрозаводск 3
Минск 3
Владимир 3
Хабаровск 3
Бостон 3
Севастополь 3
Сан-Франциско 3
Тель-Авив 2
Ярославль 2
Кельн 2
Воронеж 2
Филадельфия 2
Запорожье 2
Ставрополь 2
Кемерово 2
Чита 2
Бремен 2
Тбилиси 2

Интересно сравнить этот список с населенностью 25 крупнейших городов России (данные 1996):

Москва - 8717000
Петербург 4838000 
Нижний Новгород 1383000 
Новосибирск 1369000 
Екатеринбург 1280000
Самара 1184000
Омск 1163000 
Уфа 1094000 
Челябинск 1086000 
Казань 1085000
Пермь 1032000
Ростов-на-Дону 1026000
Волгоград 1003000
Воронеж 908000
Саратов 895000
Красноярск 869000
Тольятти 702000
Ульяновск 678000
Ижевск 654000 
Краснодар 646000
Владивосток 632000
Ярославль 629000 
Хабаровск 618000
Барнаул 596000 
Иркутск 585000 
Разумеется, еще более показательны были бы данные по числу подключенных к Интернету пользователей в разных городах.

5/05. Интенсивность обсуждений как функция дисперсии оценок читателей.

Учитывались только те работы, за которые проголосовало не менее 20 человек, и которые обсуждались не менее 10 дней. Таких работ в конкурсе Тенета-Ринет'2000 на сегодняшний день 36. Наблюдается экспоненциальный рост числа сообщений с ростом дисперсии оценок. Дисперсия оценок ограничена величиной "12.25", т.е. когда половина судей ставит "7", и вторая половина - "0" (49/2 - 3.5*3.5=12.25). Однако работ, "спорных" до такой степени на конкурс пока что не номинировано (виртуальный КШ?). По-видимому, дисперсия оценок может служить мерой "энергии" текста. (В пользу этой гипотезы можно также привести график распределения вероятности интенсивности обсуждения в гостевх работах. Это экспоненциальное распределение).
ВЫВОД: "спорные" работы легко раскручиваются и требует лишь минимальной начальной раскрутки. Дальше в игру вступает читательская стихия. Для определения степени спорности работы требуется собрать разнородное жюри, числом около 20 человек. Вероятно, при тщательном подборе судей, можно обойтись и меньшим их числом. Не исключено, что страсти вспыхивают с особенной силой, если жюри принимает решение, устраивающее только меньшинство.

1/05
Число откликов как функция "возраста" работы на конкурсе (в днях).

Красными кружками показаны работы, за которые отдано не менее 20 голосов.

  1. Очевидно, что работы эти -- "старые", подавляющее большинство красных кружков провело на конкурсе не менее двух недель. Синими крестиками показаны все остальные работы.
  2. Для красных кружков не наблюдается какой-либо зависимости числа сообщений (messages) от возраста работы на конкурсе, кроме того, что все такие работы набрали не менее 4-х откликов. Разброс интенсивности обсуждений очень велик, занимая практически весь диапазон возможных значений, и это вынуждает предположить, что различия числа обсуждений для "красных кружков" не случайны, но определяются каким-то неизвестным нам параметром. Будет показано, что этот параметр -- дисперсия оценок работы читателями.

В эти работы друзьями и родственниками "инвестировано" уже достаточно энергии, чтобы дальше они раскручивались самостоятельно. Есть среди них "безусловно сильные" и "безусловно слабые" работы, а есть "спорные", по поводу которых будут вестись самые интенсивные дебаты, и которые привлекут максимальную известность самостоятельно, в ходе обсуждений. "Минимальные инвестиции" составляют, судя по всему, не менее 4-х откликов. Отклики отображаются в "ленте откликов" и ведут себя как рекламные баннеры.

Число голосов как функция от ранга работы. По горизонтали отложен ранг -- порядковый номер работы, работы отсортированы по числу голосов.

Красные крестики -- число голосов, отданных за конкурсные работы. Синие крестики - число отзывов в гостевых. Черная линия -- результаты голосования за сетевых звезд ЗРИ'99. В ЗРИ'99 за сетевых звезд голосовало порядка 5000 человек. Сетевые звезды "раскручены" значительно лучше конкурсных работ. График числа голосов, отданных за конкурсные работы, соотвествует случаю голосования "узкого круга лиц" ("ЛИТО"), когда каждую работу, скажем, первой сотни прочитало "все ЛИТО". По ходу конкурса, по мере роста числа рецензий, после оглашения победителей ситуация будет меняться в пользу победителей ("победитель забирает все"), а график, вероятно, будет приближаться к графику ЗРИ'99.

"Синяя" кривая ведет себя практически так же, как черная. А черная ведет себя так же, как состояния 400 богатейших людей мира (Forbes 400). Таким образом, интенсивность обсуждения в гостевых отражает некоторый "капитал" конкурсных работ. Этот "капитал" пропорционален трафику гостевых, т.е. объему рекламы, который получила конкурсная работа.

Число голосов как функция от числа откликов

Синие квадратики -- работы с дисперсией откликов ниже 4, красные - 4 и выше.

Число голосов, по-видимому, прямо пропорционально числу откликов (рекламе) до тех пор, пока голосующая аудитория не исчерпывается. После этого дальнейшее обсуждение в той же аудитории увеличивает число откликов очень слабо (the law of diminishing returns). Не менее 20 раз проголосовали за 36 работ, не менее 10 раз -- за 141 работу, не менее 5 раз -- за 291 работу.

9/05. Гистограммы оценок для авторов разной степени раскрученности.
При голосовании читатели отвечали, насколько хорошо они знакомы с творчеством автора, и ставили автору оценку. По умолчанию на оба вопроса выбирается ответ "не скажу", то есть отказ от ответа. Это позволяет избежать перекоса ответов в стороны заранее выбранного значения. Подсчитаны сводные распределения голосов по всем работам. Такие распределения отражают ситуацию "в среднем". Число проголосовавших за каждую работу пока что не превышает 70. Общее же число голосов
По горизонтали: оценки.
По вертикали: число поставивших такую оценку.
черныйне скажу801
красныйне знаю этого автора2906
зеленыйзнаю имя644
синийчитал(а)898
желтыйчитал(а), нравилось1373

ВЫВОДЫ:
Равномерное распределение оценок для "нейтральных" случаев: Распределение оценок для ответов "читал", "знаю имя" и "не скажу" -- близко к равномерному, на оценке "6" наблюдается небольшой "провал".
Тройки -- новичкам. Много новых авторов. Типичная оценка нового автора - "3". Возможные причины:
  1. Объективно "троечный" уровень работ новых авторов.
  2. Прием любых "новеньких" в штыки "тусовкой". При этом плохие оценки получат и "новаторские" работы новичков. Однако, для "новаторских" работ более характерным было бы распределение оценок "блюдцем", так же как для оценок "спорных".
Я склонюсь к первой причине: "посредственному" уровню работ многих новичков. Среди них добрый десяток кишит даже орфографическими ошибками. Исходя из колоколообразного распределения можно предположить, что работы большинства новичков не вызовут особенно бурных обсуждений. Это и наблюдается. Дискуссии кипят вокруг очень ограниченного числа работ. Оживленные дискуссии могли бы вызвать работы новаторские, например, работы "младолитераторов", однако в этом году они не присутствуют в конкурсе. Работы же более или менее профессиональные, например, тексты Коробова, Немирова, Нестеренко, Саканского, Сухотина, Федотова вызывают продолжительные обсуждения. Если разделить работы на две категории: работы "известных" авторов и работы "неизвестных" авторов, то оценки работ "известных" авторов распределены "блюдцем", а оценки работ "неизвестных" авторово - колоколом.
  1. Возникает соблазн сказать, что "известность" создается спорными работами. (Процент таких работ?)
  2. Вместе с тем, частично такое распределение обусловлено тем, что просто механически смешиваются оценки "всеобщих любимцев" и "знаменитых" негодяев. Примеры: Гильфанов/Петров и Сандберг/Неустроев. (Процент таких работ?) По какой причине может стать известен очень "плохой" автор? Например, по причине особенной настырности, эпатажа, использования запрещенных приемов (Армалинский, Бальмина).
Так или иначе, "троечники" имеют свойство со временем диссипировать и не выходить из безызвестности. Вероятно, известность означает, что "сигнал" автора был достаточно силен, чтобы заставить этого автора "любить" или "ненавидеть" В "стихотворных" категориях средние оценки работ "новичков" несколько ниже, чем в нестихотворных. Дополнительные данные можно получить, изучая распределение оценок в ЛИТО им. СТЕРНА для "известных" и "новых" авторов. Интересно было бы также проследить, улучшаются ли оценки с течением времени. Мое личное впечатление: "звезда" обычно сразу получает максимальные оценки.
ПОЛЯРИЗАЦИЯ ОЦЕНОК
Семерки - фаворитам. Если предположить, что влияние накруток невелико, то можно сделать вывод, что за фаворитов читатели голосуют в 1.5 раза охотнее, чем за тех авторов, которых читали без особенного удовольствия или тех, про кого слышали, но раньше не читали.
Мы не знаем точно, сколько читателей воздержалось от голосования. Большинство читателей могли ознакомиться с работой до конкурса. Одна из проблем состоит в том, что мы не знаем, какой процент работ и авторов на самом деле уже известен читателям, а за какие они просто не хотят голосовать. Вероятно, различные гипотезы можно будет проверить разделив голоса по разделам. За "нестихотворные" категории, чтение которых требует бОльших затрат труда обычно так и голосуют. То есть читатели журналов приходят проголосовать за понравившиеся/непонравившиеся им произведения. Работы в "стихотворных" категориях прочитать легче, поэтому доля оценок за новые работы возрастает. Колы в спину старым знакомцам: Авторам, которых голосующие уже читали без удовольствия, в 2-3 раза чаще ставят "единицы". При этом число пятерок и семерок не превышают число других оценок, т.е. уже известному автору сложно "восхитить" тех, кому он не нравился раньше. Реабилитироваться сложно.
Наблюдается явная "поляризация" оценок. Читатели выбирают "крайние" оценки, "7" для своих фаворитов и "1" для тех, кто им не нравится, в ущерб значениям от 2 до 6.

Создается впечатление, что за фаворитов читатели голосуют охотнее, чем за авторов, которые им не нравятся. Возможно, это связано с тем, что "хорошая" работа и "хороший" автор стихийно рекламируются. К сожалению, точно проверить эту гипотезу в "Тенетах" нельзя (? ср. средн. балл и число голосов. Больше всего голосовали за Рупасова). Однако, для этого можно привлечь данные ЛИТО им. СТЕРНА. Кроме того, ряд читателей приходит только проголосовать за "своих" и не голосует больше ни за какие работы.

Конкурсы, которые используют "народное" голосование. В конкурсе "Большая Буква", где в первом туре работы отбирает "народное" голосование, работы подают анонимно, то есть все авторы считаются неизвестными (красная линия). При этом теоретически "фора" народным кумирам исключается. Обеспечивается инициация авторов-победителей. Тем не менее, обеспечить анонимность всем авторам, особенно, уже известным авторам, невозможно, потому что выраженный, узнаваемый авторский стиль является одним из основных достоинств работы. А поскольку материальный успех необязательно сопутствуют стилю, можно предположить, что известные авторы, попытаются участвовать в сколько-либо "богатых" конкурсах под псевдонимами. Букер