О статистике каждый волен сложить свое собственное мнение, от восторженно-эйфорического всевластия числовых закономерностей, до прагматического скепсиса их бесполезности. Однако, в любом случае, пренебрегать этим не стоит. Статистика может предоставить ценную фактическую информацию, в особенности, при анализе уникальных явлений. О том, что рассматриваемое явление в какой-то степени уникально, говорит, по крайней мере, сам факт наличия биографии.
Письма Героини, несомненно, часть форумов Башни Магов, а вот насколько это частное не похоже на целое? В качестве материалов к ответу в статье будут рассмотрены основные статистические закономерности на основе анализа архивов форумов "Основной" и "Забор".
2. О сообщениях
"Основной"
"Забор"
Всего сообщений на форуме
12 тысяч
7,4 тысяч
Сообщений Героини
412 (3,4%)
172 (2,3%)
Размер текста форума
3,7 Мб
1,6 Мб
Текст Героини
150 Кб (3,9%)
43 Кб (2,6%)
За время существования Башни в архивах накоплено ни много ни мало почти двадцать тысяч сообщений в сумме по обоим форумам. Письма некоторых особо плодовитых участников могут составлять вплоть до 10-12% общего количества, однако средний показатель активности лежит в пределах 2-4%. Таким образом, количество сообщений Героини на обоих форумах лежит в пределах среднестатистического. Склонность к тусовочной активности на "Заборе" несколько ниже таковой на "Основном" форуме.
3. О длине
"Основной"
"Забор"
Среднее сообщение форума
323 байта
227 байт
Среднее сообщение Героини
373 байта
256 байт
Самое длинное сообщение Героини
3416 байт
1772 байт
Самое короткое сообщение Героини
3 байта
10 байт
Среднее сообщение на "Заборе" примерно на треть короче такового на "Основном" форуме, что не удивительно, учитывая количество коротких реплик. Вновь, хоть усредненная длина сообщения Героини и выше среднефорумной, существенных отличий не наблюдается.
Что касается распределения по длине, наибольшее количество приходится на сообщения менее 0,3 Кб. С увеличением размера число сообщений резко затухает, в результате, писем более 1,5 Кб лишь штучное количество.
Рисунок 1. Распределение писем Героини по длине на форуме "Основной".
Пример распределения приведен на Рисунке 1, аналогичная картина наблюдается и для "Забора", только с большим сдвигом в область коротких длин. Со всей очевидностью, участие Героини в дискуссиях строится на основе реплик и фраз, что, впрочем, вполне соответствует стилю форумов.
4. О типе
"Основной"
"Забор"
Начало веток
5 (1,2%)
1 (0,6%)
Продолжение веток
407 (98,8%)
171 (99,4%)
Всего сообщений Героини
412
172
Если в количестве и размере сообщений не наблюдается существенных статистических отклонений от среднего, то тип сообщений высоко характеристичен. Героиня практически не начинает новых веток дискуссий, пребывая в состоянии ожидания и последующего рассмотрения тем, предложенных другими участниками.
5. Распределение во времени
Очень высокая активность, характерная для начального периода, со временем стабилизируется и выравнивается до некоторого среднего уровня. Именно такая картина наблюдалась как на форуме "Основной" (Рисунок 2), так и на "Заборе", со средней активностью в 1300 и 1100 сообщений в месяц соответственно.
Рисунок 2. Распределение ежемесячного количества сообщений на форуме "Основной".
Средняя активность Героини составляет 46 ("Основной") и 25 ("Забор") сообщений в месяц, причем распределение во времени чутко воспроизводит общие тенденции на форуме (Рисунок 2). Этот факт не противоречит сделанному ранее наблюдению о выжидательной позиции и предпочтению к общению в рамках предлагаемых тем.
6. О грамотности
"Основной"
"Забор"
Общее количество слов в сообщениях Героини
23 тысячи
6,7 тысяч
Количество ошибок
32 (0.14%)
11 (0.16%)
Орфографический анализ привел прямо-таки к завидным результатам: на примерно 30 тысяч слов менее полусотни ошибок. Причем, подавляющее большинство ошибок относится к категории опечаток.
По словам самой Героини, она не пользуется средствами программного контроля орфографии и обладает врожденной грамотностью. Результат, мягко говоря, существенно превышает средний уровень по форуму, где считай каждое второе сообщение грешит существенными расхождениями с классическими правилами русского языка. Кроме того, сравнительный лексический анализ выявил больший словарный запас и более активное использование сложных конструкций (вводные слова, сложносочиненные/ сложноподчиненные предложения и т.д.). Филфак, не иначе.
7. В завершение
Сверхувлечение статистикой вещь довольно опасная, ибо числу потенциально возможных корреляций нет предела. Известно, что даже диаметр орбит планет солнечной системы можно скоррелировать с параметрами элементарных частиц. Дабы не плодить сущности без необходимости, пожалуй, следует остановиться на вышеназванных общих закономерностях. Желающие могут без особого труда углубиться в детали самостоятельно.
На поверку уникальное явление отнюдь не является таковым во всех возможных проявлениях. Скорее это способность сформировать и поддерживать на должном уровне некоторые характеристические признаки при общем следовании руслу сложившихся взаимоотношений. Не обязательно быть уникальным во всем, достаточно нескольких особенностей, но так, чтобы на 99%.
8. Практические детали
Статистический анализ выполнен по архивам форума
"Основной" ||>
за 29.1.2001-1.11.2001 (~9 месяцев) и
"Забор" ||>
за 6.4.2001-1.11.2001 (~7 месяцев).
При работе с текстом использовалось содержимое поля сообщение с удалением тэгов гипертекста и служебной информации.
Для подсчета количества ошибок применялся программный контроль орфографии, проверка пунктуации не проводилась. Все обнаруженные ошибки выверены вручную на предмет жаргона и спецтерминов.