Анализ проводился только над русскоязычными текстами. Минимальный размер обрабатываемой fb2 книги - 50 Кб. За одну страницу принято среднее значение в 1800 символов. Уникальные слова - это все встреченные уникальные слова при разборе (включая слова с ошибками, в разных склонениях, придуманные слова и имена и т.д.)
Суммарные данные анализа:
Всего обработано | 516602 книг |
Суммарная длинна текстов | 208,452,521,824 знаков |
Суммарная длинна диалогов | 57,522,425,226 знаков |
Суммарное количество слов | 31,318,391,978 слов |
Всего страниц | 116,065,130 страниц |
Всего предложений | 2,809,731,514 предложений |
Средние данные книг:
Средняя длинна текста | 403507 знаков |
Средняя длинна диалогов | 111348 знаков |
Среднее количество слов в произведении | 60624 слов |
Среднее количество страниц в произведении | 225 страниц |
Средняя длина слова | 5.29 знаков |
Среднее количество предложений в произведении | 5439 предложений |
Средняя длина предложения | 80 знаков |
Средняя доля диалогов в тексте | 27 % |
Средняя доля авторского текста | 73 % |
СДП диалогов | 69 знаков |
СДП авторского текста | 96 знаков |
Средний активный словарный запас
Всего использовано уникальных слов | 2,499,312 слов |
Средний активный авторский словарный запас (САСЗ) | 12825 |
Средний активный авторский не словарный запас (САНСЗ) | 463 |
Удельный САСЗ на 3000 слов текста | 1488 |
Удельный САСЗ на 10000 слов текста | 3857 |
Удельный САСЗ на 100000 слов текста | 20885 |
Статистика букв и знаков препинания
Всего букв | 165,134,653,377 букв |
Всего знаков препинания | 7,250,238,784 знаков |
Знак | Суммарное количество (шт.) | Суммарное среднее количество на 1000 слов (шт.) |
, запятая | 3,530,266,149 | 112.58 |
. точка | 2,475,870,392 | 80.42 |
- тире | 412,723,589 | 14.04 |
? вопросительный знак | 275,606,778 | 9.27 |
! восклицательный знак | 192,077,852 | 7.01 |
... многоточие | 21,247,127 | 0.83 |
!.. восклицательный знак с многоточием | 5,272,864 | 0.2 |
?.. вопросительный знак с многоточием | 4,219,686 | 0.15 |
!!! тройной восклицательный знак | 1,727,182 | 0.08 |
?! вопросительный знак с восклицанием | 9,964,566 | 0.39 |
" кавычка | 38,830,584 | 1.44 |
() скобки | 64,252,926 | 2.08 |
: двоеточие | 151,639,625 | 5.18 |
; точка с запятой | 66,539,604 | 2.1 |
Буква | Всего (шт.) | Средняя частота использования (в %) |
А | 13,462,324,525 | 8.21 |
Б | 2,765,147,776 | 1.68 |
В | 7,285,578,357 | 4.37 |
Г | 2,844,217,611 | 1.71 |
Д | 4,981,170,427 | 3.02 |
Е-Ё | 13,864,321,341 | 8.38 |
Ж | 2,844,217,611 | 1.71 |
З | 2,776,783,108 | 1.69 |
И-Й | 13,298,591,701 | 7.97 |
К | 5,570,699,807 | 3.41 |
Л | 7,903,954,528 | 4.8 |
М | 5,347,696,211 | 3.24 |
Н | 10,919,240,546 | 6.57 |
О | 18,230,762,116 | 10.98 |
П | 4,662,005,792 | 2.82 |
Р | 7,501,141,369 | 4.49 |
С | 8,881,569,581 | 5.34 |
Т | 10,216,168,547 | 6.21 |
У | 4,607,123,237 | 2.83 |
Ф | 319,700,805 | 0.19 |
Х | 1,501,445,238 | 0.9 |
Ц | 650,784,684 | 0.39 |
Ч | 2,417,406,539 | 1.48 |
Ш | 1,350,167,863 | 0.84 |
Щ | 594,717,719 | 0.35 |
Ь-Ъ | 3,250,202,792 | 1.99 |
Ы | 3,102,418,092 | 1.89 |
Э | 569,851,917 | 0.34 |
Ю | 1,014,838,659 | 0.62 |
Я | 3,560,133,402 | 2.17 |
|
Сумма частей речи
Часть речи | Всего в текстах (шт.) | средний % в текстах |
Существительное | 8,543,905,030 | 23.17 |
Глагол | 2,982,510,821 | 20.7 |
Местоимение-существительное | 2,982,510,821 | 15.72 |
Предлог | 2,259,147,814 | 10.35 |
Союз | 2,719,695,076 | 8 |
Прилагательное | 2,259,147,814 | 5.95 |
Наречие | 1,854,558,570 | 5.68 |
Местоимение-прилагательное | 1,390,186,182 | 4.16 |
Частица | 1,447,110,127 | 3.77 |
Местоименное наречие | 507,009,769 | 1.39 |
Числительное | 179,200,371 | 0.53 |
Числительное-прилагательное | 73,324,638 | 0.16 |
Междометие | 31,547,596 | 0.04 |
Часть композита - сложного слова | 5,050,990 | 0.01 |
Последние комментарии
1 день 5 часов назад
1 день 5 часов назад
1 день 5 часов назад
1 день 5 часов назад
1 день 8 часов назад
1 день 8 часов назад