Наглядная статистика. Используем R! [Коллектив Авторов] (pdf) читать постранично

Книга в формате pdf! Изображения и текст могут не отображаться!


 [Настройки текста]  [Cбросить фильтры]

А. Б. Шипунов, Е. М. Балдин, П. А. Волкова,
А. И. Коробейников, С. А. Назарова,
С. В. Петров, В. Г. Суфиянов

Наглядная
статистика
Используем R!

26 июля 2020 г.
(исправленная версия)

Оглавление
Предисловие . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

7

Глава 1. Что такое данные и зачем их обрабатывать?
1.1. Откуда берутся данные . . . . . . . . . . . . . . . .
1.2. Генеральная совокупность и выборка . . . . . . . .
1.3. Как получать данные . . . . . . . . . . . . . . . . .
1.4. Что ищут в данных . . . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

10
10
12
13
17

Глава 2. Как обрабатывать данные . . . . . . . . . . .
2.1. Неспециализированные программы . . . . . . . .
2.2. Специализированные статистические программы
2.2.1. Оконно-кнопочные системы . . . . . . . . .
2.2.2. Статистические среды . . . . . . . . . . . .
2.3. Из истории S и R . . . . . . . . . . . . . . . . . . .
2.4. Применение, преимущества и недостатки R . . .
2.5. Как скачать и установить R . . . . . . . . . . . .
2.6. Как начать работать в R . . . . . . . . . . . . . .
2.6.1. Запуск . . . . . . . . . . . . . . . . . . . . .
2.6.2. Первые шаги . . . . . . . . . . . . . . . . .
2.7. R и работа с данными: вид снаружи . . . . . . . .
2.7.1. Как загружать данные . . . . . . . . . . . .
2.7.2. Как сохранять результаты . . . . . . . . .
2.7.3. R как калькулятор . . . . . . . . . . . . . .
2.7.4. Графики . . . . . . . . . . . . . . . . . . . .
2.7.5. Графические устройства . . . . . . . . . . .
2.7.6. Графические опции . . . . . . . . . . . . . .
2.7.7. Интерактивная графика . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.

21
21
22
22
24
24
25
27
28
28
29
30
30
36
37
38
40
42
43

Глава 3. Типы данных . . . . . . . . . . . . . . . . . . . .
3.1. Градусы, часы и километры: интервальные данные
3.2. «Садись, двойка»: шкальные данные . . . . . . . .
3.3. Красный, желтый, зеленый: номинальные данные .
3.4. Доли, счет и ранги: вторичные данные . . . . . . .
3.5. Пропущенные данные . . . . . . . . . . . . . . . . .
3.6. Выбросы и как их найти . . . . . . . . . . . . . . .

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.
.
.
.

46
46
49
50
56
59
61

4
3.7.
3.8.

Меняем данные: основные принципы преобразования .
Матрицы, списки и таблицы данных . . . . . . . . . .
3.8.1. Матрицы . . . . . . . . . . . . . . . . . . . . . . .
3.8.2. Списки . . . . . . . . . . . . . . . . . . . . . . . .
3.8.3. Таблицы данных . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.

.
.
.
.
.
.

62
64
64
66
68

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.
.
.

73
73
83
84
88
91

Глава 5. Анализ связей: двумерные данные . . . . . .
5.1. Что такое статистический тест . . . . . . . . . . . .
5.1.1. Статистические гипотезы . . . . . . . . . . .
5.1.2. Статистические ошибки . . . . . . . . . . . .
5.2. Есть ли различие, или Тестирование двух выборок
5.3. Есть ли соответствие, или Анализ таблиц . . . . .
5.4. Есть ли взаимосвязь, или Анализ корреляций . . .
5.5. Какая связь, или Регрессионный анализ . . . . . .
5.6. Вероятность успеха, или Логистическая регрессия
5.7. Если выборок больше двух . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

95
95
95
96
97
103
110
115
125
128

Глава 6. Анализ структуры: data mining . . . . . . . . . . .
6.1. Рисуем многомерные данные . . . . . . . . . . . . . . . .
6.1.1. Диаграммы рассеяния . . . . . . . . . . . . . . . .
6.1.2. Пиктограммы . . . . . . . . . . . . . . . . . . . . .
6.2. Тени многомерных облаков: анализ главных компонент
6.3. Классификация без обучения, или Кластерный анализ .
6.4. Классификация с обучением,
или Дискриминантный анализ . . . . . . . . . . . . . . .

144
144
145
148
151
157

Глава 4. Великое в малом: одномерные данные
4.1. Как оценивать общую тенденцию . . . . . .
4.2. Ошибочные данные . . . . . . . . . . . . . .
4.3. Одномерные статистические тесты . . . . .
4.4. Как создавать свои функции . . . . . . . . .
4.5. Всегда ли точны проценты . . . . . . . . . .

.
.
.
.
.
.

.
.
.
.
.

166

Глава 7. Узнаем будущее: анализ временных рядов
7.1. Что такое временные ряды . . . . . . . . . . . . .
7.2. Тренд и период колебаний . . . . . . . . . . . . .
7.3. Построение временного ряда . . . . . . . . . . . .
7.4. Прогноз . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

175
175
175
176
183

Глава 8. Статистическая разведка . . .
8.1. Первичная обработка данных . . .
8.2. Окончательная обработка данных
8.3. Отчет . . . . . . . . . . . . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

192
192
192
193

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

5
Приложение А. Пример работы в R . . . . . . . . . . . . . . 198
Приложение Б. Графический
Б.1. R Сommander . . . . . .
Б.2. RStudio . . . . . . . . .
Б.3. RKWard . . . . . . . . .
Б.4. Revolution-R . . . . . . .
Б.5. JGR . . . . . . . . . . .
Б.6. Rattle . . . . . . . . . .
Б.7. rpanel . . . . . . . . . .
Б.8. ESS и другие IDE . . .

интерфейс (GUI) для
. . . . . . . . . . . . . . .
. . . . . . . . . . . . . . .
. . . . .