На сайте доступно для скачивания более 5 000 студенческих работ.

Здравствуйте! Мы рады приветствовать Вас на сайте «Планетастудентов.рф» Главная цель этого сайта - максимально облегчить учебную жизнь студентам и абитуриентам!

К вашим услугам предоставлены работы, сделанные на заказ.

Основным направлением сайта «Планетастудентов.рф» является продажа готовых работ: РЕФЕРАТЫ, КОНТРОЛЬНЫЕ, ДОКЛАДЫ, ЭССЕ, ПРЕЗЕНТАЦИИ, КУРСОВЫЕ, ОТЧЕТЫ ПО ПРАКТИКЕ, ДИПЛОМЫ

На сайте «Планетастудентов.рф» никаких регистраций, все работы Вы покупаете АНОНИМНО!

sovets.org «Планетастудентов.рф» не учится за Вас, он помогает Вам учиться.

Курпатов МЕТОДЫ И МОДЕЛИ АНАЛИЗА ДАННЫХ: OLAP И DATA MINING

Иван Олегович Курпатов МЕТОДЫ И МОДЕЛИ АНАЛИЗА ДАННЫХ: OLAP И DATA MINING

СПб.: БХВ-Петербург

2015

Содержание

 

Предисловие авторов. 6

ГЛАВА 1 Системы поддержки принятия решений. 10

1.1. Задачи систем поддержки принятия решений. 10

1.2. Базы данных — основа СППР. 14

1.3. Неэффективность использования OLTP-систем для анализа данных. 20

Выводы. 26

ГЛАВА 2 Хранилище данных. 27

2.1. Концепция хранилища данных. 27

2.2. Организация ХД. 37

2.3. Очистка данных. 43

2.4. Хранилища данных и анализ. 49

Выводы. 50

ГЛАВА 3 OLAP-системы. 52

3.1. Многомерная модель данных. 52

3.2. Определение OLAP-систем. 57

3.3. Концептуальное многомерное представление. 58

3.3.1. Двенадцать правил Кодда. 58

3.3.2. Дополнительные правила Кодда. 60

3.3.3. Тест FASMI 62

3.4. Архитектура OLAP-систем. 64

3.4.1. MOLAP. 65

3.4.2. ROLAP. 68

3.4.3. HOLAP. 73

Выводы. 74

ГЛАВА 4 Интеллектуальный анализ данных. 75

4.1. Добыча данных — Data Mining. 75

4.2. Задачи Data Mining. 76

4.2.1. Классификация задач Data Mining. 76

4.2.2. Задача классификации и регрессии. 78

4.2.3. Задача поиска ассоциативных правил. 82

4.2.4. Задача кластеризации. 84

4.3. Практическое применение Data Mining. 86

4.3.1. Интернет-технологии. 86

4.3.2. Торговля. 87

4.3.3. Телекоммуникации. 88

4.3.4. Промышленное производство. 89

4.3.5. Медицина. 90

4.3.6. Банковское дело. 91

4.3.7. Страховой бизнес. 92

4.3.8. Другие области применения. 93

4.4. Модели Data Mining. 93

4.4.1. Предсказательные (predictive) модели. 93

4.4.2. Описательные (descriptive) модели. 94

4.5. Методы Data Mining. 96

4.5.1. Базовые методы. 96

4.5.2. Нечеткая логика. 97

4.5.3. Генетические алгоритмы. 100

4.5.4. Нейронные сети. 103

4.6. Процесс обнаружения знаний. 105

4.6.1. Основные этапы анализа. 105

4.6.2. Подготовка исходных данных. 107

Выводы. 109

ГЛАВА 5 Классификация и регрессия. 111

5.1. Постановка задачи. 111

5.2. Представление результатов. 113

5.2.1. Правила классификации. 113

5.2.2. Деревья решений. 114

5.2.3. Математические функции. 115

5.3. Методы построения правил классификации. 117

5.3.1. Алгоритм построения 1-правил. 117

5.3.2. Метод Naive Bayes. 119

5.4. Методы построения деревьев решений. 123

5.4.1. Методика "разделяй и властвуй" 123

5.4.2. Алгоритм покрытия. 132

5.5. Методы построения математических функций. 137

5.5.1. Общий вид. 137

5.5.2. Линейные методы. Метод наименьших квадратов. 140

5.5.2. Нелинейные методы. 141

5.5.3. Support Vector Machines (SVM) 142

5.6. Карта Кохонена. 145

Выводы. 150

ГЛАВА 6 Поиск ассоциативных правил. 152

6.1. Постановка задачи. 152

6.1.1. Формальная постановка задачи. 152

6.1.2. Сиквенциальный анализ. 156

6.1.3. Разновидности задачи поиска ассоциативных правил. 159

6.2. Представление результатов. 162

6.3. Алгоритмы. 167

6.3.1. Алгоритм Apriori 167

6.3.2. Разновидности алгоритма Apriori 172

Выводы. 174

ГЛАВА 7 Кластеризация. 175

7.1. Постановка задачи кластеризации. 175

7.1.1. Формальная постановка задачи. 178

7.1.2. Меры близости, основанные на расстояниях, используемые в алгоритмах кластеризации. 181

7.2. Представление результатов. 183

7.3. Базовые алгоритмы кластеризации. 186

7.3.1. Классификация алгоритмов. 186

7.3.2. Иерархические алгоритмы Агломеративные алгоритмы. 188

7.3.3. Неиерархические алгоритмы. 191

7.4. Кластеризация данных при помощи нечетких отношений. 206

7.4.1. Анализ свойств нечетких бинарных отношений применительно к анализу данных. 206

7.4.2. Отношение а-квазиэквивалентности. 216

Выводы. 239

ГЛАВА 8 Стандарты Data Mining. 243

8.1. Кратко о стандартах. 243

8.2. Стандарт CWM.. 244

8.2.1. Назначение стандарта CWM.. 244

8.2.2. Структура и состав CWM.. 246

8.2.3. Пакет Data Mining. 249

8.3. Стандарт CRISP. 254

8.3.1. Появление стандарта CRISP. 254

8.3.2. Структура стандарта CRISP. 254

8.3.3. Фазы и задачи стандарта CRISP. 257

8.4. Стандарт PMML. 263

8.5. Другие стандарты Data Mining. 273

8.5.1. Стандарт SQL/MM.. 273

8.5.2. Стандарт OLE DB для Data Mining. 275

8.5.3. Стандарт JDMAPI 277

ГЛАВА 9 Библиотека Xelopes. 280

9.1. Архитектура библиотеки. 280

9.2. Диаграмма Model 284

9.2.1. Классы модели для Xelopes. 284

9.2.2. Методы пакета Model 287

9.2.3. Преобразование моделей. 288

9.3. Диаграмма Settings. 289

9.3.1. Классы пакета Settings. 289

9.3.2. Методы пакета Settings. 292

9.4. Диаграмма Attribute. 292

9.4.1. Классы пакета Attribute. 292

9.4.2. Иерархические атрибуты. 294

9.5. Диаграмма Algorithms. 295

9.5.1. Общая концепция. 295

9.5.2. Класс MiningAlgorithm.. 296

9.5.3. Расширение класса MiningAlgorithm.. 297

9.5.4. Дополнительные классы. 300

9.5.5. Слушатели. 300

9.6. Диаграмма DataAccess. 301

9.6.1. Общая концепция. 302

9.6.2. Класс Mininginputstream.. 303

9.6.3. Классы Mining-векторов. 304

9.6.4. Классы, расширяющие класс Mininginputstream.. 304

9.7. Диаграмма Transformation. 305

9.8. Примеры использования библиотеки Xelopes. 307

9.8.1. Общая концепция. 307

9.8.3. Решение задачи кластеризации. 312

9.8.4. Решение задачи классификации. 315

Выводы. 318

ПРИЛОЖЕНИЯ. 320

ПРИЛОЖЕНИЕ 1 Нейронечеткие системы. 320

ПРИЛОЖЕНИЕ 2 Особенности и эффективность генетических алгоритмов. 349

Список литературы. 383

СТОИМОСТЬ: 50 РУБ.

После оплаты на странице Яндекс будет сформирована
ссылка на файл "ВЕРНУТЬСЯ В МАГАЗИН"

Похожие материалы: