Data Mining. Программное обеспечение для работы с нейронными сетями
Программное обеспечение, имитирующее работу нейронной сети, называют нейросимулятором либо нейропакетом.
Большинство нейропакетов включают следующую последовательность действий:
• Создание сети (выбор пользователем параметров либо одобрение установленных по умолчанию).
• Обучение сети.
• Выдача пользователю решения.
Существует огромное разнообразие нейропакетов, возможность использования нейросетей включена также практически во все известные статистические пакеты.
Среди специализированных нейропакетов можно назвать такие: BrainMaker, NeuroOffice, NeuroPro, и др.
Критерии сравнения нейропакетов: простота применения, наглядность представляемой информации, возможность использовать различные структуры, скорость работы, наличие документации. Выбор определяется квалификацией и требованиями пользователя.
Пример решения задачи
Пакет Matlab
Классификация нейронных сетей
Подготовка данных для обучения
Выбор структуры нейронной сети
Карты Кохонена
Задачи, решаемые при помощи карт Кохонена
Обучение сети Кохонена
Карты входов
Выводы
Методы кластерного анализа
Иерархические методы кластерного анализа
Меры сходства
Иерархический кластерный анализ в SPSS
Определение количества кластеров
Алгоритм k-средних (k-means)
Описание алгоритма
Алгоритм PAM ( partitioning around Medoids)
Предварительное сокращение размерности
Факторный анализ
Итеративная кластеризация в SPSS
Сравнительный анализ иерархических и неиерархических методов кластеризации
Новые алгоритмы и некоторые модификации алгоритмов кластерного анализа
Алгоритм BIRCH (Balanced Iterative Reducing and Clustering using Hierarchies)
Алгоритм WaveCluster
Алгоритм CLARA (Clustering LARge Applications)
Введение в ассоциативные правила
Границы поддержки и достоверности ассоциативного правила
Методы поиска ассоциативных правил
Разновидности алгоритма Apriori
AprioriHybrid
Пример решения задачи поиска ассоциативных правил
Визуализатор "Правила"
Визуализация инструментов Data Mining
Визуализация Data Mining моделей
Методы визуализации
Представление данных в одном, двух и трех измерениях
Представление данных в 4 + измерениях
Параллельные координаты
Лица Чернова
Качество визуализации
Представление пространственных характеристик
Основные тенденции в области визуализации
Разработка сложных видов диаграмм.
Повышение уровня взаимодействия с визуализацией пользователя.
Увеличение размеров и сложности структур данных, представляемых визуализацией.
Выводы
Классификация СППР
OLAP-системы
OLAP-продукты
Интеграция OLAP и Data Mining
Хранилища данных
Преимущества использования хранилищ данных
Анализ предметной области
Постановка задачи Data Mining включает следующие шаги:
Подготовка данных
Определение и анализ требований к данным
Сбор данных
Предварительная обработка данных
Очистка данных
Анализ данных.
Выводы
Инструменты очистки данных
Инструменты ETL
Выводы по подготовке данных
Моделирование
Виды моделей
Математическая модель
Построение модели
Проверка и оценка моделей
Выбор модели
Применение модели
Погрешности в процессе Data Mining
Организационные Факторы
Человеческие факторы. Роли в Data Mining
CRISP-DM методология
Стандарт PMML
Стандарты, относящиеся к унификации интерфейсов
Поставщики Data Mining
Классификация инструментов Data Mining
Программное обеспечение Data Mining для поиска ассоциативных правил
Программное обеспечение для решения задач кластеризации и сегментации
Свободно распространяемые инструменты
Выводы
Обзор программного продукта
Графический интерфейс (GUI) для анализа данных
Инструментарий для углубленного интеллектуального анализа данных
Набор инструментов для подготовки, агрегации и исследования данных
Интегрированный комплекс разнообразных методов моделирования
Интегрированные средства сравнения моделей и пакеты результатов
Скоринг по модели и простота развертывания модели
Гибкость благодаря открытости и расширяемости
Основные характеристики пакета SAS Enterprise Miner 5.1
Управление временными метриками при помощи описательных данных
там
CISCO порусски. Набор статей
там