d9e5a92d

Визуализатор "Правила"


Правила в данном визуализаторе размещены в виде списка. Каждое правило, представленное как "условие-следствие", характеризуется значением поддержки в абсолютном и процентном выражении, а также достоверностью. Таким образом, аналитик видит поведение покупателей, описанное в виде набора правил. Набор правил для решаемой нами задачи приведен в таблице 15.4. Например, первое правило говорит о том,  что если покупатель купил йогурт, то с достоверностью или вероятностью 71% он купит также кефир. Эта информация полезна с различных точек зрения. Она, например, помогает решить задачу расположения товаров в магазине.



ЙОГУРТЫ

КЕФИР

22,73 10

71,43

 

КЕФИР

ЙОГУРТЫ

22,73 10

71,43

 

МАСЛО

МОЛОКО

22,73 10

43,48

 

МОЛОКО

МАСЛО

22,73 10

52,63

 

СОКИ

МАСЛО

20,45 9

40,91

 

 

6

МАСЛО

ХЛЕБ И БУЛКИ

45,45 20

86,96

7

ХЛЕБ И БУЛКИ

МАСЛО

45,45 20

83,33

8

МОЛОКО

ХЛЕБ И БУЛКИ

22,73 10

52,63

9

ХЛЕБ И БУЛКИ

МОЛОКО

22,73 10

41,67

10 СОКИ

ХЛЕБ И БУЛКИ

22,73 10

45,45

11 ХЛЕБ И БУЛКИ

СОКИ

22,73 10

41,67

12 МАСЛО И МОЛОКО

ХЛЕБ И БУЛКИ

20,45 9

90,00

13 МАСЛО И ХЛЕБ И БУЛКИ

МОЛОКО

20,45 9

45,00

14 МОЛОКО И ХЛЕБ И БУЛКИ МАСЛО

20,45 9

90,00

15 МОЛОКО

МАСЛО И ХЛЕБ И БУЛКИ 20,45 9

47,37


При большом количестве найденных правил и широком ассортименте товаров анализировать полученные правила достаточно сложно. Для удобства анализа таких наборов правил предлагаются визуализаторы "Дерево правил" и "Что-если".

Визуализатор "Дерево правил" представляет собой двухуровневое дерево, которое может быть построено по двум критериям: по условию и по следствию. Если дерево построено по условию, то вверху списка отображается условие правила, а список, прилагающийся к данному условию, состоит из его следствий. При выборе определенного условия, в правой части визуализатора отображаются следствия условия, уровень поддержки и достоверности.

В случае построения дерева по следствию, вверху списка отображается следствие правила, а список состоит из его условий. При выборе определенного следствия, в правой части визуализатора мы видим условия этого правила с указанием уровня поддержки и достоверности.

Визуализатор "что-если" удобен, если нам необходимо ответить на вопрос, какие следствия могут получиться из данного условия.

Например, выбрав условие "МОЛОКО", в левой части экрана получаем три следствия "МАСЛО", "ХЛЕБ И БУЛКИ", "МАСЛО И ХЛЕБ И БУЛКИ", для которых указаны уровень поддержки и достоверности. Этот визуализатор представлен на рис. 15.5.

Рассмотренный пример поиска ассоциативных правил является типичной иллюстрацией задачи анализа покупательской корзины. В результате ее решения определяются часто встречающиеся наборы товаров, а также наборы товаров, совместно приобретаемые покупателями. Найденные правила могут быть использованы для решения различных задач, в частности для размещения товаров на прилавках магазинов, предоставления скидок на пары товаров для повышения объема продаж и, следовательно, прибыли и других задач.

"Говорят, один рисунок стоит тысячи слов, и это действительно так, но при условии, что рисунок хороший." Боумена [65]

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

•              представлять пользователю информацию в наглядном виде;

•              компактно описывать закономерности, присущие исходному набору данных;

•              снижать размерность или сжимать информацию;

•              восстанавливать пробелы в наборе данных;

•              находить шумы и выбросы в наборе данных.




Содержание раздела