Правила в данном визуализаторе размещены в виде списка. Каждое правило, представленное как "условие-следствие", характеризуется значением поддержки в абсолютном и процентном выражении, а также достоверностью. Таким образом, аналитик видит поведение покупателей, описанное в виде набора правил. Набор правил для решаемой нами задачи приведен в таблице 15.4. Например, первое правило говорит о том, что если покупатель купил йогурт, то с достоверностью или вероятностью 71% он купит также кефир. Эта информация полезна с различных точек зрения. Она, например, помогает решить задачу расположения товаров в магазине.
ЙОГУРТЫ |
КЕФИР |
22,73 10 |
71,43 |
|
|||||
КЕФИР |
ЙОГУРТЫ |
22,73 10 |
71,43 |
|
|||||
МАСЛО |
МОЛОКО |
22,73 10 |
43,48 |
|
|||||
МОЛОКО |
МАСЛО |
22,73 10 |
52,63 |
|
|||||
СОКИ |
МАСЛО |
20,45 9 |
40,91 |
|
|||||
|
|||||||||
6 |
МАСЛО |
ХЛЕБ И БУЛКИ |
45,45 20 |
86,96 |
|||||
7 |
ХЛЕБ И БУЛКИ |
МАСЛО |
45,45 20 |
83,33 |
|||||
8 |
МОЛОКО |
ХЛЕБ И БУЛКИ |
22,73 10 |
52,63 |
|||||
9 |
ХЛЕБ И БУЛКИ |
МОЛОКО |
22,73 10 |
41,67 |
|||||
10 СОКИ |
ХЛЕБ И БУЛКИ |
22,73 10 |
45,45 |
||||||
11 ХЛЕБ И БУЛКИ |
СОКИ |
22,73 10 |
41,67 |
||||||
12 МАСЛО И МОЛОКО |
ХЛЕБ И БУЛКИ |
20,45 9 |
90,00 |
||||||
13 МАСЛО И ХЛЕБ И БУЛКИ |
МОЛОКО |
20,45 9 |
45,00 |
||||||
14 МОЛОКО И ХЛЕБ И БУЛКИ МАСЛО |
20,45 9 |
90,00 |
|||||||
15 МОЛОКО |
МАСЛО И ХЛЕБ И БУЛКИ 20,45 9 |
47,37 |
|||||||
При большом количестве найденных правил и широком ассортименте товаров анализировать полученные правила достаточно сложно. Для удобства анализа таких наборов правил предлагаются визуализаторы "Дерево правил" и "Что-если".
Визуализатор "Дерево правил" представляет собой двухуровневое дерево, которое может быть построено по двум критериям: по условию и по следствию. Если дерево построено по условию, то вверху списка отображается условие правила, а список, прилагающийся к данному условию, состоит из его следствий. При выборе определенного условия, в правой части визуализатора отображаются следствия условия, уровень поддержки и достоверности.
В случае построения дерева по следствию, вверху списка отображается следствие правила, а список состоит из его условий. При выборе определенного следствия, в правой части визуализатора мы видим условия этого правила с указанием уровня поддержки и достоверности.
Визуализатор "что-если" удобен, если нам необходимо ответить на вопрос, какие следствия могут получиться из данного условия.
Например, выбрав условие "МОЛОКО", в левой части экрана получаем три следствия "МАСЛО", "ХЛЕБ И БУЛКИ", "МАСЛО И ХЛЕБ И БУЛКИ", для которых указаны уровень поддержки и достоверности. Этот визуализатор представлен на рис. 15.5.
Рассмотренный пример поиска ассоциативных правил является типичной иллюстрацией задачи анализа покупательской корзины. В результате ее решения определяются часто встречающиеся наборы товаров, а также наборы товаров, совместно приобретаемые покупателями. Найденные правила могут быть использованы для решения различных задач, в частности для размещения товаров на прилавках магазинов, предоставления скидок на пары товаров для повышения объема продаж и, следовательно, прибыли и других задач.
"Говорят, один рисунок стоит тысячи слов, и это действительно так, но при условии, что рисунок хороший." Боумена [65]
С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.
В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации.
К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.
Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.
Традиционные методы визуализации могут находить следующее применение:
• представлять пользователю информацию в наглядном виде;
• компактно описывать закономерности, присущие исходному набору данных;
• снижать размерность или сжимать информацию;
• восстанавливать пробелы в наборе данных;
• находить шумы и выбросы в наборе данных.