6. Асоціативні правила



Скачати 78.96 Kb.
Дата конвертації10.12.2016
Розмір78.96 Kb.

6. Асоціативні правила


Першим застосуванням асоціативних правил було знаходження типових шаблонів покупок (здебільшого у супермаркетах) в задачах аналізу купівельного кошику (Market Basket Analysis).

Алгоритми виявлення асоціацій знаходять правила про окремі предмети, що з'являються разом в одній економічній операції, наприклад в одній покупці. За цими правилами можна знаходити послідовні асоціації, яки мають прив’язку до часу.

Нехай,є база даних, що містить дані купівельних транзакцій. Кожна транзакція – це набір товарів, що купуються за один раз.


Метою аналізу є встановлення наступних залежностей:


Якщо в транзакції існує певний набір елементів А, то можна зробити припущення, що в цій транзакції може з’явитися і набір Б. Встановлення таких залежностей надає можливість згодом знаходити та інтуїтивно зрозумілі правила поведінки покупців.

Асоціація записується як «А->Б», де А називається лівою частиною або передумовою, Б - правою частиною або наслідком.

Правила, що генеруються за цими алгоритмами мають наочний вигляд і їх можна представити так:

Якщо клієнт купив товар А1-Аn, то він схильний купити товар В1-Вm

Якщо клієнт купив товар А1-Аn, то він схильний купити товар С1-Сk

Якщо клієнт купив товар D1-Dt, то він схильний купити товар E1-Ep

Тут (А1-Аn) (D1-Dt) – ті товари, які покупець вже купив в даній транзакції, а (В1-Вm) (С1-Сk) (E1-Ep) – ті товари, які він наймовірніше може купити.

За однакових початкових умов (А1-Аn) може бути кілька варіантів наслідків, з яких можна отримати вигоду. Якщо запропоновані менеджером товари (що є наслідком 1 правила В1-Вm) – клієнту не потрібні, то він може запропонувати клієнту товари (С1-Сk), що є наслідком правила 2, з тою ж початковою умовою (А1-Аn).


Асоціативні правила мають числові характеристики


1. Підтримка правила – відсоткове відношення кількості транзакцій, що містять всі товари, які є у правилі до загальної кількості транзакцій

Низький рівень підтримки (менш одного тисячної відсотка) свідчить, що така асоціація не істотна.

2. Достовірність правила – це відсоткове відношення кількості транзакцій, які містять всі товари правила до кількості транзакцій, які містять товари, що є в умові.

Достовірність показує, як часто купують товари, що є у наслідку, якщо покупка містить товари, які є у всьому правилі



Ця величина показує як часто з появою А з'являється Б и розраховується як відношення частоти покупок А і Б разом до покупки А. Тобто якщо достовірність А до Б дорівнює 20%, то це означає, що при покупці товару А в кожному п'ятому випадку придбають і товар Б.

Необхідно відзначити, що якщо підтримка А не дорівнює підтримці Б, то і достовірність А до Б не дорівнює достовірності Б к А. Справді, покупка комп'ютера частіше призводить до покупки флешки, ніж покупка флешки до покупки комп'ютера.

Алгоритми пошуку асоціативних правил призначені для знаходження всіх правил А→Б, причому підтримка і достовірність таких правил має бути вищою за певних заздалегідь визначених порогів, що відповідно називають мінімальною підтримкою та мінімальною достовірністю.

Ці значення обираються, щоб обмежити кількість знайдених правил. Якщо підтримка має велике значення, то алгоритми будуть знаходити правила, які є добре відомі аналітикам або є настільки очевидними, що немає сенсу проводити аналіз. Мале значення підтримки призводить до генерації величезної кількості правил, що потребує суттєвих обчислювальних ресурсів.

Зменшення мінімальної підтримки призводить до збільшення кількості потенційно цікавих правил. Але занадто мала підтримка правила робить його статистично необґрунтованим.

3. Потужність асоціації. Чим більше потужність, тим сильніше вплив, який поява А робить на появу Б. Потужність розраховується за формулою:

Алгоритми пошуку асоціацій можуть створювати свої бази даних підтримки, достовірності і потужності, до яких можна звертатися при запиті.

Наприклад: "Знайти всі асоціації, в яких для товару Х достовірність більш 50% і підтримка не менш 2,5%"

При знаходженні послідовностей додається змінна часу, що дозволяє працювати із серією подій для знаходження послідовних асоціацій протягом деякого періоду часу.

Але, в такому аналізі є слабкі місця: випадково може виникнути така ситуація, коли товари в супермаркеті будуть згруповані за допомогою знайдених моделей, але це, замість очікуваного прибутку, дасть зворотний ефект. Це може відбутись через те, що клієнт швидко здійснить покупку і не буде блукати магазином, щоб прикупити ще щось.

Застосування асоціативних правил для стимулювання продажів


За допомогою алгоритмів пошуку асоціативних правил вирішують широкий спектр практичних задач.

Розглянемо задачу, яка має за мету стимулювання продажів, що базується на знаннях про типову поведінку клієнта при оформленні замовлень. Застосування асоціативних правил надає можливість передбачити, що скоріше придбає клієнт і запропонувати йому саме цей товар.


Задача


Існує фірма «Гуртівня». Кількість позицій товарів є 1000. Клієнтами фірми є дрібно гуртові фірми, або фірми, що торгують в роздріб.

Типовий процес закупки товарів у фірмі «Гуртівня»:


  • Приходить клієнт з сумою 10 000 грн.

  • Йому надають прас-лист

  • Клієнт замовляє визначені товари. Менеджер «Гуртівні» вводить обрані товари в електронну накладну.

  • На складі цього товару є лише на 8 000 грн. 2 000 грн. клієнт також може витратити у «Гуртівні».

Оскільки менеджер зацікавлений у тому, щоб 2 000 грн. було витрачено , клієнтові потрібно запропонувати на вибір інший товар. Але, кількість позицій є великою. Скоріше за все менеджер запропонує купити товари, що є лідерами продажів, або ті товари, що розташовані поруч у прас-листі.

Менеджер не завжди може запропонувати власне той товар, що клієнт (свідомо чи несвідомо) хоче купити. І переважно, товар, який можна було б продати лишається на складі.

Задачею менеджера «Гуртівні» є передбачити бажання клієнта та підказати клієнту про товари, що можуть гідно замінити ті товари, яких зараз немає на складі. Така задача є складною і для досвідченого менеджера, оскільки є багато позицій товару і певні закономірності не зовсім очевидними.

На допомогу менеджеру стане система, яка визначить перелік товарів, які може купити клієнт, як доповнення до тих, що вже він купив в цій транзакції.

Така система може бути складовою інформаційної системи оформлення замовлень. Обчислення правил відбувається у фоновому режимі, тобто менеджер цього не бачить. Однак, за запитом йому надаються обчислені правила, що надає менеджеру вагомі аргументи.

Обчислені правила можна використовувати як для оперативної підказки так і для аналізу. Вони мають бути зручними і зрозумілими для кінцевого користувача (менеджера).


Існує 4 основних варіанти відображення асоціативних правил


  1. У вигляді звичайної таблиці

  2. У вигляді форматованого тексту

  3. У вигляді дерева

  4. У вигляді перехресної таблиці

В кожному варіанті є переваги та недоліки, тому конкретний вибір залежить від особливостей особистого сприйняття або від кінцевої мети.

1. Асоціативні правила у вигляді звичайної таблиці


Умова

Наслідок

Підтримка

Достовірність

Макарони

Кетчуп

1,1%

25%

Макарони та ковбаса

Гірчиця

1,5%

40%

Є одним з найпростіших для сприйняття візуалізації асоціативних правил

Переваги

  • Легко зрозуміти де умова, де наслідок.

  • Можливість експорту в різні формати.

  • Можливість фільтрації та сортування за умовою, наслідком, підтримкою, достовірністю тощо.

Недоліки

  • Велика кількість правил призводить до генерації величезного документу і ускладнює сприйняття та зрозумілість.

2. Асоціативні правила у вигляді форматованого тексту


Самою природною конструкцією для сприйняття правил є конструкція виду:

Якщо «Умова», тоді «Наслідок».

Такий варіант відображення є найдоступнішою формою представлення

Правило 1

Якщо Макарони «Чумак» 0,5 кг., тоді Кетчуп «Верес» 0,3

Підтримка 1,2%

Достовірність 50%



Правило 2

Якщо Макарони «Щедро» 1 кг., тоді Соус «Ніжний» 0,5

Підтримка 0,6%

Достовірність 45%



Переваги

  • Природній запис правила.

  • Можливість експорту в текстовий файл.

  • Можливість сортування та фільтрації.

Недоліки

  • Велика кількість правил призводить до генерації громіздкого документу і виникає складність у розумінні.

3. Асоціативні правила у вигляді дерева


Макарони «Чумак»

Кетчуп «Верес» (1,2% 50%)

Соус «Ніжний» (1,5% 40%)

Макарони «Щедро»

Соус «Татарський» (2,2% 60%)

Соус «Ніжний» (1,3% 45%)



Переваги

  • Компактний вигляд.

  • Групування за умовою.

  • Значення підтримки і достовірності у графічному вигляді.

Недоліки

  • Незвичне представлення і складність сприйняття для початківців.

4. Асоціативні правила у вигляді перехресної таблиці




1

2

3

4

Підтримка

1,2

1,3

0,1

0,5

Достовірність

44

50

40

75

Макарони

+

=







Чай




+

=




Кетчуп

=







+

Соус







+

=

По осі Х – всі правила

По осі У – всі товари, що містяться у правилах



  1. Обирається стовбець – це є правило

  2. До умови належать товари, що позначені «+»

  3. До наслідку належать товари, що позначені «=»

  4. Підтримку і достовірність вказано у відповідних рядках

Переваги

  • Можливість побачити всі товари, що присутні у всіх правилах.

  • Можливість сортування та фільтрації за умовою, наслідком, підтримкою, достовірністю.

Недоліки

  • Надмірна кількість товару, що є у правилах, може ускладнити аналіз закономірностей.

Висновок


Отже, за допомогою алгоритмів асоціативних правил можна знаходити стандартні шаблони покупок. Але, за допомогою цих алгоритмів можна знаходити і послідовності між різними подіями.

Наприклад, Якщо «Результати аналізів», то «Хвороби існуючі та майбутні».



Перелік предметних областей, де можна застосовувати ці алгоритми є доволі широким і не обмеженим.


База даних захищена авторським правом ©lecture.in.ua 2016
звернутися до адміністрації

    Головна сторінка