Skip to content

Introduzione alle regole associative

L’analisi delle affinità è il processo che determina gli oggetti che presentano caratteristiche comuni.
Una tipica applicazione è la cosiddetta market basket analysis, il cui scopo è identificare quei prodotti che molto probabilmente saranno acquistati dai clienti.
L’output dell’analisi è un insieme di associazioni sul comportamento dei clienti durante lo shopping, presentate nella forma di un insieme di regole dette regole associative.
CONFIDENZA E SUPPORTO
Le regole associative sono diverse dalle tradizionali regole di classificazione:
- una variabile che si presenta come condizione antecedente di una regola può apparire anche come condizione conseguente di una seconda regola;
- mentre le regole tradizionali di classificazione ammettono nella condizione conseguente una sola variabile, le regole associative ammettono che la condizione conseguente di una regola possa contenere una o più variabili.
Supponiamo di voler identificare delle relazioni interessanti fra le tendenze di acquisto dei clienti per quattro prodotti: latte, formaggio, pane, uova.
Le possibili associazioni sono:
1. Se i clienti acquistano il latte acquistano anche il pane.
2. Se i clienti acquistano il pane acquistano anche il latte.
3. Se i clienti acquistano il latte e le uova, acquistano anche il formaggio e il pane.
4. Se i clienti acquistano il latte, il formaggio e le uova, acquistano anche il pane.
La prima associazione ci dice che se il cliente acquista il latte, probabilmente acquisterà anche il pane. La domanda ovvia è: con quale probabilità:
Per rispondere, viene associato ad ogni regola un indice di confidenza che, per questa regola, rappresenta la probabilità condizionata dell’acquisto del pane dato l’acquisto del latte.
Se un totale di 10.000 acquisti includono il latte e di questi 5.000 includono anche il pane, l’indice di confidenza per un acquisto di pane associato al latte è pari a 5.000 / 10.000 = 50%.
Consideriamo ora la seconda regola. Ci dice le stesse cose della prima: Ovviamente no. Nel primo caso gli acquisti riguardano tutti i clienti che hanno acquistato il latte, nella seconda tutti quelli che hanno acquistato il pane. Anche l’indice di confidenza potrà essere diverso.
Un altro elemento importante di valutazione è la percentuale di tutti gli acquisti che contengono i valori delle variabili che si trovano in una regola associativa (nel nostro caso pane e latte): questo parametro statistico è detto supporto.

Valuta questi appunti:

Continua a leggere:

Per approfondire questo argomento, consulta le Tesi:

Puoi scaricare gratuitamente questo appunto in versione integrale.