Come sfruttare il machine learning per risolvere dei problemi di business!
di Massimo Walter Rivolta
Nell’articolo precedente, Cos’è il Machine Learning, abbiamo lasciato Cristiano, Alberto e Max parlare di ML ma questa volta è Paola che ha una domanda ben specifica:
Paola – “Max, ho una domanda per te! Sai che io mi occupo di tutta la parte amministrativa ma molti di questi lavori sono monotoni, ripetitivi e mi fanno perdere moltissimo tempo. Mi chiedevo se i ‘tuoi’ algoritmi di ML potrebbero aiutarci anche in questo caso.”
Max – “Paola, raccontami quali sono questi problemi. Parliamone.”
Per riuscire a capire che tipi di problemi il ML è in grado di gestire, e quindi comprendere se possa essere utile al proprio business, è necessario fare distinzione tra le seguenti 4 categorie (sebbene ne esistano di più):
- Regressione
- Classificazione
- Clustering
- Sistemi di raccomandazione
Prima di continuare la lettura è necessario però conoscere, almeno in linea generale, cosa può fare un algoritmo di ML. Vi consiglio quindi di dare una rapida lettura a questo breve articolo prima di proseguire (link all’articolo precedente).
E’ da tenere presente che la caratteristiche comuni a tutte queste categorie di problemi sono 3. La prima è che hanno bisogno di un insieme di caratteristiche in input. Ad esempio, se l’algoritmo dovesse stimare il prezzo di un immobile, l’insieme delle caratteristiche in input potrebbe essere la dimensione della casa in mq, il numero di stanze, la posizione ecc. La seconda è che la soluzione al problema deve essere, per sua natura, incerta. Facendo riferimento all’esempio dell’immobile, infatti, la stima non è mai una quantità definita matematicamente dalle caratteristiche in input ma bensì possiede una certa intrinseca incertezza. La terza è la disponibilità di dati da cui l’algoritmo debba apprendere.
Vediamo ora nel dettaglio il significato di queste categorie per capire quale potrebbe allinearsi col problema di business da risolvere.
Regressione
Questa categoria cerca di stimare una quantità numerica date le caratteristiche. La stima è quindi un numero come può essere, ad esempio, il valore di un immobile, il numero di vendite previste o il valore di un certo titolo in borsa. L’algoritmo di ML cercherà di capire la relazione che esista tra le caratteristiche di input e la quantità numerica da stimare, utilizzando lo storico dati a disposizione. Questo significa che per utilizzare questa tecnica è necessario disporre di un dataset contenente le caratteristiche in input e la quantità desiderata, anche chiamata “gold standard”. Una volta appresa la relazione, l’algoritmo sarà in grado di stimare nuovi valori in base a caratteristiche in input non presenti nello storico.
Esempio di dataset:
Casa, Dimensione, NumeroStanze, Posizione, Stima
- 1, 100, 3, CENTRALE, 250000
- 2, 50, 2, PERIFERIA, 150000
- 3, 75, 3, CENTRALE, 220000
- …
Classificazione
Per classificazione si intende un problema in cui si hanno in input un certo numero di caratteristiche e in output alcune classi predeterminate. L’obiettivo è quindi creare un algoritmo che sia in grado di associare l’input ad una determinata classe. Ad esempio, un algoritmo potrebbe essere in grado di classificare un’immagine contenente paesaggi di mare o di montagna. La maggior applicazione della classificazione è però a supporto delle decisioni di business. Infatti, molto spesso il problema è capire se conviene fare un’azione oppure no (investire oppure no, acquistare oppure no, ecc.). In questo caso le classi sono solo due e si riferiscono a compiere l’azione oppure non compierla. Anche in questo caso è necessario avere a disposizione un dataset che, per ogni insieme di caratteristiche, si ha anche associata la decisione ottimale. L’algoritmo quindi apprenderà come prendere decisioni!
Esempio di dataset:
Casa, Dimensione, NumeroStanze, Posizione, Azione
- 1, 100, 3, CENTRALE, VENDERE
- 2, 50, 2, PERIFERIA, AFFITTARE
- 3, 75, 3, CENTRALE, AFFITTARE
- …
Clustering
In determinate applicazioni è necessario raggruppare i propri dati in gruppi. Ad esempio, determinare se i propri clienti possano essere raggruppati in segmenti su cui differenziare le campagne di marketing è un problema di clustering. Anche in questo i caso, ciò che debba essere raggruppato viene descritto tramite un insieme di caratteristiche. Diversamente dalla Regressione e dalla Classificazione, in questo caso non è necessario avere la quantità desiderata o la classe associata.
Esempio di dataset:
Casa, Dimensione, NumeroStanze, Posizione
- 1, 100, 3, CENTRALE
- 2, 50, 2, PERIFERIA
- 3, 75, 3, CENTRALE
Output dell’algoritmo: Casa 1-Gruppo1, Casa 2-Gruppo 2, Casa 3-Gruppo 3
Sistemi di raccomandazione
Con l’esplosione degli e-commerce e delle piattaforme web nell’era digitale si è reso necessario un meccanismo per suggerire prodotti da acquistare o contenuti da fruire in base agli interessi degli utenti. Sebbene l’idea non sia per nulla nuova (ad es. il clustering), l’implementazione massiva di algoritmi in grado di “raccomandare” è avvenuta proprio con la rivoluzione digitale. Per chiarire le idee basti pensare a quando Amazon propone nuovi oggetti da comprare simili a quello appena acquistato o Netflix quando mostra nuove serie TV da guardare in base a ciò che si è guardato precedentemente. Per costruire questo tipo di algoritmo è necessario avere due dataset, uno che descriva le preferenze degli utenti e uno che descriva i prodotti da raccomandare.
Esempio di dataset:
Utente, FilmAzione, FilmRomantici
- Alice, 2, 5
- Bob, 4, 1
- Carl, 3, 3
- …
Film, Azione, Romanticismo
- Braveheart, 5, 4
- Fast&Furious, 5, 1
- Lova Actually, 1, 4
- …
E’ da tener presente che moltissimi problemi richiedono una soluzione combinata tra queste 4 categorie.
Qui di seguito vi proponiamo un quiz da svolgere per capire se la tua azienda è pronta ad implementare algoritmi di Machine Learning al fine di risolvere eventuali problemi di business!
Come vedi gli ambiti sono tanti e va individuato di volta in volta l’approccio corretto. Siamo a disposizione per una analisi approfondita sui tuoi dati e mostrarti l’aiuto concreto a supporto delle tue decisioni con il Machine Learning.
Compila il form di seguito per un contatto diretto :