Differenza chiave: apprendimento automatico supervisionato e non supervisionato
Apprendimento supervisionato e apprendimento non supervisionato sono due concetti fondamentali dell'apprendimento automatico. L'apprendimento supervisionato è un'attività di apprendimento automatico per l'apprendimento di una funzione che associa un input a un output in base alle coppie input-output di esempio. L'apprendimento non supervisionato è l'attività di apprendimento automatico di dedurre una funzione per descrivere la struttura nascosta da dati non etichettati. La differenza fondamentale tra apprendimento automatico supervisionato e non supervisionato è che l'apprendimento supervisionato utilizza dati etichettati mentre l'apprendimento non supervisionato utilizza dati non etichettati.
Il Machine Learning è un campo dell'informatica che dà la possibilità a un sistema informatico di apprendere dai dati senza essere programmato in modo esplicito. Consente di analizzare i dati e di prevedere i modelli in essi contenuti. Ci sono molte applicazioni dell'apprendimento automatico. Alcuni di questi sono il riconoscimento facciale, il riconoscimento dei gesti e il riconoscimento vocale. Esistono vari algoritmi relativi all'apprendimento automatico. Alcuni di essi sono la regressione, la classificazione e il raggruppamento. I linguaggi di programmazione più comuni per lo sviluppo di applicazioni basate sull'apprendimento automatico sono R e Python. Possono essere utilizzati anche altri linguaggi come Java, C++ e Matlab.
Cos'è l'apprendimento supervisionato?
Nei sistemi basati sull'apprendimento automatico, il modello funziona secondo un algoritmo. Nell'apprendimento supervisionato, il modello è supervisionato. Innanzitutto, è necessario addestrare il modello. Con le conoscenze acquisite, può prevedere le risposte per le istanze future. Il modello viene addestrato utilizzando un set di dati etichettato. Quando un dato fuori campione viene fornito al sistema, può prevedere il risultato. Di seguito è riportato un piccolo estratto dal popolare set di dati IRIS.
Secondo la tabella sopra, lunghezza sepalo, larghezza sepalo, lunghezza rotuleo, larghezza rotuleo e specie sono chiamati attributi. Le colonne sono note come feature. Una riga contiene dati per tutti gli attributi. Pertanto, una riga è chiamata osservazione. I dati possono essere numerici o categoriali. Al modello vengono fornite le osservazioni con il nome della specie corrispondente come input. Quando viene fornita una nuova osservazione, il modello dovrebbe prevedere il tipo di specie a cui appartiene.
Nell'apprendimento supervisionato, ci sono algoritmi per la classificazione e la regressione. La classificazione è il processo di classificazione dei dati etichettati. Il modello ha creato dei confini che separavano le categorie di dati. Quando vengono forniti nuovi dati al modello, è possibile classificare in base a dove si trova il punto. Il K-Nearest Neighbors (KNN) è un modello di classificazione. A seconda del valore k, viene decisa la categoria. Ad esempio, quando k è 5, se un particolare punto dati è vicino a otto punti dati nella categoria A e sei punti dati nella categoria B, il punto dati sarà classificato come A.
La regressione è il processo di previsione dell'andamento dei dati precedenti per prevedere il risultato dei nuovi dati. Nella regressione, l'output può essere costituito da una o più variabili continue. La previsione viene eseguita utilizzando una linea che copre la maggior parte dei punti dati. Il modello di regressione più semplice è una regressione lineare. È veloce e non richiede parametri di ottimizzazione come in KNN. Se i dati mostrano un andamento parabolico, il modello di regressione lineare non è adatto.
Questi sono alcuni esempi di algoritmi di apprendimento supervisionato. In generale, i risultati generati dai metodi di apprendimento supervisionato sono più accurati e affidabili perché i dati di input sono ben noti ed etichettati. Pertanto, la macchina deve analizzare solo i modelli nascosti.
Cos'è l'apprendimento non supervisionato?
Nell'apprendimento non supervisionato, il modello non è supervisionato. Il modello funziona da solo, per prevedere i risultati. Utilizza algoritmi di apprendimento automatico per trarre conclusioni su dati senza etichetta. In generale, gli algoritmi di apprendimento non supervisionato sono più difficili degli algoritmi di apprendimento supervisionato perché ci sono poche informazioni. Il clustering è un tipo di apprendimento non supervisionato. Può essere utilizzato per raggruppare i dati sconosciuti utilizzando algoritmi. La k-mean e il clustering basato sulla densità sono due algoritmi di clustering.
Algoritmo k-mean, posiziona k baricentro in modo casuale per ciascun cluster. Quindi ogni punto dati viene assegnato al baricentro più vicino. La distanza euclidea viene utilizzata per calcolare la distanza dal punto dati al baricentro. I punti dati sono classificati in gruppi. Le posizioni per k centroidi vengono calcolate nuovamente. La nuova posizione del baricentro è determinata dalla media di tutti i punti del gruppo. Anche in questo caso ogni punto dati è assegnato al baricentro più vicino. Questo processo si ripete finché i centroidi non cambiano più. k-mean è un algoritmo di clustering veloce, ma non esiste un'inizializzazione specificata dei punti di clustering. Inoltre, esiste un'elevata variazione dei modelli di clustering basati sull'inizializzazione dei punti del cluster.
Un altro algoritmo di clustering è il clustering basato sulla densità. È anche noto come applicazioni di clustering spaziale basate sulla densità con rumore. Funziona definendo un cluster come l'insieme massimo di punti di densità collegati. Sono due parametri utilizzati per il clustering basato sulla densità. Sono Ɛ (epsilon) e punti minimi. Il Ɛ è il raggio massimo del quartiere. I punti minimi sono il numero minimo di punti nel quartiere Ɛ per definire un cluster. Questi sono alcuni esempi di raggruppamento che rientra nell'apprendimento non supervisionato.
In genere, i risultati generati dagli algoritmi di apprendimento senza supervisione non sono molto accurati e affidabili perché la macchina deve definire ed etichettare i dati di input prima di determinare i modelli e le funzioni nascosti.
Qual è la somiglianza tra apprendimento automatico supervisionato e non supervisionato?
Sia l'apprendimento supervisionato che non supervisionato sono tipi di apprendimento automatico
Qual è la differenza tra apprendimento automatico supervisionato e non supervisionato?
Apprendimento automatico supervisionato e non supervisionato |
|
L'apprendimento supervisionato è l'attività di apprendimento automatico per l'apprendimento di una funzione che mappa un input su un output in base a coppie input-output di esempio. | L'apprendimento non supervisionato è l'attività di apprendimento automatico per dedurre una funzione per descrivere la struttura nascosta da dati senza etichetta. |
Funzionalità principale | |
Nell'apprendimento supervisionato, il modello prevede il risultato in base ai dati di input etichettati. | Nell'apprendimento non supervisionato, il modello prevede il risultato senza dati etichettati identificando i modelli da solo. |
Accuratezza dei risultati | |
I risultati generati dai metodi di apprendimento supervisionato sono più accurati e affidabili. | I risultati generati dai metodi di apprendimento senza supervisione non sono molto accurati e affidabili. |
Algoritmi principali | |
Ci sono algoritmi per la regressione e la classificazione nell'apprendimento supervisionato. | Ci sono algoritmi per il clustering nell'apprendimento non supervisionato. |
Riepilogo – Apprendimento automatico supervisionato e non supervisionato
Apprendimento supervisionato e Apprendimento non supervisionato sono due tipi di Machine Learning. L'apprendimento supervisionato è l'attività di apprendimento automatico per l'apprendimento di una funzione che associa un input a un output in base a coppie input-output di esempio. L'apprendimento non supervisionato è l'attività di apprendimento automatico di dedurre una funzione per descrivere la struttura nascosta da dati senza etichetta. La differenza tra apprendimento automatico supervisionato e non supervisionato è che l'apprendimento supervisionato utilizza dati etichettati mentre l'apprendimento non supervisionato utilizza dati non etichettati.