K-Means Scipy

K-Means Scipy
Il linguaggio di programmazione di Python è il linguaggio più comunemente usato in questi giorni poiché le sue biblioteche gratuite open source attirano gli sviluppatori. I principianti e gli sviluppatori esperti preferiscono lavorare in Python piuttosto che in qualsiasi altro linguaggio di programmazione di alto livello. Scipy è una di quelle incredibili biblioteche di Python che rende la programmazione più semplice e semplice. La libreria Scipy è costruita sulla libreria Numpy, estendendo le sue funzionalità e i suoi metodi. Qui esploreremo il metodo K-Means Scipy. Per aiutarti su come comprendere le funzioni dell'algoritmo K-Means in un programma Python, ti mostreremo alcuni esempi chiari e pratici.

Cosa sta clustering in python003f?

Il concetto generale di clustering sta realizzando gruppi di tipi simili. È il processo di separazione dei dati con le stesse caratteristiche in diversi tipi di cluster. Sanità, finanza, vendita al dettaglio e altri campi usano comunemente le tecniche di clustering per svolgere le diverse attività analitiche. Il clustering in Python svolge le stesse funzionalità con l'aiuto di algoritmi estremamente semplici. Esistono molti metodi di clustering in Python, ma Scipy fornisce solo due moduli per il clustering che sono i k-medie e il clustering gerarchico. Dedichiamo questo articolo al modulo K-Means. Quindi, con l'aiuto di esempi, impareremo a conoscere il clustering K-Means della biblioteca di Scipy.

Cos'è l'algoritmo di clustering K-means?

Ci vuole un set di dati e il numero di cluster da realizzare come input e restituire il numero specificato di cluster dei dati dati. Segue il meccanismo di distanza euclidea per creare i cluster. Innanzitutto, l'algoritmo K-Means trova il centroide del cluster, quindi classifica ogni elemento alla sua media più vicina, ripete il processo per il numero dato di tempi di cluster e crea il numero specificato di cluster dei dati indicati.

Che cos'è il clustering di K-Means Scipy?

La libreria Scipy fornisce una tecnica di clustering K-Means che è lo stesso approccio di partizionamento in cui ogni cluster dei dati è rappresentato con il centroide calcolato. Nel centroide calcolato, tutti i punti dati hanno la stessa distanza media dal centro del cluster. La libreria Scipy offre due pacchetti di clustering, VQ e gerarchia, che offrono diversi metodi di clustering. Il cluster.L'imballaggio di clustering VQ è il modulo di quantizzazione vettoriale che fornisce il metodo di clustering K-Means. La quantizzazione vettoriale è molto utile nella distorsione e nella riduzione del miglioramento dell'accuratezza. Per realizzare cluster con il metodo K-Means della libreria Scipy, dobbiamo seguire i seguenti passaggi:

Innanzitutto, installa il pacchetto Scipy con la seguente istruzione:

È molto importante avere tutte le librerie installate prima di utilizzare qualsiasi metodo di funzione della libreria. Quindi, se non hai ancora installato la libreria Scipy, installala con l'istruzione Scipy di installazione PIP. Successivamente, fornire i dati per creare il cluster e il numero del cluster che deve essere realizzato. Quindi, normalizza i dati con la seguente dichiarazione:

Qui, la funzione bianca dei pacchetti VQ viene utilizzata per normalizzare i dati. Il parametro "Data" rappresenta i dati di input e il parametro "CF" viene utilizzato per verificare se i dati di input contiene solo numeri finiti o meno. Il prossimo passo è individuare il centroide dei dati forniti. La seguente istruzione viene utilizzata per calcolare il centroide dei dati:

I parametri "Dati" e "CF" sono gli stessi della funzione Whiten e rappresentano le stesse informazioni. I parametri aggiuntivi sono "k", "iterazioni" e "soglia" in cui K rappresenta il numero di cluster da realizzare, l'iterazione rappresenta il numero di iterazioni da eseguire dalla funzione e la soglia rappresenta il valore di soglia per la terminazione della funzione. Ora, dimostriamo un esempio in modo che possiamo praticamente vedere come funziona la funzione K-Means.

Esempio:

Qui, faremo un esempio per dimostrare i passaggi che abbiamo spiegato in precedenza. Quando hai un esempio pratico completo, puoi comprendere facilmente il concetto. Facciamo riferimento al codice dato nella seguente schermata:

Dato che abbiamo già installato la libreria Scipy, non è necessario installarla esplicitamente. La prima riga di codice viene utilizzata per importare la libreria Numpy come "NP" nel programma. Dopodiché, il Scipy.grappolo.Il pacchetto VQ viene importato nel programma per utilizzare i moduli Whiten, KMeans e VQ. La variabile "Data" viene inizializzata con un array 2-D che viene quindi passato alla funzione Whiten per la normalizzazione dei dati. I dati normalizzati possono essere visualizzati nell'output poiché l'istruzione di stampa viene utilizzata per visualizzarli.

La funzione kmeans () calcola il centroide dei dati dati. I dati dati vengono passati alla funzione KMeans con il numero di cluster da realizzare. Il valore del centroide per ciascun elemento di dati può anche essere visualizzato nell'output poiché l'istruzione di stampa viene utilizzata per visualizzarli. La media dei dati viene anche presa e visualizzata nell'output con l'istruzione di stampa.

Infine, per il clustering, viene utilizzata la funzione VQ. I dati dati e i valori del centroide calcolati vengono passati alla funzione VQ e visualizzati nell'output utilizzando l'istruzione di stampa. Per ottenere l'output completo in un unico posto, puoi fare riferimento alla seguente schermata:

Come puoi vedere, abbiamo prima i dati normalizzati che vengono restituiti dalla funzione Whiten. Quindi, abbiamo i centroidi per ogni valore di dati. Successivamente, viene fornita la media dei dati, seguita dagli indici del cluster. Puoi eseguire questo codice in qualsiasi compilatore Python nel tuo sistema come Spyder, Pypy, Giove, ecc. Puoi anche utilizzare i compilatori online come il collaboratorio che è anche noto come Colab.

Conclusione

Questo articolo è dedicato all'algoritmo di clustering K-Means. Qui, abbiamo imparato a conoscere il clustering, il clustering K-means e il clustering K-means con la biblioteca di Scipy. Innanzitutto, abbiamo imparato il concetto di base di clustering. Quindi, abbiamo esplorato il metodo specifico del cluster K-Means. Infine, abbiamo appreso il metodo completo K-Means fornito dalla Biblioteca Scipy. Abbiamo anche dimostrato un esempio per spiegare ogni passaggio.