"Il" Python "contiene molte biblioteche e quando vogliamo analizzare o manipolare i dati quindi, utilizziamo queste biblioteche" Python's "e i" Panda "sono anche la biblioteca. La libreria "Panda" viene utilizzata nel campo delle scienze dei dati e viene anche utilizzata nelle attività di apprendimento automatico. Il telaio dati "Panda" ci aiuta a salvare i dati. In "Panda", quando vogliamo binning dei dati, allora utilizziamo il metodo "QCut ()". Il metodo "QCUT ()" viene utilizzato per convertire le caratteristiche continue in categorici. Possiamo aggiungere diversi tipi di parametri in questo metodo "QCUT ()" per ottenere diversi tipi di risultati. Questo tutorial è incentrato sul metodo "QCut ()" e spiegheremo in dettaglio il metodo "QCUT ()" qui. Ti spiegheremo come facciamo il binning dei dati con l'aiuto della funzione "QCUT ()" in "Panda" in questo tutorial."
Esempio # 01
Applicheremo il metodo "QCUT ()" in questi codici e faremo questi codici nell'app "Spyder". Quando dobbiamo lavorare con i "panda", possiamo accedere alle sue funzioni solo quando importa la libreria "panda" nei nostri codici. Innanzitutto, mettiamo "importazione" e poi scriviamo "Panda come PD". Ora, dobbiamo applicare il metodo "QCut ()", quindi per questo stiamo creando il frame dati qui. Costruiamo "random_df" contenente "r_id, r_name e r_age" come colonne, e anche in "r_id", posizioniamo "R_17, r_21, r_24, r_29, r_31, r_34, r_44, r_46, r_51, r_51, r_55, R_61, R_73 e R_81 ". Quindi aggiungiamo "Theodore, Teddy, Noah, Leo, Ivy, Henry, Freddie, Evelyn, Ava, Willow, Theo, Oscar, Jacob e Harper" nella colonna "R_Name". Dopo questo, inseriamo "21, 33, 12, 43, 22, 7, 21, 51, 72, 19, 10, 9, 37 e 40" nella colonna "R_age". Ora utilizziamo la "print ()", che contiene "random_df" e aiuterà a rendere il frame dati "random_df". Abbiamo appena creato il telaio dati e non applichiamo ancora il metodo "QCUT ()".
L'icona "Esegui" ci aiuta a eseguire i codici. Quando premiamo questa icona "Esegui", il risultato di questo codice viene visualizzato sul terminale dell'app "Spyder". DataFarm "random_df" è mostrato come risultato del codice che abbiamo scritto in questo esempio. Ora applicheremo il metodo "QCut ()" e mostreremo anche il suo risultato.
Stiamo bidiando i dati qui. Stiamo binnando la colonna "r_age" e posizionando il "PD.Metodo QCUT () ", che è il metodo di" panda "che aiuta nel binning dei dati. In questo metodo, inseriamo il nome del frame dati e anche il nome della colonna su cui vogliamo applicare questo metodo "QCUT ()". Abbiamo anche impostato il valore di "Q" su "5" e viene utilizzato per tagliare i dati della colonna "R_age" in cinque quantili uguali. Aggiungiamo il metodo "QCut ()" in "Print ()", quindi visualizzerà anche i dati binning sul terminale.
Qui, i dati dopo il binning vengono visualizzati e taglia il "r_age" in cinque quantili. Visualizza anche le categorie in cui i dati della colonna "R_age" sono bintati. La serie categorica rappresenta i contenitori "r_age".
Possiamo anche regolare l'etichetta per questi bidoni. Aggiungiamo queste etichette del cestino per renderle facili da interpretare. Aggiungiamo una colonna "r_age_qcut" alla "random_df" in cui aggiungiamo le etichette di questi bidoni. Utilizziamo di nuovo il "PD.QCUT () "Metodo per etichettarli. Aggiungiamo le etichette che sono "piccole, non così piccole, mediocre, alte e più alte". Quindi mettiamo di nuovo "random_df" in "print ()".
Tutti i bidoni sono etichettati e presentati in questo risultato. La colonna "R_AGE_QCUT" viene visualizzata in questo frame dati in cui vengono mostrati i bin etichettati.
Esempio # 02
Per la creazione del frame dati, aggiungiamo per la prima volta "voti", che sono "3, 6, 8, 7, 2, 5, 1, 9, 4, 7 e 8". Quindi, aggiungiamo nomi di studenti in "Studenti", che sono "Peter, Bromley, James, David, Alleati, John, James, Samuel, William, Howard e Alexander". Quindi generiamo il "grades_df" in cui abbiamo aggiunto il "PD.Metodo DataFrame () ", e in questo metodo, mettiamo" std_name ", che apparirà come nome della colonna e assegnerà i valori degli" studenti "a questo. Quindi impostiamo gli "studenti_grade" come nome della colonna del frame dati e assegniamo anche "voti" qui, che abbiamo creato sopra. Dopo questo, abbiamo la "print ()" in cui aggiungiamo "gradi_df" per la stampa.
Il frame dati contenente due colonne viene visualizzato nel risultato di questo codice. Ora applicheremo il metodo "QCut ()" alla colonna "Students_Grades" per binning dei dati dei valori di questa colonna.
Aggiungiamo una nuova colonna "Grado" qui in cui abbiamo applicato "PD.QCUT () "alla colonna" Students_Grades "e anche, abbiamo usato" 4 "per il valore della" Q ", quindi taglierà i dati in quattro quantili uguali. Dopo questo, specifichiamo questi quantili qui posizionando i valori in "Q", che sono "0, .4, .8 e 1 ". Quindi, mostriamo anche questo. Ora stiamo etichettando questi dati binnati e le etichette che aggiungiamo qui sono "D, C, A e B" e sono anche archiviate nella colonna "Grado".
Qui, i dati dopo binning vengono visualizzati qui nella colonna "Grado" e taglia i dati della colonna "Students_Grades" in quattro quantili uguali.
Il frame dati che otteniamo dopo aver applicato il metodo "QCut ()" e specificare i quantili viene visualizzato in questo risultato.
Ora, dopo aver aggiunto le etichette a questi contenitori, sono anche resi in questo risultato nella colonna "Grado" e puoi vedere che assegna le etichette secondo i valori del bin.
Esempio # 03
Possiamo anche applicare il metodo "QCut ()" ai dati del file CSV. Per questo, abbiamo letto per la prima volta i dati del file CSV con l'aiuto del metodo "read_csv ()". Stiamo leggendo i dati di "Office2.File CSV ", quindi i dati di questo file vengono inseriti in" Office_DF ". Questo metodo convertirà i dati del file "Office2" nel frame dati e li salverà in "Office_DF". Quindi, mostriamo anche questi dati inserendo "Office_DF" in "Print ()". Successivamente, aggiungiamo una nuova colonna chiamata "Units_Qcut", a cui applichiamo la funzione "PD.QCUT () "nella colonna" unità ".
Inoltre, impostiamo il valore della variabile "Q" su "5", che dividerà i dati in cinque quantili uguali. I dati, dopo aver tagliato 5 quantili uguali, sono archiviati nella colonna "Unità_qcut" e questa colonna viene aggiunta anche a "Office_DF" e "Office_DF" resi di nuovo qui usando "Print ()". Ora stiamo etichettando questi dati binnati, aggiungendo le etichette nel metodo "QCut ()", che sono "Unità 1, unità 2, unità 3, unità 4 e unità 5" e memorizzandoli anche nella colonna "etichette". Renderiamo anche questo frame dati in cui viene aggiunta la colonna "etichette".
I dati che otteniamo dopo aver letto "Office2.Il file CSV ”è reso qui sotto forma di dati di dati. Quindi viene aggiunta la colonna "Unità_qcut", in cui vengono visualizzati i valori binnati della colonna "Unità". Successivamente, viene aggiunta anche la colonna "etichette", che assegna le etichette a questi valori bintati. Tutto questo è fatto usando il metodo "QCut ()" in "Panda".
Conclusione
Abbiamo spiegato in dettaglio il metodo "QCut ()" in questo tutorial che aiuta a bloccare i dati in "Panda". Abbiamo discusso del fatto che i dati sono raggruppati in base al valore "Q" quantile che abbiamo aggiunto nel metodo "QCUT ()", e abbiamo anche regolato le etichette a questi dati binnati. Abbiamo esplorato il metodo "QCut ()" e abbiamo applicato questo metodo alle colonne del Frame dati, e anche abbiamo applicato questo metodo "QCut ()" ai dati del file CSV dopo aver letto i file CSV. Abbiamo presentato il risultato di tutti i codici in questo tutorial per spiegare chiaramente e mostrare il risultato del metodo "QCUT ()".