Pandas Agg Conte

Pandas Agg Conte
In "Pandas" possiamo creare i dati dei dati che contengono rows_and_columns. Grandi quantità di dati tabulari sono generalmente esplorate e organizzate utilizzando il programma Pandas. "Pandas" ci fornisce diversi metodi e uno di questi è il "conteggio", possiamo vedere quanti valori ci sono per ogni colonna nel tuo telaio di dati usando il metodo di conteggio.

Il metodo di conteggio viene utilizzato per individuare colonne incomplete. Da lì, puoi scegliere se saltare le colonne nei processi o, se necessario, dare loro i valori predefiniti. In questa guida, esamineremo il conteggio di Panda e valori_counts che sono due modi per valutare il tuo frame dati.

Esempio # 01

Iniziamo utilizzando l'app "Spyder". Questo ci aiuterà a fare i codici "panda". Nel suo editor di testo, iniziamo il nostro primo codice importando il "Pandas come PD". Questo "PD" è utilizzato per accedere ai metodi "panda" che vogliamo. Ora, non abbiamo bisogno di scrivere il nome completo "Panda" per accedere alla sua funzione. Invece, scriviamo semplicemente "PD".

Creiamo quindi una variabile e inizializziamo anche aggiungendo alcuni dati. Aggiungiamo i dati in colonna impostando il primo nome di colonna come "nomi" e i nomi che aggiungiamo qui sono "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" e "Rick". La colonna successiva è denominata "soggetti" che contiene nomi di materie come "matematica", "economia", "scienza", "matematica", "statistica", "statistica", "statistica" e "computer".

Sotto la variabile, creiamo "numero" e utilizziamo il "PD.Metodo DataFrame () ". Usiamo il "PD" per ottenere il metodo Pandas "DataFrame". Cambiamo i dati "Corsi" in "DataFrame" e aggiorniamo il suo nome come "numero". Quindi, il metodo "print ()" aiuta a visualizzare il frame dati. Di seguito, utilizziamo prima il metodo "GroupBy ()". Ci consente di dividere i tuoi dati in molte categorie in modo da poter eseguire calcoli per un'analisi più approfondita. "GroupBy" questo frame dati mettendo "soggetti" e quindi utilizziamo il metodo "count ()".

La funzione Count () fornisce un'entità in serie con il risultato per ogni riga dopo aver contato il numero di valori non vuoti per ogni riga. Mettiamo entrambi i metodi nella funzione "print ()" in modo che venga visualizzato sul terminale.

Visualizza prima l'originale DataFrame e poi i soggetti "GroupBy" e conta il numero dell'argomento. Aggiunge anche gli stessi soggetti e lo scrive qui. In questo frame dati due colonne contengono l'argomento "matematica" in modo che visualizzi il "2" matematico "e il soggetto" statistica "" 3 ".

Esempio # 02

Ora importamo "panda" e quindi generiamo dati e archiviamo questi dati nella variabile "data123". Abbiamo colonne "dipendenti" e "indirizzo" qui. In "Employee", inseriamo nomi di dipendenti che sono "Ray", "James", "Mole", "Smith", "Jay", "Milli", "William" e "Rick". Nel "indirizzo", abbiamo messo gli indirizzi di quei dipendenti che sono "Londra", "America", "Sodano", "Londra", "Sodano", "Sodano", "America" ​​e "America".

Quindi, dichiariamo e inizializziamo anche "lo stesso" che è un nome variabile e inizializziamo con "PD.DataFrame ". Passiamo anche il parametro "Data123" a questo "PD.DataFrame ". Stiamo utilizzando il metodo "value_count ()" di seguito. La tecnica dei conteggi del valore è migliore. Questa tecnica fornirà il numero totale di valori distinti per una determinata colonna. Diamo qui la colonna "indirizzo".

Abbiamo il nome del frame dati che è "uguale" e aggiunge il nome della colonna che è "indirizzo". Quindi, scrivi la funzione o il metodo "value_count ()". Aggiungiamo questa dichiarazione completa all'interno del metodo "Print ()" in modo che si renderà anche sullo schermo della console.

Dopo aver reso il frame dati in questo risultato, conta gli stessi indirizzi dei dipendenti e li mostra di seguito e rimuove il nome dei dipendenti o rimuove la colonna "dipendente". Mostra solo l'indirizzo e i loro numeri presenti in questo telaio.

Esempio # 03

I dati qui sono inseriti in cinque colonne. Creiamo un telaio di dati chiamato "Studenti" e le colonne che abbiamo sono "roll_no", "s_name", "s_instructor", "s_course" e "credito_hrs". Nella colonna "roll_no", abbiamo "A1, A2, A3, A4 e A5". Ora, nella prossima colonna "S_Name", stiamo aggiungendo i nomi degli studenti "Smith, Noah, Joseph, Mishi e William". Quindi, stiamo mettendo i nomi degli istruttori: "Peter, Taylor, James, Robert e Olivia". I corsi che stiamo inserendo qui sono "inglese, britannico, inglese, arabo e inglese".

Per la colonna "Credit_hrs", aggiungiamo "4, 5, 4, 3 e 4". Modifichiamo tutti questi dati nel frame dati e nominiamo questo frame dati o archiviamo questo frame dati nella variabile "studenti". Quindi, utilizziamo "print ()" che rende questo frame dati. Al di sotto di questo, posizioniamo i metodi "GroupBy ()" e "Count ()". E metti "s_couse" in esso in modo che conta i corsi e li mostra.

Abbiamo 1 corso "arabo", 1 corso "britannico" e 3 corsi "inglesi" qui in questo frame dati. Ottiamo questo conteggio applicando il metodo "Count ()".

Esempio # 04

In questo esempio, il frame dati creato contiene il "upload_date" in cui aggiungiamo alcune date che vengono aggiunte a cinque date. Quindi, inserisci un'altra colonna "Viewer_ids" in cui aggiungiamo gli ID degli spettatori come "V1, V2, V3, V4 e V5". Diamo il nome "Video" a questo frame dati. Usa prima "GroupBy" che raggruppa i dati in base a "upload_date" e quindi utilizza "count ()" che conterrà questi dati in base a "upload_time". Infine, visualizza il risultato.

Questo è il risultato di questo codice e conta i dati in base al "tempo di caricamento" dei video. I video che vengono caricati su "2022-07-21" sono due nel conteggio totale.

Esempio # 05

Lo "studio" è la variabile contenente dati che si trovano nelle forme di colonna e riga. I nomi delle colonne sono "Corsi, C_FEE e C_DURATION". La colonna "Corsi" ha "Pandas, Ubuntu, Linux, Python, Panda, Linux, Spark, Python, Ubuntu, Python e Python". La colonna "C_FEE" contiene "22000, 25000, 23000, 24000, 26000, 25000, 25000, 22000, 25000, 24000 e 24000". La colonna "C_DURATION" contiene dati che sono "30 giorni, 50 giorni, 35 giorni, 40 giorni, 60 giorni, 35 giorni, 30 giorni, 50 giorni, 50 giorni, 40 giorni e 40 giorni".

Modificali in dati e stampano anche il frame dati. "GroupBy ()" i "Corsi e C_Duration" e contali applicando "Count ()". Questi metodi "GroupBy" e "Count" raggruppano i dati in base alle colonne per i corsi e la durata. Quindi, calcola il conteggio.

Qui, raggruppa i dati sui corsi e sulla loro durata e quindi conta questi corsi utilizzando il metodo "Count ()".

Conclusione

Questa guida è sul concetto della funzione "Agg Count" in "Panda."Abbiamo descritto come viene utilizzata la funzione di" conteggio agg "nei panda. Il metodo "Agg Count" è stato applicato alle cinque istanze che abbiamo stabilito.