Pandas nlargest

Il "panda" è la biblioteca che ci aiuta a svolgere più attività in modo semplice ed efficiente. Possiamo usare la libreria "panda" ogni volta che dobbiamo manipolare e analizzare i dati. "Pandas" offre anche l'opportunità di creare il frame dati. Il frame dati viene generato utilizzando il metodo "Panda". Possiamo anche trovare il valore più grande delle colonne di DataFrame. Quando inseriamo alcuni dati numerici nella colonna di DataFrame, troviamo anche i valori più grandi presenti in quella colonna con l'aiuto del metodo "Panda". Il metodo che possiamo utilizzare per trovare i valori più grandi nelle colonne del telaio di dati è il metodo "nlargest ()". Useremo questo metodo "nlargest" nei codici "panda" in questa guida e spiegheremo il suo lavoro qui.

Sintassi:
DataFrame.nlargest (n, colonne, Keep = "First")

La "N" rappresenta il numero dei valori più grandi che vogliamo ottenere dalle colonne del Frame Data. Quindi, al posto del parametro "colonne", mettiamo il nome della colonna da cui vogliamo ottenere i valori più grandi. Quindi, nel parametro "Keep", possiamo aggiungere "prima" o "ultimo". Il "primo" viene utilizzato per visualizzare il primo valore dei valori duplicati e "ultimo" viene utilizzato per visualizzare l'ultimo valore dei valori duplicati.

Esempio 1:

Il codice iniziale di questa guida è qui. Tutti gli script che copriamo in questa guida sono eseguiti utilizzando lo strumento "Spyder". Importiamo alcuni moduli "panda" ogni volta che desideriamo scrivere un nuovo codice "panda". Questi possono essere importati semplicemente scrivendo i "panda come PD" dopo la parola chiave "importazione", che è quello che facciamo qui. Ora, inserendo il "PD" in questo codice, otteniamo un accesso alle funzioni di "Panda". Ora progettiamo il telaio di dati qui mettendo "PD.DataFrame () ".

Progettiamo il telaio dati "num_df" e ci mettiamo tre colonne. La "cola" è la prima colonna che creiamo in questo frame dati. La "cola" ha "10, 4, 6, 9 e 18". Dopo "Cola", aggiungiamo la seconda colonna "Colb" in cui aggiungiamo anche alcuni numeri che sono "13, 28, 48, 12 e 11". Quindi, l'ultima colonna che inseriamo qui è la colonna "ColC". Nella colonna "ColC", abbiamo messo "21, 24, 31, 44 e 59". Tutte le colonne insieme ad alcuni dati sono inserite nel frame dati "num_df".

Ora utilizziamo "print ()" e passiamo "num_df" a questa funzione. Questo visualizza il "num_df" sul terminale. Vogliamo ottenere i tre più grandi valori dalla colonna "cola" di questo frame dati. Quindi, a questo scopo, utilizziamo il metodo "nlargest ()" e passiamo "3" come primo parametro che rappresenta il numero dei valori più grandi che vogliamo ottenere. Quindi, scriviamo "cola" perché vogliamo ottenere i più grandi valori della colonna "cola" e archiviare questi più grandi valori nella variabile "grande". Quindi, stampiamo questi valori. Quindi, usiamo di nuovo "print ()" che contiene la variabile "grande" in esso. Questi tre più grandi valori di "cola" sono visualizzati sul terminale.

Dopo aver colpito i tasti "Shift+Enter" o premuto l'icona di corsa, possiamo facilmente ottenere il risultato dei codici "Panda" nel "Spyder". Il frame dati è qui in questo risultato che contiene tutti i dati che aggiungiamo ad esso. Quindi, nel seguente dati di dati, vengono visualizzate tre righe. Questi sono i "3" più grandi valori della "cola" che sono resi qui in ordine decrescente.

Esempio 2:

Il "gym_df" è progettato in questo codice in cui aggiungiamo il "peso_loser" e "pesi" come colonne. Nella colonna "Weight_loser", "Theo, Harper, Oscar, Sue, Grace, Jayden, Larry e Taylor". Quindi, abbiamo la colonna "pesi" in cui mettiamo i pesi che sono "99, 101, 119, 89, 102, 85, 86 e 120". Ora, chiamiamo "Print ()" e forniamo l'argomento "Gym_DF". Questo fa sì che il terminal mostri la "ginnastica_ df". Vogliamo ottenere il numero più grande "4" della colonna "pesi" di questo frame dati.

Per raggiungere questo obiettivo, utilizziamo il metodo "nlargest ()" e passiamo il numero "4" come primo parametro, che sta per il numero dei valori più grandi che vogliamo ottenere. Quindi, digitiamo i "pesi" per acquisire i più grandi valori della colonna "pesi". Salviamo anche questi più grandi valori nella variabile "grande_veight". I valori devono quindi essere stampati. Pertanto, usiamo ancora una volta la "print ()". Include la variabile "grandi_weighs". Il terminale mostra i quattro valori più grandi "pesi".

Dopo i dati originali, i più grandi quattro valori della colonna "pesi" vengono visualizzati sotto forma di un altro nuovo telaio di dati. Ottiamo questi quattro più grandi valori utilizzando il metodo "nlargest ()" di "panda" nel codice.

Esempio 3:

In questo esempio, leggiamo il file CSV con l'aiuto del metodo "read_csv" di "panda" e creiamo il frame dati dal file CSV. Archiviamo questo frame dati nella variabile "data_df". Ora utilizziamo il metodo "Dropna ()" in cui regoliamo il parametro "Inplace" su "True". Questo rimuove quelle righe in cui appare il valore nullo. Dopo questo, otteniamo il metodo "nlargest ()" e aggiungiamo "5" perché vogliamo ottenere i primi cinque più grandi valori della colonna "unità". Questi cinque valori più grandi sono memorizzati nella variabile "più grande5". Questo "più grande5" è messo in "print ()" per la visualizzazione.

Visualizza tutti i dati del file CSV qui come frame dati dopo averlo letto. Quindi, ottiene i primi cinque più grandi valori di "unità" e li sposta in questo risultato.

Esempio 4:

Questo codice crea "Sales_DF" e aggiunge le colonne "vendite" e "vendite/giorno". "ABC, ABD, ABE, ABF, ABG, ABH, ABI, ABJ, ABK e ABL" sono ora elencati nella colonna "Salesman". La colonna "Sales/Day" segue dove elenchiamo i seguenti prezzi di vendita: "60000, 25000, 30000, 18000, 29000, 21000, 40000, 54000, 33000 e 41000". Ora posizioniamo la "print ()" con l'argomento "sales_df". Questo frame dati "sales_df" appare nel terminale di conseguenza. I più grandi numeri "4" nella colonna "Sales/Day" di questo frame dati sono ciò che desideriamo ottenere da questo telaio di dati.

Il metodo "nlargest ()" viene utilizzato per farlo. Il primo parametro che rappresenta il numero dei più grandi valori che desideriamo ricevere è "4", che viene aggiunto qui. Quindi, aggiungiamo il nome della colonna da cui vogliamo accedere ai valori più grandi. Il nome di quella colonna è la colonna "Sales/Day". Aggiungiamo questo metodo "nlargest ()" in "print ()", quindi viene visualizzato anche sul terminale.

Questo risultato contiene il frame dati con tutti i dati che abbiamo contribuito ad esso nel codice. Quindi, sono mostrate quattro righe nel seguente telaio. Questi sono i più grandi valori "4" della colonna "vendite/giorno". Sono visualizzati in ordine decrescente nella seguente illustrazione:

Conclusione

Questa guida ha descritto completamente il metodo "nlargest ()" di "panda" in dettaglio. Abbiamo imparato in dettaglio la sintassi di questa guida e l'uso di questo metodo. Abbiamo discusso in modo approfondito i parametri di questo metodo e abbiamo anche utilizzato questo metodo "nlargest ()" nel codice "Panda" per mostrare il funzionamento di questo metodo "nlargest ()". Abbiamo spiegato come menzionare il numero dei più grandi valori che vogliamo ottenere e il nome della colonna per ottenere i valori più grandi "N" dalla colonna del frame dati. Abbiamo anche spiegato come ottenere i più grandi valori dal file CSV dopo aver letto i dati dal file CSV in questa guida.

Pitone

Astype numpy

Il metodo ASTYPE () del modulo numpy viene utilizzato per modificare il tipo di dati di un array num...

Piererminio De luca

Postgresql

Come copiare una tabella da un database a un altro in PostgreSQL

Tutorial sul processo passo-passo su come copiare le tabelle da un database a un altro in PostgreSQL...

Dante Palumbo

Pitone

Etichette dell'asse di Seaborn

Gli assi.Funzione set () , funzioni della libreria Matplotlib o le funzioni set_xlabel () e set_ylab...

Dr. Folco Leone