INDICE DI UMCE PANDAS

INDICE DI UMCE PANDAS
"Pandas" è uno dei pacchetti del linguaggio Python che analizza meglio i dati. Lavorare con una vasta scala di dati è frenetico e difficile da gestire. Dato che ci sono molti fattori che passano i dati, uno di questi è "ordinare". Uno dei lavori chiave da completare è l'ordinamento dei dati. I panda hanno una funzione per ordinare i dati nel frame dati utilizzando i loro valori. La funzione è Pandas "sort_value". Questo aiuta a ordinare milioni di quantità di dati in pochi minuti. Nel valore di ordinamento di Panda, i dati vengono ordinati dalla selezione delle colonne in ordine crescente o discendente. Copreremo tutto il modo in cui i valori di ordinamento dei panda possono essere eseguiti. Useremo lo strumento "Spyder" per l'implementazione del codice. Ha un ambiente in lingua Python.

Sintassi

df.sort_values

Il "DF" nella sintassi è un'abbreviazione del "Frame dati". La sintassi sopra ordina la colonna per valore nel frame dati. Invece di utilizzare l'intero frame dati, opera con un'etichetta specifica del frame dati. Di seguito sono riportati i metodi del valore di ordinamento di Pandas che implementeremo con esempi:

  • Valori dell'ordine dei panda in ordine crescente per le colonne specificate.
  • PANDAS Ordina i valori per più colonne (caso I).
  • PANDAS Ordina i valori per più colonne (caso II).
  • I panda ordinano i valori nan all'inizio.

Creazione di un telaio di dati per l'implementazione dei valori di ordinamento dei panda negli esempi

Dopo aver aperto il software "Spyder", importa la libreria Pandas come "PD". Ora, inizia a creare un frame dati. Il frame dati è di dati "auto". Abbiamo i nomi del marchio: "BM", "noi", "HC" e "ZX". Abbiamo anche i prezzi di quelle auto, come "44000", "32000", "52000" e "23000" con il loro anno di produzione "2018", "2019", "2019" e "2020".

L'output mostra il telaio di dati creato con le colonne dei marchi automobilistici, il loro prezzo e il loro anno di produzione.

Esempio 01: Valori dell'ordine di Panda in ordine crescente per le colonne specificate

In questo esempio, utilizzeremo la funzione del valore di ordinamento Panda per ordinare i valori dei dati. Il telaio di dati qui è costituito dai modelli di auto come "WW", "XX", "NN" e "TT" con i loro prezzi "45000", "22000", "33000" e "55000" e i loro anni di produzione sono "2018 "," 2019 "," 2020 "e" 2021 ". I valori di ordinamento dei panda funzionano in base alla selezione della colonna specificata. Qui, faremo l'ordinamento in base al "marchio" della colonna come puoi vedere nel codice. Non abbiamo scritto il crescente nel codice perché non devi menzionare che, per impostazione predefinita, la funzione di ordinamento Panda la esegue in ordine crescente.

Il frame dati visualizza l'ordinamento della colonna "marchio" in ordine crescente.

Esempio 02: Valori di ordinamento dei panda per colonna selezionata in ordine decrescente

Nell'ultimo esempio, abbiamo visto come ordinare i valori in ordine crescente. Non vogliamo i dati ordinati in ascesa sempre. A volte per richiesta, lo vogliamo in ordine discendente. Ora, faremo come ordinare i valori in ordine decrescente. Abbiamo il telaio di dati che ha i dati delle auto come i suoi marchi: "YY", "QQ", "PP" e "BB" con i loro prezzi "38000", "45000", "22000" e "12000". Abbiamo gli anni di produzione e "2019", "2020", "2021" e "2020". Abbiamo selezionato la stessa "colonna" marchio "per ordinare i suoi dati, con i nomi in ordine decrescente semplicemente aggiungendo una condizione" ascendente = false ". Il "Income = true" nel codice è una parola chiave che modifica il comportamento predefinito nel metodo Pandas.

L'output mostra il df ordinato del marchio colonna in ordine decrescente.

Esempio 03: Valori di ordinamento dei panda per più colonne (caso I)

Ora faremo un esempio del valore di ordinamento Panda in più colonne. I dati che abbiamo come marchi di auto "LL", "KK", "HH" e "GG". I loro prezzi sono "45000", "14000", "13000" e "56000" e gli anni di produzione sono "2019", "2020", "2021" e "2018". Qui abbiamo selezionato la colonna "Price" e "Anno" poiché dobbiamo fare l'ordinamento di più colonne. Abbiamo usato la funzione Pandas "Sort_Value" con la "DF" e le colonne selezionate per l'ordinamento.

Qui, nell'output, possiamo vedere che la colonna "prezzo" e "anno" è ordinata con successo.

Esempio 04: Valori di ordinamento dei panda per più colonne (Caso II)

Nell'ultimo esempio, abbiamo effettuato l'ordinamento dei dati in più colonne. E se i due anni avessero lo stesso "anno" di produzione? Qui, riconosceremo questa situazione. I dati sono di auto come "xx", "bb", "ee" e "dd" con i loro prezzi come "12000", "15000", "19000" e "17000". Gli anni dell'auto fabbricati sono "2021", "2019", "2020" e "2020". Come possiamo vedere il "2020" è apparso due volte nella produzione. In questa situazione quale anno dovrebbe essere il primo nei dati se si dovesse sorgere questa domanda? Semplicemente, passerà tutto l'anno se entrambi sono gli stessi. Quindi, controllerebbe il suo valore di prezzo. Quello che ha il prezzo più basso sarà il primo e il più alto andrà dopo. Sulla base dei valori dei dati assegnati, funzionerà se si verifica questo tipo di condizione. Nel codice, abbiamo selezionato la colonna "Anno" e "Brand" per ordinarli con il valore di ordinamento di Panda.

Il display è il valore ordinato sia del marchio che dell'anno. Qui, vediamo che l'anno "2020" appare due volte; Prima con il prezzo "17000" e poi con il prezzo "19000".

Esempio 05: PANDAS Ordina i valori NAN all'inizio

In questo caso importeremo il numpy come NP. Il numpy viene utilizzato per i calcoli numerici dei dati. "NAN" sta per "non un numero". Quindi, quando non c'è numero assegnato nei dati, si presenta come "nan". Faremo l'esempio per far apparire i valori di "nan". La funzione di ordinamento Panda viene utilizzata con "Na_Position" = 'First' ”, ciò significa che la posizione è impostata come prima dei valori non disponibili o null in" DF ". Abbiamo scelto la colonna "anno" per avere i suoi valori "nan" in cima al telaio di dati.

L'output mostra prima il valore NAN nella colonna.

Conclusione

Il valore di ordinamento dei panda è un metodo efficiente e molto benefico. In questo articolo abbiamo coperto ogni possibile metodo per l'ordinamento dei valori nei panda: l'ordine ascendente e discendente della colonna selezionata. Abbiamo fatto l'ordinamento multiplo della colonna, che abbiamo fatto in due modi: il modo normale e la situazione dell'aspetto dell'anno simile. Infine, abbiamo eseguito prima l'ordinamento dei valori "nan" nel frame dati. Ogni metodo del valore di ordinamento di Panda è degno da solo, poiché lavorare su una vasta scala di smistamento dei dati è difficile e quasi impossibile, questa funzione di Pandas ha ottenuto un enorme successo per l'ordinamento dei dati in ogni modo in base alla necessità.