I panda applicano la funzione su ogni riga

I panda applicano la funzione su ogni riga
Panda fornisce molte funzioni che rendono facile analizzare e manipolare i dati. Utilizziamo quelle funzioni per rendere le nostre attività più facili e veloci. Applichiamo le funzioni alle righe e alle colonne. Per applicare la funzione a ciascuna riga in un telaio di dati "panda" specificato, utilizziamo il metodo Applica (). Quando dobbiamo invocare qualsiasi funzione per aggiornare ogni riga in un telaio di dati "panda", utilizziamo la funzione "Applica ()". È necessario impostare l'asse = 1 variabile per mettere una funzione su ogni riga () nel frame dati "Panda". Utilizziamo la funzione "Applica ()" in "Panda" in questa guida con quattro metodi unici usando serie, funzioni personalizzate, espressioni Numpy e Lambda.

Sintassi:

DataFrame_Object.Applica (func, axis = 0, raw = false, result_type = nessuno, args = (), ** kwargs)

Parametri:

  1. Func: Una funzione personalizzata/integrata che può essere applicata sulle righe/colonne.
  2. asse: colonne (1), indice (0)
  3. skipna: Ignora i valori NA/NULL durante il calcolo del risultato.
  4. risultato_type: Tipo di restituzione del risultato come serie, dati di dati, ecc.
  5. Args: Specificare gli argomenti.

Metodo 1: applicare () con funzione personalizzata

Per eseguire alcune operazioni su tutte le righe nel Frame dati Pandas, dobbiamo scrivere una funzione che eseguirà il calcolo e passerà il nome della funzione all'interno del metodo Applica (). Con questo, la funzione viene applicata a ogni riga.

panda.DataFrame_Object.Applica (Custom_Function)

Esempio:
In questo esempio, stiamo avendo un telaio di dati denominato "Analisi" con 4 colonne di tipo intero. Ora scriviamo due funzioni personalizzate su queste 4 colonne.

  1. "Operation1" aggiunge righe in tutte le colonne. Il risultato attraverso ciascuna colonna viene archiviato nella colonna "Risultato aggiuntivo".
  2. "Operation2" moltiplica le righe in tutte le colonne. Il risultato attraverso ciascuna colonna viene archiviato nella colonna "Risultato di moltiplicazione".
Panda di importazione
# Crea dati di dati utilizzando gli elenchi
Analisi = panda.DataFrame ([[23,1000,34,56],
[23.700,11,0],
[23,20,4,2],
[21.400,32,45],
[21.100.456.78],
[23.800.90,12],
[21.400,32,45],
[20,120,1,67],
[23.100.90,12],
[22.450,76,56],
[22,40,0,1],
[22,12,45,0]
], colonne = ['point1', 'point2', 'point3', 'point4'])
# Visualizza il telaio di dati - Analisi
Stampa (analisi)
# Funzione che aggiunge ogni riga per tutte le colonne.
DEF Operation1 (riga):
RITORNO ROW [0]+ROW [1]+ROW [2]+ROW [3]
# Funzione che aggiunge ogni riga per tutte le colonne.
DEF Operation2 (riga):
ROW ROW [0]*ROW [1]*ROW [2]*ROW [3]
# Passa la funzione al metodo Applica () e memorizzalo nella colonna "Risultati aggiuntivi"
Analysis ['Aggiungi risultato'] = Analisi.Applica (Operation1, Axis = 1)
# Passa la funzione al metodo Applica () e memorizzala nella colonna "Risultato di moltiplicazione"
Analisi ['risultato di moltiplicazione'] = analisi.Applica (Operation2, Axis = 1)
stampa()
Stampa (analisi)

Produzione:

Spiegazione:
Passiamo la funzione "Operation1" e "Operation2" alla funzione Applica () uno dopo l'altro. Puoi vedere che la somma di tutti i valori in ogni riga è memorizzata nella colonna "Risultato aggiuntivo" e il prodotto di tutti i valori in ogni riga è memorizzato nella colonna "Risultato di moltiplicazione".

Metodo 2: Applica () con espressione di lambda

Qui, passiamo la lambda come parametro alla funzione Applica () e facciamo il calcolo all'interno di sé.

panda.DataFrame_Object.Applica (lambda x: calcolo, asse = 1)

Esempio:
Aggiungiamo e moltiplichiamo quattro righe come l'esempio precedente e archiviarle in due colonne.

Panda di importazione
# Crea dati di dati utilizzando gli elenchi
Analisi = panda.DataFrame ([[23,1000,34,56],
[23.700,11,0],
[23,20,4,2],
[21.400,32,45],
[21.100.456.78],
[23.800.90,12],
[21.400,32,45],
[20,120,1,67],
[23.100.90,12],
[22.450,76,56],
[22,40,0,1],
[22,12,45,0]
], colonne = ['point1', 'point2', 'point3', 'point4'])
# Aggiungi tutte le righe e memorizzale nella colonna "Aggiunta".
Analysis ['Aggiungi risultato'] = Analisi.Applica (Lambda Record: Record [0]+Record [1]+Record [2]+Record [3], Axis = 1)
# Moltiplica tutte le righe e memorizzale nella colonna "Reso di moltiplicazione".
Analisi ['risultato di moltiplicazione'] = analisi.Applica (Lambda Record: Record [0]*Record [1]*Record [2]*Record [3], Axis = 1)
stampa()
Stampa (analisi)

Produzione:

Spiegazione:
Le espressioni utilizzate sono le seguenti:

# Aggiungi tutte le righe e memorizzale nella colonna "Aggiunta".
Analysis ['Aggiungi risultato'] = Analisi.Applica (Lambda Record: Record [0]+Record [1]+Record [2]+Record [3], Axis = 1)
# Moltiplica tutte le righe e memorizzale nella colonna "Reso di moltiplicazione".
Analisi ['risultato di moltiplicazione'] = analisi.Applica (Lambda Record: Record [0]*Record [1]*Record [2]*Record [3], Axis = 1)

Puoi vedere che la somma di tutti i valori in ogni riga è memorizzata nella colonna "Aggiunta" e il prodotto di tutti i valori in ciascuna riga è memorizzato nella colonna "Risultato di moltiplicazione".

Metodo 3: Applica () con Panda.Serie

Se si desidera modificare la riga separatamente o si desidera aggiornare tutte le righe individualmente, puoi farlo passando la serie all'interno dell'espressione Lambda.

panda.DataFrame_Object.Applica (Lambda X: Panda.Serie (calcolo), asse = 1)

Esempio:
Sottraggiamo 10 da tutte le colonne.

Panda di importazione
# Crea dati di dati utilizzando gli elenchi
Analisi = panda.DataFrame ([[23,1000,34,56],
[23.700,11,0],
[23,20,4,2],
[21.400,32,45],
[21.100.456.78],
[23.800.90,12],
[21.400,32,45],
[20,120,1,67],
[23.100.90,12],
[22.450,76,56],
[22,40,0,1],
[22,12,45,0]
], colonne = ['point1', 'point2', 'point3', 'point4'])
# Sottrai 10 da tutte le righe
Analisi = Analisi.Applica (record Lambda: Panda.Serie ([record [0] -10, record [1] -10, record [2] -10, record [3] -10]), axis = 1)
Stampa (analisi)

Produzione:

Spiegazione:
Le espressioni utilizzate sono le seguenti:

Analisi = Analisi.Applica (record Lambda: Panda.Serie ([record [0] -10, record [1] -10, record [2] -10, record [3] -10]), axis = 1)

Puoi vedere che i valori in tutte le colonne sono sottratti da 10.

Metodo 4: Applica () con funzioni numpy

Usiamo le funzioni numpy per eseguire il calcolo su tutte le righe in Pandas DataFrame.

panda.DataFrame_Object.Applica (funzione numpy, axis = 1)

Esempio:
Usiamo la funzione numpy per restituire quanto segue:

  1. La somma di tutte le file usando numpy.somma().
  2. La media di tutte le file usando numpy.Significare().
  3. Il massimo tra ogni riga che usa numpy.max ().
  4. Il minimo tra ogni riga usando numpy.min ().

Archiviamo il risultato in quattro diverse colonne.

Panda di importazione
importa numpy
# Crea dati di dati utilizzando gli elenchi
Analisi = panda.DataFrame ([[23,1000,34,56],
[23.700,11,0],
[23,20,4,2],
[21.400,32,45],
[21.100.456.78],
[23.800.90,12],
[21.400,32,45],
[20,120,1,67],
[23.100.90,12],
[22.450,76,56],
[22,40,0,1],
[22,12,45,0]
], colonne = ['point1', 'point2', 'point3', 'point4'])
# Ottieni una somma totale delle righe e memorizza in "somma"
Analysis ['Sum Result'] = Analysis.Applica (numpy.somma, asse = 1)
# Ottieni la media delle righe e memorizza in "Somma Sum"
Analisi ['Risultato medio'] = Analisi.Applica (numpy.medio, asse = 1)
# Ottieni il valore massimo da ogni riga e memorizza in "Risultato massimo"
Analisi ['Max Risult'] = Analysis.Applica (numpy.max, asse = 1)
# Ottieni un valore minimo da ogni riga e memorizza nel "risultato min"
Analysis ['min risultato'] = analisi.Applica (numpy.min, asse = 1)
Stampa (analisi)

Produzione:

Conclusione

Abbiamo fornito questa guida per spiegare come utilizzare la funzione Applica () in ogni riga. Il nostro obiettivo principale è offrirti una spiegazione buona, facile e dettagliata di questo concetto di funzione "Applica ()". Abbiamo dimostrato quattro esempi distinti in cui abbiamo mostrato come applicare la funzione a ogni riga in "Panda" con l'aiuto della funzione "Applica ()". Abbiamo spiegato che quando vogliamo implementare qualsiasi funzione in ogni riga in DataFrame in Panda, utilizziamo la funzione "Applica ()" a tale scopo.