Come leggere il file Excel in Python

Come leggere il file Excel in Python

IL .xlsx è l'estensione del documento Excel che può archiviare una grande quantità di dati in forma tabulare e molti tipi di calcolo aritmetico e logico possono essere eseguiti facilmente in un foglio di calcolo Excel. A volte è necessario leggere i dati dal documento Excel usando lo script Python per scopi di programmazione. Esistono molti moduli in Python per leggere il documento Excel. Alcuni dei moduli utili sono xlrd, OpenPyxl, E panda. I modi per utilizzare questi moduli per leggere il file Excel in Python sono stati mostrati in questo tutorial.

Prerequisito:

Un file di Excel fittizio con il .L'estensione XLSX sarà necessaria per verificare gli esempi di questo tutorial. È possibile utilizzare qualsiasi file Excel esistente o crearne uno nuovo. Qui, un nuovo file Excel chiamato saldi.xlsx Il file è stato creato con i seguenti dati. Questo file ha usato per la lettura utilizzando diversi moduli Python nella parte successiva di questo tutorial.

saldi.xlsx

Data di vendita Venditore Quantità
12/05/18 Sila Ahmed 60000
06/12/19 Mir Hossain 50000
09/08/20 Sarmin Jahan 45000
07/04/21 Mahmudul Hasan 30000

Esempio-1: leggi il file Excel usando XLRD

Il modulo XLRD non è installato con Python per impostazione predefinita. Quindi, devi installare il modulo prima di usarlo. L'ultima versione di questo modulo non supporta il file Excel con il .Estensione XLSX. Quindi, devi installare il 1.2.0 versione di questo modulo per leggere il file xlsx. Eseguire il seguente comando dal terminale per installare la versione richiesta di xlrd.

$ pip Installa xlrd == 1.2.0

Dopo aver completato il processo di installazione, creare un file Python con il seguente script per leggere il saldi.xlsx file usando l'XLRD modulo. open_workbook () La funzione viene utilizzata nello script Apri il file XLSX per la lettura. Questo file Excel contiene solo un foglio. Così il cartella di lavoro.sheet_by_index () La funzione è stata utilizzata nello script con il valore dell'argomento 0. Successivamente, il nidificato 'per' Loop ha usato per leggere i valori della cella del foglio di lavoro usando i valori di riga e colonna. Nello script sono state utilizzate due funzioni di intervallo () per definire la dimensione della riga e della colonna in base ai dati del foglio. IL cell_value () La funzione ha usato per leggere il particolare valore della cella del foglio in ogni iterazione del loop. Ogni campo nell'uscita sarà separato da uno spazio delle schede.

# Importa il modulo XLRD
import xlrd
# Apri la cartella di lavoro
cartella di lavoro = xlrd.Open_workbook ("Vendite.xlsx ")
# Apri il foglio di lavoro
Foglio di lavoro = libro di lavoro.Sheet_by_index (0)
# Itera le righe e le colonne
per i nell'intervallo (0, 5):
per j in gamma (0, 3):
# Stampa i valori della cella con lo spazio delle schede
Stampa (foglio di lavoro.cell_value (i, j), end = '\ t')
stampa(")

Produzione:

Verrà visualizzato il seguente output dopo aver eseguito lo script sopra.

Esempio-2: leggi il file Excel usando OpenPyxl

IL OpenPyxl è un altro modulo Python per leggere il file XLSX e non è inoltre installato con Python per impostazione predefinita. Esegui il seguente comando dal terminale per installare questo modulo prima di utilizzarlo.

$ pip Installa OpenPyxl

Dopo aver completato il processo di installazione, creare un file Python con il seguente script per leggere il saldi.xlsx file. Come il modulo XLRD, OpenPyxl il modulo ha il load_workbook () funzione per aprire il file xlsx per la lettura. IL saldi.xlsx Il file viene utilizzato come valore dell'argomento di questa funzione. L'oggetto del Wookbook.attivo è stato creato nello script per leggere i valori del max_row e il max_column proprietà. Queste proprietà sono state utilizzate nel nidificato per i loop per leggere il contenuto del saldi.xlsx file. La funzione intervallo () è stata utilizzata per leggere le righe del foglio e la funzione ITER_COLS () è stata utilizzata per leggere le colonne del foglio. Ogni campo nell'uscita sarà separato da due spazi delle schede.

# Importa modulo Openyxl
Importa OpenPyxl
# Definisci variabile per caricare il wookbook
wookbook = OpenPyxl.Load_workbook ("Vendite.xlsx ")
# Definisci variabile per leggere il foglio attivo:
foglio di lavoro = wookbook.attivo
# Itera il ciclo per leggere i valori delle celle
Per I in gamma (0, foglio di lavoro.max_row):
per Col in foglio di lavoro.iter_cols (1, foglio di lavoro.max_column):
Stampa (col [i].valore, end = "\ t \ t")
stampa(")

Produzione:

Verrà visualizzato il seguente output dopo aver eseguito lo script sopra.

Esempio-3: leggi il file Excel usando i panda

Il modulo Pandas non è installato con Python simile al modulo precedente. Quindi, se non l'hai installato prima, allora devi installarlo. Eseguire il comando seguente per installare il panda dal terminale.

$ PIP Installa panda

Dopo aver completato il processo di installazione, creare un file Python con il seguente script per leggere il saldi.xlsx file. IL read_excel () La funzione dei panda viene utilizzata per la lettura del file xlsx. Questa funzione ha usato nello script per leggere il saldi.xlsx file. IL DataFrame () La funzione ha utilizzato qui per leggere il contenuto del file XLSX nel frame dati e archiviare i valori nella variabile denominata dati. Il valore dei dati è stato stampato in seguito.

# Importa panda
Importa panda come PD
# Carica il file xlsx
Excel_data = pd.read_excel ('vendite.xlsx ')
# Leggi i valori del file nel frame dati
data = pd.DataFrame (Excel_data, colonne = [
"Data di vendita", "Sales Person", "importo"])
# Stampa il contenuto
print ("Il contenuto del file è: \ n", dati)

Produzione:

Verrà visualizzato il seguente output dopo aver eseguito lo script sopra. L'output di questo script è diverso dai due esempi precedenti. I numeri di riga sono stampati nella prima colonna, in cui il valore di riga è stato contato da 0. I valori della data sono allineati centralmente. I nomi dei venditori sono allineati a destra. L'importo è allineato a sinistra.

Conclusione:

Gli utenti di Python devono lavorare con i file XLSX per diversi scopi di programmazione. In questo tutorial sono stati mostrati tre diversi modi per leggere il file XLSX utilizzando tre moduli Python. Ogni modulo ha diverse funzioni e proprietà per leggere il file XLSX. Questo tutorial aiuterà gli utenti di Python a leggere facilmente il file XLSX utilizzando lo script Python dopo aver letto questo tutorial.