Python contiene un modulo chiamato Urllib per la gestione delle attività relative al localizzatore di risorse uniformi (URL). Questo modulo è installato in Python 3 per impostazione predefinita e recupera URL di diversi protocolli tramite il urlopen () funzione. Urllib può essere utilizzato per molti scopi, come la lettura del contenuto del sito Web, effettuare richieste HTTP e HTTPS, l'invio di intestazioni di richieste e il recupero di intestazioni di risposta. IL Urllib Il modulo contiene molti altri moduli per lavorare con URL, come Urllib.richiesta, Urllib.analizzare, E Urllib.errore, tra gli altri. Questo tutorial ti mostrerà come utilizzare il modulo Urllib in Python.
Esempio 1: apertura e lettura degli URL con Urllib.richiesta
IL Urllib.richiesta Il modulo contiene le classi e i metodi necessari per aprire e leggere qualsiasi URL. Il seguente script mostra come usare Urllib.richiesta modulo per aprire un URL e leggere il contenuto dell'URL. Qui, il urlopen () Il metodo viene utilizzato per aprire l'URL, "https: // www.Linuxhint.com/."Se l'URL è valido, il contenuto dell'URL verrà memorizzato nella variabile oggetto denominata risposta. IL Leggere() metodo del risposta L'oggetto viene quindi utilizzato per leggere il contenuto dell'URL.
#!/usr/bin/env python3Produzione
Il seguente output apparirà dopo aver eseguito lo script.
Esempio 2: URL di analisi e imprudente con Urllib.analizzare
IL Urllib.analizzare Il modulo viene utilizzato principalmente per dividere o unirsi ai diversi componenti di un URL. Il seguente script mostra diversi usi del Urllib.analizzare modulo. Le quattro funzioni di Urllib.analizzare utilizzato nel seguente script include urlparse, urlunparse, urlsplit, E urlunsplit. IL urlparse Il modulo funziona come urlsplit, e il urlunparse Il modulo funziona come urlunsplit. C'è solo una differenza tra queste funzioni; questo è, urlparse E urlunparse contenere un parametro extra chiamato 'parametri'Per la divisione e la funzione di giunzione. Qui, l'URL 'https: // linuxhint.com/play_sound_python/'viene utilizzato per la divisione e l'adesione all'URL.
#!/usr/bin/env python3Produzione
Le seguenti quattro uscite appariranno dopo aver eseguito lo script.
Esempio 3: Lettura Intestazione di risposta di HTML con Urllib.richiesta
Il seguente script mostra come le diverse parti dell'intestazione di risposta dell'URL possono essere recuperate tramite il informazioni() metodo. IL Urllib.richiesta Modulo usato per aprire l'URL, "https: // linuxhint.com/python_pause_user_input/,'e le informazioni di intestazione di questo URL sono stampate tramite il informazioni() metodo. La parte successiva di questo script ti mostrerà come leggere ogni parte dell'intestazione separatamente. Qui, il server, Data, E Tipo di contenuto I valori sono stampati separatamente.
#!/usr/bin/env python3Produzione
Il seguente output apparirà dopo aver eseguito lo script.
Esempio 4: lettura delle risposte URL riga per linea
Un indirizzo URL locale viene utilizzato nel seguente script. Qui, un file HTML di test denominato test.html è creato nella posizione, var/www/html. Il contenuto di questo file viene letto riga per riga tramite il per ciclo continuo. IL striscia() il metodo viene quindi utilizzato per rimuovere lo spazio da entrambi i lati di ogni linea. È possibile utilizzare qualsiasi file HTML dal server locale per testare lo script. Il contenuto del test.html Il file utilizzato in questo esempio è riportato di seguito.
test.html:
Produzione
Il seguente output apparirà dopo aver eseguito lo script.
Esempio 5: gestione delle eccezioni con Urllib.errore.Urlerror
Il seguente script mostra come usare il Urlerror in Python tramite il Urllib.errore modulo. Qualsiasi indirizzo URL può essere preso come input dall'utente. Se l'indirizzo non esiste, allora un Urlerror verrà sollevata l'eccezione e il motivo dell'errore stamperà. Se il valore dell'URL è in un formato non valido, allora a Valorerror verrà sollevato e l'errore personalizzato verrà stampato.
#!/usr/bin/env python3Produzione
Lo script viene eseguito tre volte nella seguente screenshot. Nella prima iterazione, l'indirizzo URL è riportato in un formato non valido, generando un valorerror. L'indirizzo URL indicato nella seconda iterazione non esiste, generando un urlerror. Un indirizzo URL valido è riportato nella terza iterazione e quindi il contenuto dell'URL viene stampato.
Esempio 6: gestione delle eccezioni con Urllib.errore.Httperror
Il seguente script mostra come usare il Httperror in Python tramite il Urllib.errore modulo. UN Htmlerror Genera quando l'indirizzo URL dato non esiste.
#!/usr/bin/env python3Produzione
Qui, lo script viene eseguito due volte. Il primo indirizzo URL preso come input esiste e il modulo ha stampato un messaggio. Il secondo indirizzo URL assunto come input non esiste e il modulo ha generato il Httperror.
Conclusione
Questo tutorial ha discusso molti usi importanti del Urllib Modulo usando vari esempi per aiutare i lettori a conoscere le funzioni di questo modulo in Python.