Come installare e utilizzare l'arancione in Linux

Come installare e utilizzare l'arancione in Linux

Orange è un software di data mining che fornisce ai suoi utenti soluzioni uniche e pronte all'uso ai problemi di analisi dei dati quotidiani. Utilizza un'interfaccia di programmazione visiva che consente agli utenti di comprendere e controllare i loro flussi di lavoro di dati in modo visivamente intuitivo. Alla base, utilizza moduli basati su Python che hanno ereditato la loro funzionalità principale da implementare sui dati che vengono caricati in esso. Oltre alle tecniche di data mining, fornisce anche un grande supporto per gli algoritmi di apprendimento automatico che aiutano gli utenti a generare approfondite approfondimenti dai loro dati.

L'arancione è ampiamente utilizzata nel settore dell'istruzione e della ricerca ed è considerato un ottimo strumento da gruppi di ricerca non di programmazione. L'interfaccia di programmazione visiva chiamata Tela arancione semplifica il lavoro di lavoro anche per le persone che non hanno un background completo nella programmazione. La tela funziona consentendo agli utenti di inserire widget che rappresentano alcune funzionalità di base di un flusso di lavoro di analisi dei dati. Questi widget possono quindi essere impilati uno dopo l'altro per creare una pipeline completa che i dati passano e generano l'output richiesto.

Alla fine di questo articolo, sarai in grado di:

    1. Scarica e installa Orange sulla tua macchina Linux
    2. Comprendi l'importanza che detiene per la comunità di scienze dei dati
    3. Impara i diversi modi in cui questo kit di strumenti può essere utile per te

Installazione

Come discusso in precedenza, Orange utilizza moduli Python, motivo per cui può essere facilmente scaricato dal gestore dei pacchetti Python chiamato PIP. Per utilizzare PIP, dobbiamo prima scaricarlo e installarlo.

Segui i passaggi per l'installazione completa di arancione sulla macchina Linux.

1. Innanzitutto, dobbiamo aggiornare il locale Apt repository che utilizzano il seguente comando:

$ sudo apt-get update

Dovresti ottenere un output simile a questo:

2. Dopo aver aggiornato il Apt repository locali, ora installi alcuni pacchetti Python che ti aiuteranno a scaricare e installare Arancia. Questo viene fatto dal momento che Orange è essenzialmente un modulo Python che utilizza alcune funzionalità di base da altri moduli Python per fornire funzionalità di data mining e analisi.

Esegui il comando seguente per scaricare il PIP pacchetti manager e python Virtualenv impostare:

$ sudo apt-get Installa git pithon-pip python-virtuanv

Dovresti ottenere un output simile a questo:

Ora, esegui il secondo comando che scarica tutti i moduli Python necessari che sono richiesti da Orange per eseguire correttamente:

$ sudo apt-get Installa git python3-dev python3-numpy python3-scypy
Python3-Pyqt4 Python-Qt4-dev Python3-Sip-dev libqt4-dev

Nota: Questo comando può richiedere del tempo per completare in esecuzione a seconda della connessione Internet.

In secondo luogo, potresti essere richiesto di premere il Y chiave per accettare l'installazione di altri pacchetti core.

Dovresti aspettarti un output simile a questo:

3. Ora creiamo un ambiente virtuale per installare tutti i Arancia moduli e dipendenze.

Esegui i seguenti comandi:

$ mkdir Orange3env
$ virtualenv -p Python3-System-Site Packages Orange3env


$ Source Orange3env/Local/Bin/Activate



Nota: Se il comando precedente non funziona, eseguire il comando seguente:

$ Source Orange3env/Bin/Activate

4. Installare Arancia chiamando PIP che abbiamo precedentemente scaricato.

Esegui il seguente comando:

$ pip Installa Orange3

Dovresti ottenere il seguente output:

5. L'output riuscito del passaggio precedente significa che Arancia è stato scaricato e installato utilizzando il gestore pacchetti Python PIP.

Ora eseguiamo il seguente comando per eseguire Orange:

$ Python -m Orange.tela



Nota: Se quanto segue Arancia Gli schermi della GUI si aprono, ciò significa che tutti i tuoi sforzi hanno avuto successo e l'arancione è installato e aperto sulla macchina Linux.

Guida utente

Orange è uno strumento Hand on Data Mining e Analysis che consente agli utenti di creare flussi di lavoro di analisi dei dati in modo visivo e interattivo. Ciò significa che è possibile creare modelli complessi utilizzando una semplice tecnica di trascinamento.

Il modulo arancione viene fornito con una tela che può essere utilizzata per trascinare e far cadere i widget che rappresentano le diverse funzionalità. Costruiremo una semplice pipeline in questa guida che importa i dati in arancione e quindi eseguiremo alcune azioni su tali dati e produrre i risultati.

Ad esempio, possiamo vedere tutti i diversi modi nella seguente immagine in cui i dati possono essere importati nello strumento arancione che include l'importazione da tabelle SQL, file CSV, dati di verniciatura e altro ancora.


Importiamo i dati da un file CSV ai fini di questo tutorial.

Ora che abbiamo specificato quale formato di dati ci aspettiamo di inserire nella nostra pipeline, selezioniamo un'azione che vogliamo eseguire su questi dati.

Ora andiamo al Trasformare scheda e selezionare il widget randomizza che prende tutte le voci di dati nei nostri dati e randomizzano il loro ordine.


Ora che sappiamo cosa vogliamo fare con i nostri dati importati, possiamo scegliere come vogliamo visualizzare i risultati di questi dati.

Per la nostra guida, costruiamo un diagramma a barre dei dati randomizzati in modo da poter vedere a quali classi appartengono i dati e quanto dei dati sono contenuti in quelle classi.


Dopo che i dati sono stati importati nel modello che abbiamo creato, attraversa automaticamente l'intera pipeline, facendo strada dall'importazione alla creazione. L'output che riceviamo sui nostri dati può essere visto nel seguente:


Inoltre, possiamo anche semplicemente visualizzare i dati utilizzando il widget Tabella dati nella categoria Visualizza.

Conclusione

Come si può vedere, lavorare in arancione per la scienza dei dati è estremamente facile e intuitivo. Tutto quello che devi fare è trascinare e rilasciare le diverse funzionalità che desideri che i tuoi dati passino e raccolgano gli output. Questo strumento è particolarmente utile per le persone che non hanno uno sfondo di programmazione ma devono comunque eseguire determinate valutazioni sui loro dati. Le comunità di ricerca e accademia usano Arancia abbondantemente poiché consente loro di generare l'inferenza e le intuizioni sui loro dati con relativa facilità e poco o nessuna conoscenza di programmazione precedente.