Come installare e utilizzare la chiglia in Linux Ottimizza per ottimizzare algoritmi di mining di data

Come installare e utilizzare la chiglia in Linux Ottimizza per ottimizzare algoritmi di mining di data

Chiglia (L'estrazione della conoscenza basata sull'apprendimento evolutivo) è uno strumento software basato su Java specializzato nell'implementazione di algoritmi evolutivi. Dal momento che è un'open source, fornisce un'ampia varietà di algoritmi di scoperta di conoscenze che possono essere utilizzati in esperimenti che alimentano la comunità di data mining e analisi. Fornisce un'interfaccia utente grafica semplice e di facile utilizzo che riduce significativamente la complessità complessiva di questo strumento. Gli strumenti più simili sul mercato richiedono agli utenti di interagire con loro scrivendo il codice mentre la chiglia rimuove questo requisito fornendo una GUI intuitiva che può essere utilizzata da principianti ed esperti.

Keel fornisce un'ampia varietà di diversi algoritmi basati sull'intelligence computazionale tra cui classificazione, regressione, estrazione delle caratteristiche, analisi dei modelli, clustering e altro ancora. Con i modelli mainstream cotti a cottura nell'applicazione stessa, la chiglia è uno strumento molto utile quando si tratta di eseguire analisi dei dati esplorativi su set di dati grezzi. La sua semplice interfaccia di trascinamento di trascinamento associato alla facilità di funzionalità dell'utilizzo consente una sperimentazione di data mining rapida ed efficiente sia per scopi educativi che di ricerca. Strumenti come la chiglia stanno aumentando di popolarità a causa del loro approccio semplicistico alle pratiche algoritmiche altrimenti complesse.

Installazione

Esistono due modi principali in cui possiamo installare Chiglia Su qualsiasi macchina Linux. Il primo prevede di andare alla pagina web della chiglia e scaricare il software da lì. Il secondo, che seguiremo in questa guida di installazione, ci richiede di scaricare la chiglia usando il Wget Strumento di download disponibile per gli utenti Linux.

1. Iniziamo ottenendo Wget Sulla nostra macchina Linux.

Esegui il comando seguente per scaricare il wget usando il Apt Gestore dei pacchetti:

$ sudo apt-get installa wget

Vedrai un'output del terminale simile:

2. Ora che abbiamo il Wget Strumento installato sul nostro macchina Linux, lo utilizziamo per scaricare il Chiglia attrezzo.

Questo è il link che passiamo a Wget.

Esegui il seguente comando nel tuo terminale:

$ wget http: // sci2s.ugr.ES/Keel/Software/Prototipi/OpenSrion/Software-2018-04-09.cerniera lampo

Dovresti vedere un output simile sul tuo terminale:

Una volta che la chiglia è terminata, possiamo continuare con il resto dell'installazione.

3. Ora estraggiamo il file compresso che abbiamo scaricato nel passaggio precedente utilizzando lo strumento UNZIP Linux.

Esegui il seguente comando:

$ Unzip Software-2018-04-09.cerniera lampo

Dovresti vedere un'output simile nel terminale:

4. Passare nella cartella a chiglia eseguendo il comando seguente:

$ CD Software-2018-04-09/DocumentO/Experimentos/Keel/Dist/

5. Esegui il comando seguente per iniziare con l'installazione:

$ java -jar ./GraphInterkeel.vaso

Con questo, la chiglia dovrebbe essere disponibile per l'uso sulla macchina Linux.

Guida utente

Interagendo con il Chiglia L'applicazione è davvero facile e semplice. Iniziamo importando il set di dati IRIS nel nostro spazio di lavoro.

Man mano che importa i dati, lo strumento ci mostra il clustering generale del punto dati nel set di dati. Ci mostra anche le diverse classi che sono presenti nel set di dati insieme alle informazioni di base come le gamme numeriche che questi punti dati si estendono e la varianza complessiva e i valori medi che presentano. Queste informazioni consentono agli utenti di comprendere meglio come procedere con la preparazione dei dati per qualsiasi tipo di attività di analisi dei dati.


Procedendo ulteriormente nella sperimentazione, incontriamo le diverse tecniche che possono essere utilizzate per creare il nostro esperimento su qualsiasi set di dati. I diversi algoritmi di apprendimento che possono essere utilizzati sui nostri dati possono essere visti nella seguente immagine. A seconda della natura del set di dati e dei requisiti dell'esperimento, possono essere sperimentati diversi algoritmi.

Ad esempio, se si lavora con dati senza etichetta e devi trovare somiglianze tra i diversi punti dati nel set di dati, utilizzando un algoritmo di clustering dalle varie opzioni disponibili può aiutarti a comprendere meglio i punti dati. Questo alla fine ti aiuta a etichettare e classificare i punti dati in modo che l'esperimento possa essere costruito al momento dell'utilizzo di algoritmi di apprendimento supervisionati più completi.

Conclusione

IL Chiglia La piattaforma per l'analisi dei dati è una buona risorsa sia per la ricerca che per gli scopi educativi. È facile da usare Interfaccia utente grafica aiuta gli utenti a comprendere meglio i requisiti dei dati e fornire riferimenti logici a tecniche e algoritmi utili che aiutano ulteriormente gli utenti nei loro flussi di lavoro. Avere una vasta gamma di algoritmi diversi che rientrano nelle diverse categorie e tecniche algoritmiche consentono agli utenti di sperimentare numerose direzioni logiche e confrontare questi risultati in modo da raggiungere la soluzione più ottimale a qualsiasi problema.

L'approccio di trascinamento gratuito del codice di Keel al data mining aiuta anche i principianti a lavorare senza sforzo con modelli di intelligence computazionale completi. Ciò fornisce approfondimenti su set di dati complessi e conseguentemente deriva utili inferenze che aiutano a risolvere i problemi del mondo reale.