Come installare e utilizzare il rapino in Linux per creare complessi algoritmi di mining di data

Come installare e utilizzare il rapino in Linux per creare complessi algoritmi di mining di data

Sonaglio è uno strumento grafico basato su interfaccia utente che utilizza R correre. Viene utilizzato per il data mining e la visualizzazione. Rattle fornisce alcune funzionalità ai suoi utenti che consentono loro di costruire report di analisi dei dati esplorativi, trasmutare i dati in modo che possano essere eseguiti attraverso diversi modelli statistici e matematici, costruire modelli di apprendimento automatico non supervisionato e supervisionato per i dati e visualizzare i risultati in un visivo, visivo, visivo, visivo modo intuitivo. Questi risultati possono essere visualizzati in grafici, grafici e grafici dimensionali variabili.

Tutto questo è fatto usando il nucleo R funzionalità del framework. Rattle converte tutte le azioni che intraprendi nella sua interfaccia grafica in uno script R eseguito dall'installazione R sottostante. Questo è il modo in cui Rattle può raggiungere tutte le sue potenti funzionalità di analisi dei dati.

Installazione

Installare Sonaglio Sulla tua macchina Linux, avrai bisogno di un wrapper per gestore di pacchetti speciali che sarà in grado di scaricare e installare tutte le dipendenze del pisolino dalla macchina. Questo è il Wajig Strumento per Linux, che funge da wrapper attorno al valore predefinito Apt E dpkg gestori di pacchetti. Ha fornito un'utilità facile ad APT e DPKG e ha aggiunto funzionalità oltre questi due pacchetti.

1. Inizieremo installando Wajig eseguendo il seguente comando nel terminale:

$ sudo apt-get install wajig


Dovresti vedere un'output del terminale simile a questo:


2. Aggiungeremo ora alcuni repository software utilizzando gli archivi di pacchetti personali (PPA) che contengono le dipendenze richieste per eseguire il rapino.

I PPA sono repository di software e applicazioni progettati per funzionare su macchine Linux. Questi consentono agli sviluppatori di distribuire software creato utilizzando il collegamento al repository.

Esegui i seguenti comandi:

$ wajig addrepo PPA: Marutter/rrutter4.0


$ wajig addrepo ppa: c2d4u.Team/C2D4U4.0+



3. Aggiorneremo il Wajig Elenco delle fonti di repository locali in modo che i repository del software abbiamo aggiunto in precedenza possano essere scoperti dal gestore dei pacchetti e successivamente scaricati e installati.

Esegui il seguente comando:

$ wajig distupgrade


4. Poiché il rapino usa R E r-cran Per eseguire correttamente, installeremo quelli che utilizzano il gestore dei pacchetti wajig. Installeremo anche alcune altre dipendenze insieme ai pacchetti R sopra menzionati.

Esegui il seguente comando:

$ wajig Installa libgtk2.0-dev-Base-Dev-R-raccomandato R


Dovresti vedere un output simile alla seguente immagine nel tuo terminale:


5. Con R Ora installato, lo eseguiremo e installeremo Sonaglio dall'interno r.

Esegui il seguente comando per eseguire R:

$ R


Dovresti vedere un prompt R simile aprire nel tuo terminale:


6. Ora installeremo il Sonaglio pacchetto dall'interno r eseguendo i seguenti comandi:

> Installa.pacchetti ("Rattle")


Dovresti vedere un'uscita terminale simile:


Se il comando precedente non funziona per te, prova il seguente comando:

> Installa.pacchetti ("https: // access.togaware.com/rgtk2_2.20.36.2.catrame.gz ", repos = null)
> Installa.pacchetti ("rgtk2")


7. Dopo che entrambi i comandi sono stati scaricati e installati, possiamo caricare il Sonaglio pacchetto nella libreria R.

Esegui il comando seguente nel prompt R:

> Libreria (Rattle)



8. Con Sonaglio caricato nel R Libreria, possiamo eseguirlo eseguendo il seguente comando nel prompt R:

> Rattle ()


Dovresti vedere un'istanza di rapida apertura sulla tua macchina Linux.

Guida utente

Possiamo usare Sonaglio Per configurare la nostra routine di data mining in base ai nostri requisiti. Come puoi vedere nell'immagine sopra, ci sono diverse opzioni che puoi configurare.

Nel Dati Scheda, possiamo selezionare diversi formati di file di dati, inclusi file di valore separati da virgola, file di testo, database aperti e persino dati contenuti negli script. Ciò consente a Rattle di inserire i dati in qualsiasi forma di cui abbiamo bisogno.


Dopo aver importato i dati, possiamo visitare il Trasformare Scheda per apportare modifiche ai nostri dati. Possiamo selezionare categorie singole o più nei nostri dati e fare trasformazioni in base alle nostre esigenze. Possiamo raggiungere rapidamente le cose selezionando i pulsanti di radio in cima e riordinando i dati in base a una priorità o rango che assegniamo. Possiamo normalizzare i dati ridimensionandoli in base a un certo intervallo che forniamo, oppure possiamo aumentare i valori mancanti posizionando il valore medio, minimo o massimo presente in una categoria.


Queste sono solo alcune cose che possiamo fare con il Sonaglio Strumento basato sulla GUI.

Conclusione

Rattle è uno strumento di data mining molto popolare che continua a crescere in popolarità a causa della sua interfaccia utente grafica di facile utilizzo. Non richiede la scrittura di alcun tipo di codice e può essere semplicemente utilizzato interagendo con la sua interfaccia dell'applicazione. Ricercatori, studenti e programmatori in tutto il mondo lo usano per soddisfare i loro requisiti di data mining. Poiché Rattle fornisce un backend R molto sofisticato, può raggiungere complessi requisiti di scienza dei dati statistici e analitici con pochi clic del mouse.

Rattle è uno dei migliori strumenti disponibili per le persone che hanno appena iniziato il loro percorso di scienze dei dati poiché è estremamente potente e fornisce controlli intuitivi da cui gli utenti possono imparare. Il Rattle viene altamente raccomandato dagli analisti di dati junior ed esperti in tutto il mondo a causa della sua innata capacità di aiutare a creare alcune delle pipeline di data mining più potenti utilizzate oggi.