La scienza dei dati è il campo di studio che gestisce grandi quantità di dati utilizzando metodi scientifici, processi, algoritmi e sistemi per trovare i modelli invisibili, trarre informazioni significative, prendere decisioni aziendali nelle aziende e anche utilizzare negli istituti non business. Gli istituti non business includono Industries per l'assistenza sanitaria, i giochi, il riconoscimento delle immagini, i sistemi di raccomandazione, la logistica, il rilevamento delle frodi (istituti bancari e finanziari), la ricerca su Internet, il riconoscimento vocale, la pubblicità mirata, la pianificazione del percorso delle compagnie aeree e la realtà aumentata. La scienza dei dati è un sottoset di intelligenza artificiale. I dati utilizzati per l'analisi possono provenire da molte fonti diverse ed sono presentati in vari formati. Alcuni dei dati di origine possono essere standardizzati; Altri potrebbero non essere standardizzati.
Per dirla in un altro modo, vengono utilizzate diverse metodologie per raccogliere i dati (plurale del dato). Quindi, la conoscenza (preziose conclusioni) viene estratta dai dati assemblati. Nel processo, dopo che i dati sono stati raccolti, la ricerca viene condotta su di essi (dati) per ottenere nuovi dati (risultati) da cui i problemi vengono risolti.
La scienza dei dati come disciplina (maggiore) esiste a livello di laurea e master presso l'università. Tuttavia, solo poche università nel mondo offrono la scienza dei dati al titolo di laurea o master. A livello di laurea, gli studenti si sono laureati in scienze dei dati. Questo è come un grado di scopo generale. A livello di master, lo studente parte con una laurea post -laurea in scienze dei dati, specializzato in analisi dei dati, ingegneria dei dati o come scienziata dei dati.
Potrebbe sorprendere il lettore e forse sfortunatamente, l'apprendimento automatico, la modellazione, le statistiche, la programmazione e i database sono conoscenze prerequisiti per studiare la scienza dei dati al livello di laurea nonostante il fatto che siano i corsi universitari rispettati nei loro diritti Altre discipline a livello di laurea o livello del master. Nonostante, quando uno studente va in un'università per studiare la scienza dei dati a livello di laurea, tutti questi corsi saranno ancora studiati, insieme a prima dei corsi adeguati, per la scienza dei dati.
Data Science per la laurea o le sue specializzazioni come l'analisi dei dati, l'ingegneria dei dati o come scienziato di dati sono ancora in fase di sviluppo; Sebbene abbiano raggiunto una fase che sono applicati nelle industrie dopo essere stati studiati (all'università). La scienza dei dati è una disciplina relativamente nuova, nel complesso.
Ricorda che dovresti prima essere un generalista prima di diventare uno specialista. Le distinzioni tra i programmi di specialisti non sono ancora chiare. Le distinzioni tra il generalista e i programmi specialisti non sono ancora chiare.
Poiché la scienza dei dati è una disciplina relativamente nuova, i libri prescritti in questo documento si basano sulla copertura dei contenuti e non sulla pedagogia (quanto bene insegna il libro). E sono per il programma di laurea (generalisti). Ci sono diversi corsi generalisti.
La lista
Per maggiori dettagli e possibili acquisto con carta di credito, viene fornito un collegamento ipertestuale per ciascuno dei libri. Nessuno dei libri copre tutti i corsi generalisti.
Matematica essenziale per la scienza dei dati: calcolo, statistica, teoria della probabilità e algebra lineare
Scritto da: Hadrien Jean
Il contenuto di questo libro può essere visto come il corso di matematica per la scienza dei dati. Sebbene non sia raccomandato di imparare la scienza dei dati da soli.
Contenuto: calcolo; Statistiche e probabilità; Algebra lineare; Scalari e vettori; Matrici e tensori; Span, dipendenza lineare e trasformazione dello spazio; Sistemi di equazioni lineari; Autovettori e autovalori; Scomposizione di un valore singolo.
https: // www.EssentialMathFordataScience.com/
Una guida di buon senso a strutture e algoritmi di dati: livellare le tue capacità di programmazione principale / 2a edizione
Scritto da: Jay Wengrow
Questo libro si occupa di algoritmi e strutture di dati utilizzate nella scienza dei dati. Supponendo che qualcuno stia imparando la scienza dei dati da solo dopo essersi laureato al liceo, questo è il prossimo libro da leggere dopo aver letto il precedente libro di matematica. I programmi di esempio sono riportati in Javascript, Python e Ruby.
Contenuto: perché le strutture di dati contano; Perché gli algoritmi contano; O si! Grande notazione o; Accelerando il tuo codice con grande o; Ottimizzare il codice con e senza grande o; Ottimizzazione per scenari ottimisti; Grande o nel codice quotidiano; Ricerca rapida ardente con tavoli da hash; Crafting Codice elegante con pile e code; Ricorsivamente ricorsi con ricorsione; Imparare a scrivere in ricorsivo; Programmazione dinamica; Algoritmi ricorsivi per velocità; Strutture di dati basate su nodi; Accelerare tutte le cose con alberi di ricerca binari; Mantenendo le tue priorità dritte con cumuli; Non fa male a Trie; Collegando tutto con i grafici; Affrontare i vincoli di spazio; Tecniche per l'ottimizzazione del codice
Scienza dei dati più intelligenti: riuscire con dati di livello aziendale e progetti di intelligenza artificiale / 1st Edizione
Scritto da: Neal Fishman, Cole Stryker e Grady Booch
Contenuto: arrampicarsi sulla scala dell'IA; Inquadratura della parte I: considerazioni per le organizzazioni che utilizzano AI; Inquadratura della parte II: considerazioni per lavorare con dati e intelligenza artificiale; Uno sguardo alle analisi: più di un martello; Attenzione all'analisi: non tutto può essere un chiodo; Affrontare le discipline operative sulla scala dell'IA; Massimizzare l'uso dei dati: essere guidato dal valore; Valorizzare i dati con analisi statistica e consentire un accesso significativo; Costruire per il lungo termine; Una fine del viaggio: un IA per AI.
Apprendimento automatico: una prospettiva probabilistica (Serie di calcolo adattivo e apprendimento automatico) Edizione illustrata
Scritto da: Kevin P. Murphy
Questo libro fa bene ai principianti. Anche. Il tipico principiante qui è un laureato in liceo con un passaggio in matematica e informatica.
Contenuto: Introduzione (Machine Learning: cosa e perché?, Apprendimento senza supervisione, alcuni concetti di base nell'apprendimento automatico); Probabilità; Modelli generativi per dati discreti; Modelli gaussiani; Statistiche bayesiane; Statistiche frequentiste; Regressione lineare; Regressione logistica; Modelli lineari generalizzati e famiglia esponenziale; Modelli grafici diretti (reti Bayes); Modelli di miscela e l'algoritmo EM; Modelli lineari latenti; Modelli lineari sparsi; Chicchi; Processi gaussiani; Modelli di funzione di base adattiva; Modelli Markov e nascosti Markov; Modelli di spazio sullo spazio; Modelli grafici non diretti (campi casuali di Markov); Deduzione esatta per i modelli grafici; Inferenza variazionale; Più inferenza variazionale; Monte Carlo Inferenza; Catena di Markov Monte Carlo (MCMC) Inferenza; Raggruppamento; Apprendimento della struttura del modello grafico; Modelli variabili latenti per dati discreti; Apprendimento approfondito.
Data Science for Business: cosa devi sapere sul data mining e sul pensiero analitico / 1a edizione
Scritto da: Tom Fawcett e Foster Provost
Contenuto: pensiero analitico dati; Problemi aziendali e soluzioni di scienze dei dati; Introduzione alla modellazione predittiva: dalla correlazione alla segmentazione supervisionata; Adattarsi a un modello ai dati; Eccessivo e il suo evitamento; Somiglianza, vicini e cluster; DECICIONE PENSIERE ANALITICE I: Cos'è un buon modello?; Visualizzare le prestazioni del modello; Prove e probabilità; Rappresentando e minerario; Decision Analytic Thinking II: verso l'ingegneria analitica; Altre attività e tecniche di scienze dei dati; Scienza dei dati e strategia aziendale; Conclusione.
https: // www.Amazon.com/dati-science-business-data-analitico-pensiero/dp/b08vl5k5zx
Statistiche pratiche per i data scientist: oltre 50 concetti essenziali che utilizzano R e Python / 2nd Edition
Scritto da: Peter Bruce, Andrew Bruce e Peter Gedeck
Contenuto: analisi dei dati esplorativi, distribuzioni di dati e campionamento, esperimenti statistici e test di significatività, regressione e previsione, classificazione, apprendimento automatico statistico, apprendimento non supervisionato.
Il libro di Why: The New Science of Cause and Effect
Scritto da: Giudea Pearl, Dana Mackenzie
Mentre molti libri di scienze dei dati utilizzano l'industria del business puro per l'illustrazione, questo libro utilizza l'industria medica e altre discipline per l'illustrazione.
Contenuto: Introduzione: Mind Over Data; La scala della causalità; Dai bucanieri alle cavie: la genesi dell'inferenza causale; Dalle prove alle cause: il reverendo Bayes incontra MR. Holmes; Confondimento e deconfounding: o, uccidere la variabile in agguato; Il dibattito pieno di fumo: cancellare l'aria; Paradossi a bizzeffe!; Oltre la regolazione: la conquista dell'intervento del monte; Controfatti: mondi minerari che avrebbero potuto essere; Mediazione: la ricerca di un meccanismo; Big data, intelligenza artificiale e grandi domande.
Costruisci una carriera nella scienza dei dati
Scritto da: Emily Robinson e Jacqueline Nolis
Contenuto: iniziare con la scienza dei dati; Trovare il tuo lavoro di scienze dei dati; Stabilirsi nella scienza dei dati; Crescere nel tuo ruolo di scienza dei dati.
https: // www.Manning.com/libri/build-a-car-in-data-science
Data Science for Dummies / 2nd Edition
Scritto da: Lillian Pierson
Questo libro presuppone che il lettore abbia già le conoscenze prerequisite in matematica e programmazione.
Contenuto: avvolgimento della testa per la scienza dei dati; Esplorare condotte e infrastrutture di ingegneria dei dati; Applicare approfondimenti basati sui dati alle imprese e al settore; Apprendimento automatico: apprendimento dai dati con la macchina; Matematica, probabilità e modellazione statistica; Utilizzo del clustering per suddividere i dati; Modellare con istanze; Costruire modelli che gestiscono dispositivi Internet di Things; Seguendo i principi della progettazione della visualizzazione dei dati; Usando D3.JS per la visualizzazione dei dati; Applicazioni basate sul Web per la progettazione di visualizzazione; Esplorare le migliori pratiche nel design del cruscotto; Fare mappe da dati spaziali; Usare Python per la scienza dei dati; Utilizzando l'open source R per la scienza dei dati; Utilizzo di SQL nella scienza dei dati; Fare scienza dei dati con Excel e Knime; Scienza dei dati nel giornalismo: inchiodare i cinque WS (e un H); Approfondire la scienza dei dati ambientali; Scienza dei dati per guidare la crescita nel commercio elettronico; Utilizzare la scienza dei dati per descrivere e prevedere l'attività criminale; Dieci risorse fenomenali per dati aperti; Dieci strumenti e applicazioni gratuiti per la scienza dei dati.
Estrazione di set di dati enormi / 3Rd Edizione
Scritto da: Jure Leskovec, Anand Rajaraman, Jeffrey David Ullman
Questo libro presuppone inoltre che il lettore abbia già le conoscenze prerequisite in matematica e programmazione.
Contenuto: data mining; MapReduce e il nuovo stack del software; Algoritmi che utilizzano MapReduce; Trovare oggetti simili; Flussi di dati di mining; Analisi dei collegamenti; Elementi frequenti; Raggruppamento; Pubblicità sul web; Sistemi di raccomandazione; Mining di grafici di social network; Riduzione della dimensionalità; Apprendimento automatico su larga scala.
Conclusione
Le distinzioni tra i programmi di specialisti non sono ancora chiare. Anche le distinzioni tra i programmi generalisti e specialisti non sono ancora chiare. Tuttavia, dopo aver letto l'elenco dei libri, il lettore sarà nella posizione per apprezzare meglio i ruoli speciali di analisti di dati, ingegneria dei dati e scienziati dei dati e quindi andare avanti.