Questo libro si rivolge ai programmatori che vogliono entrare nel mondo della scienza dei dati scoprendo come unire competenze che spaziano dalla matematica alle analisi di business attraverso - naturalmente - la programmazione. Lo scopo è insegnare come affrontare dati eterogenei trasformandoli in idee e insight.
Nel corso dei vari capitoli vengono presentati gli elementi che un data scientist deve padroneggiare: la definizione del dominio di analisi, il recupero e la pulizia di dati grezzi, il calcolo delle probabilità, i modelli statistici, fino all'applicazione di algoritmi di machine learning. Non mancano approfondimenti su come normalizzare e preparare i dati prima di un'analisi, oltre a suggerimenti su come presentare e comunicare i risultati in modo efficace. Tutti i passaggi chiave sono corredati da esempi di pseudocodice per illustrare al meglio gli algoritmi in uso mentre gli esempi di codice utilizzano prevalentemente il linguaggio Python.