Corso Data Scientist con Python

40 ore
Qualsiasi livello

Strettamente correlati ai Big Data, troviamo il tema del Data Science e la figura professionale del Data Scientist.

La figura del Data Scientist è multidisciplinare, orientata a creare algoritmi matematico-statistici per interpretare ed analizzare i dati. Gli scenari di analisi principali sono per il business. Il lavoro del Data Scientist permette alle aziende di creare vantaggi competitivi sul mercato.

I dati oggetto di analisi sono tantissimi (BIG DATA), non sono strutturati ed hanno origini disparate.

La figura del Data Scientist è oggi richiestissima specialmente dalle multinazionali. E’ stata definita la “professione più sexy del 21esimo secolo” da Hal Varian, Chief Economist di Google in una intervista al New York Times.

Gli strumenti principali utilizzati nella Data Science sono il linguaggio Python con alcune sue librerie.

Il Data Scientist lavora nel settore dell’Information Technology.

Obiettivi del Corso Data Science con Python: formare lo studente con conoscenze basi e tecniche per l’analisi dei dati (Data Scientist) utilizzando il linguaggio di programmazione Python

Requisiti per i discenti: laureandi o laureati in matematica, statistica, informatica o ingegneria con attitudine all’analisi dei dati. Consigliate conoscenze basi di programmazione in Python (in caso lo studente non avesse le basi consigliamo prima di seguire il Corso Python)

Corso Data Scientist con Python erogato solo su richiesta e per le aziende, anche in modalità online virtual classroom.

PROGRAMMA (40 ore):

1. Introduzione al Data Science
Data Science e figura del Data Scientist
Esempi di Data Science
Python per il Data Science

2. Data Analytics
Introduzione alla Data Visualization
Processi in Data Science
Data Wrangli, Data Exploration, Model Selection
EDA:Exploratory Data Analysis
Data Visualization
Plotting
Hypothesis Building e Testing

3. Statistical Analysis e Business Application
Panoramica sulle statistiche
Statistical e Non-Statistical Analysis
Data Distribution: Percentuali,Dispersion e Tendenze
Istogrammi
Curve a  Campana
Hypotetis Testing
Chi-Square Test
Matrice di Correlazione
Statistiche Inferenziali

4. Python: installazione ambiente e fondamenti
Introduzione ad Anaconda
Istallazione di Anaconda su Windows/Mac
Jupiter Notebook: Installazione ed introduzione
Variable Assignment
Tipi di Dati Primitivi: interi, decimali,stringhe e booleani. Typecasting
Creazione, accesso e slicing tuples
Creazione, accesso e slicing lists
Creazione, visualizzazione, accesso e modifica dicts
Operatori Base: “in”,”+” e “*”
Funzioni
Control Flow

5. Mathematical Computing con Python
Panoramica di NumPy
Proprietà, Scopo e Tpi di Ndarray
Classi e Attributi di Ndarray Object
Oprazioni Base: concetti ed esempi
Accedere agli Elementi Array:Indexing, Slicing,Iteration,Indexing con Booleans Arrays
Copie e Viste
Ufunc (Universal Function)
Shape Manipulation
Broadcasting
Linear Algebra

6. Scientific Computing con Python
SciPy e caratteristiche
SciPy sub-Packages: Integrazione e Ottimizzazione
Scipy sub-Packeges: Statistics e Weave
Scipy sub-Packeges: I O

7. Data Manipulation con Python
Introduzione a Pandas
Data Structures
Series
Dataframe
Missing Values
Data Operation
Data Standardization
Pandas File Read and Write Support
Operazioni SQL

8. Machine Learning con Python
Introduzione e Approccio al Machine Learning
Supervised e Unsupervised Machine Learning Models Work
Scikit-Learn
Linear Regression
Logistic Regression
K-NN Model (Nearest Neighbors)
Clustering
Dimensionality Reduction
Pipeline
Model Persistence
Model Evaluetion: Metric Funtion

9. Natural Language Processiong con Scikit-Learn
Panoramica NLP
NLP Approach per Text Data
NLP installazione ambiente
NLP Sentence Analysis
NLP Applications
Librerie NLP
Scikit-Learn Approach
Scikit-Learn Approach Built in Modules
Scikit-Learn Approach Features Extraction
Bag of Words
Scikit-Learn Approach Model Training
Scikit-Learn Grid Search e Multiple Paramenters
Pipeline

10. Data Visualization con Python
Panoramica
Librerie Python
Plots
Matplotlib: introduzione
Line Properties Plot (x,y)
Controlling Lines Patterns e colors
Axis, Labels, Legend Properties
Alpha e Annotation
Multiple Plots
Subplots
Tipi di Plots e Seaborn

11. Data Science con Python Web Scraping
Web Scraping
Common Data-Page Formats on Web
Parser
Objects
Undestanding e searching the Tree
Navigating Options
Modify the Tree
Parsing Only Part del Documento
Stampa e Formattazione
Encoding

Vuoi essere ricontattato?

Lasciaci il tuo numero telefonico e la tua email, ti richiameremo nelle 24h:

    Contattaci su Whatsapp