Corso Data Scientist con R
Corso Data Scientist con R: R è un linguaggio interpretato di programmazione ed un ambiente software per il calcolo statistico e per la grafica computazionale. E’ un software libero distribuito con licenza GNU GPL ed è disponibile per diversi sistemi operativi (Windows, Linux, macOS, Unix. Nasce nel 1993 come prima versione sviluppata dal canadese Robert Gentleman e dal neozelandese Ross Ihaka.
R viene usato per l’analisi statistica dei dati in molti settori tra cui la finanza, l’econometria, nella ricerca biomedica ed epidemiologica.
Nel 1997 viene pubblicata la prima versione sul sito CRAN (Comprehensive R Archive Network).
R fornisce un’ampia varietà di tecniche statistiche di modellazione lineare e non lineare, test statistici classici, analisi di serie temporali, classificazione, clustering e grafiche. Il linguaggio R è altamente versatile grazie ad una serie di moduli che espandono le funzionalità. Alcuni esempi sono i moduli che permettono la comunicazione con i database (anche tramite connessione ODBC) o con sistemi informativi geografici come i GIS.
L’interfaccia di R è fornita a “riga di comando”. Tuttavia sono disponibili diverse interfacce grafiche che permettono di integrare R con diversi pacchetti tra cui RStudio che è il più utilizzato.
R è un vero e proprio ambiente dove gli utenti più avanzati per le attività ad alta intensità di calcolo, possono utilizzare il linguaggio C, C++ o Fortran per scrivere codice e manipolare direttamente gli oggetti in R.
Con l’avvento dei Big Data e l’analisi dei dati R viene oggi utilizzato a livello aziendale dai Data Scientist. Oltre all’impiego di Python.
Obiettivi del Corso Data Scientist con R:
Formare lo studente per l’analisi dei dati con R, analisi predittiva, descrittiva. Esplorazione, visualizzazione e rappresentazione dei dati
Requisiti per i discenti Corso Data Scientist con R:
Non sono necessarie basi particolari. Consigliabile a profili di laurea in statistica, matematica ed informatica interessati al data science con R
Per altri corsi in ambito Big Data clicca QUI.
Corso Data Scientist con R attivabile solo per le aziende e su richiesta.
Modalità virtual classroom online in diretta (o frontale in-house).
Programma didattico Corso Data Scientist con R (40 ore)
Introduzione al linguaggio R
Dominio applicativo di R
installazione ambiente di sviluppo
Tipi di dati e Variabile in R
Operatori in R
Dichiarazioni condizionali in R
Loops in R
R script
Funzioni in R
Data Structures
Identificare le Data Structures
Assegnare Valori alle Data Structures
Data Manipulation
Assegnare Valori e Applicare le Funzioni
Data Visualization
Data Visualization con R
Data Visualization utilizzando Ggplot2
Formati di File e Graphic Outputs in R
Statistica per il Data Science
Introduzione alle ipotesi
Tipi di ipotesi
Data Sampling
Livelli di confidenza e significatività
Test di ipotesi
Test parametrico e non parametrico
Test di ipotesi sulla media della popolazione
Test di ipotesi sulla varianza della popolazione
Test di ipotesi sulle proporzioni della popolazione
Analisi di regressione
Panoramica sull’analisi di regressione
Tipi di modelli di analisi di regressione
Regressione lineare
esercitazione con regressione lineare semplice
Regressione non lineare
esercitazione con analisi di regressione con più variabili
Convalida incrociata
Modelli da non lineari a lineari
Analisi del componente principale
Analisi fattoriale
Classificazione
definizione e suoi tipi
Regressione logistica
Supporto macchine vettoriali
K-Nearest Neighbours
Classificatore ingenuo di Bayes
Esercitazione
Classificazione dell’albero decisionale
Esercitazione
Classificazione forestale casuale
Valutazione dei modelli di classificatore
Validazione incrociata K-Fold
Clustering
Metodi di clustering
K-means Clustering
Clustering gerarchico
Associazione
Regola dell’Associazione
Algoritmo Apriori
Esercitazione