Questo corso di base di programmazione con R per aspiranti data analyst nasce per accompagnare un principiante nella programmazione, dalle basi del linguaggio di programmazione (uno dei pi conosciuti e utilizzati nel campo dell’analisi dati) fino all’utilizzo della statistica descrittiva.Una volta finito questo corso lo studente sar in grado di creare, importare, manipolare e gestire dei dataset. Il corso parte dall’impostazione dell’ambiente di lavoro: vedremo come scaricare, installare e utilizzare alcuni dei pi importanti tool per l’utilizzo di R. Passeremo poi alla creazione degli oggetti: R si basa su alcune strutture che necessario conoscere, come vettori, matrici, liste e dataframe. Una volta che avremo capito come creare e manipolare queste strutture dati, estrarne degli elementi e salvarle in locale sul computer, passeremo all’utilizzo di loop e alla creazione di funzioni. Nella sezione successiva vedremo una serie argomenti utili: come impostare una cartella di lavoro, come installare e richiamare un pacchetto, come ottenere delle informazioni sui dati, dove trovare dei dataset per i test e ottenere aiuto su una funzione.Quando si analizzano dei dati ci si imbatte prima o poi nei dataframe cosiddetti casi x variabili. Vedremo quindi come importare un dataframe dal computer, o da internet, su R. Esistono molte funzioni adatte allo scopo e molti pacchetti che ci sono utili per importare dei dati che sono in alcuni formati particolari, come ad esempio i formati per Excel, il .csv, il .txt o il JSON.Vedremo poi come manipolare i dati, creare nuove variabili, aggregare i dati, ordinarli in maniera orizzontale e longitudinale, unire due dataset. Per fare questo utilizzeremo alcuni pacchetti e funzioni specifiche, come dplyr, tidyr o reshape2. Vedremo anche brevemente come interfacciarci a un database e utilizzare altri pacchetti per snellire la gestione di dataset un po’ pi grandi. R un linguaggio molto importante anche nell’ambito della statistica. Impareremo quindi alcune delle funzioni di base, come calcolo delle medie per riga o per colonna, e le funzioni statistiche pi comuni nell’ambito della statistica descrittiva.Quando si parla di analisi dati, ci troveremo spesso a creare dei grafici per spiegare i nostri dati e le nostre analisi. Per questo motivo dedichiamo una sezione del corso a vedere come creare dei grafici sia con le funzioni della libreria di base, sia con il pacchetto ggplot2. Nelle ultime lezioni del corso vedremo come creare e esportare dei report e delle slide, riepiloghiamo gli argomenti visti e le funzioni utilizzate, e vediamo il materiale di supporto.

Corsi Data Science
Corso: Machine Learning con Python: il Corso Pratico
Fai un passo verso il futuro: AI, Machine Learning e Data Science.Sai cosa accomuna il successo dei pi grandi colossi del web come Google, Amazon