Corso: Big Data Analytics con Python e Spark 2.4: il Corso Pratico

Riassunto

Impara a utilizzare le Ultime Tecnologie per l’Analisi dei Big Data con il linguaggio di Programmazione pi popolare al mondo – Spark e Python !Siamo entrati nell’era dei Big Data, oggi i dati sono il nuovo petrolio e sapere come elaborarli e analizzarli vuol dire avere un posto di lavoro garantito in un futuro molto prossimo e un vantaggio competitivo enorme rispetto ai rivali in affari.In questo corso impareremo a lavorare con i Big Data utilizzando Spark, il framework per il calcolo distribuito pi popolare al mondo, usato in produzione da giganti come Amazon, Microsoft, Oracle, Verizon e Cisco.Cosa faremo durante il corso ?Nella prima sezione del corso introdurre l’argomento Big Data, vedendo cosa sono, da dover arrivano e come possono essere sfruttati.Vedremo quali sono le principali tecnologie utilizzate per i Big Data: Apache Hadoop, Hadoop MapReduce e Spark, chiarendone le differenze, i punti deboli e i punti di forza.Nella seconda sezione vedremo come installare e configurare Spark su una macchina locale, prima usando VirtualBox per creare una macchina simulata sulla quale installare Ubuntu, poi creando una macchina remota sfruttando gli Amazon Web Service, nello specifico AWS EC2.Nella terza sezione impareremo a creare un cluster di macchine con Spark e lo faremo in due modi differenti:Usando AWS EMR (Elastic MapReduce) Usando DataBricks, piattaforma per l’analisi dei Big Data co-fondata dallo stesso creatore di Spark.Nella quarta sezione studieremo la principale struttura dati di Spark: il Resilient Distributed Dataset (RDD), introducendo la teoria del suo funzionamento per poi eseguire qualche esercizio pratico per studiarne le API.Nella quinta sezione ci sporcheremo le mani con il primo laboratorio in cui analizzeremo un dataset contenente 22.5 milioni di recensioni di prodotti su Amazon.Nella sesta sezione introdurremo una struttura dati a pi alto livello che Spark mette a disposizione dalle sue versioni pi recenti: il DataFrame, parleremo brevemente della suo funzionamento per poi vedere come pu essere utilizzato nella pratica. Vedremo anche come creare una tabella SQL partendo da un DataFrame per poi interrogarla con query di selezione.Nella settima sezione svolgeremo un secondo laboratorio, usando un DataFrame per analizzare ben 28 milioni di recensioni di film.Nell’ottava sezione parleremo di serie storiche (time series) e analizzeremo le azioni di Apple dal 1980 ad oggi.Nella nona sezione parleremo di Machine Learning, scoprendo come funziona e a cosa serve e studiando i due modelli di base rispettivamente per modelli di Regressione e Classificazione:La Regressione LineareLa Regressione LogisticaAl termine di questa sezione introdurremo il modulo MLlib (Machine Learning Library) di Spark, il quale ci permette di costruire modelli di Machine Learning distribuiti.Nelle sezioni dieci e undici vedremo come utilizzare il modulo MLlib con le sue API per il Dataframe, per risolvere semplici problemi di regressione e classificazione, come:Stimare il valore di abitazioni partendo dalle loro caratteristicheRiconoscere un tumore al seno maligno da un’agobiopsiaNella sezione dodici utilizzeremo le conoscenze acquisite sul Machine Learning e MLlib per costruire un modello di Sentiment Analysis utilizzando il dataset di Yelp, il quale contiene oltre 5 GB di recensioni di locali e attivit commerciali. Per addestrare il modello di Machine Learning sull’intero dataset cos grande utilizzeremo un cluster AWS EMR, imparando a configurare un cluster e a importare grandi quantit di dati nel Hadoop File System (HDFS) da un bucket S3 utilizzando l’utility s3-dist-cp.Nella nona sezione introdurremo uno delle estensioni pi hot di Spark: Spark Streaming, che ci permette di analizzare ed elaborare flussi di dati in tempo reale !Nella decima sezione svolgeremo un progetto usando Spark Streaming e le API di Twitter: monitoreremo tutti i tweets pubblicati in tempo reale, relativi ad un determinato argomento selezionato da noi, e creeremo un grafico interattivo con gli hashtags pi popolari !Perch seguire questo corso ?I Big Data sono il futuro, sapere come sfruttarli sar un vantaggio enorme, sia per un professionista che per un imprenditore, non perdere questa occasione !

Prezzo

Il corso Big Data Analytics con Python e Spark 2.4: il Corso Pratico si puo’ acquistare online ed il prezzo è di 184.99 euro. Se è il primo corso che acquisti però puoi richiedere l’offerta speciale che ti consente di comprare Big Data Analytics con Python e Spark 2.4: il Corso Pratico a soli 12,99 euro.

Recensioni ed Opinioni

Il corso online “Big Data Analytics con Python e Spark 2.4: il Corso Pratico” è stato acquistato da molte persone interessate all’argomento Data Science che hanno rilasciato recensioni vere ed hanno espresso opinioni basate su acquisti reali. Le recensioni si possono visualizzare nella pagina e possono essere positive o negative in base all’esperienza di acquisto e la qualità delle lezioni di Big Data Analytics con Python e Spark 2.4: il Corso Pratico. Noi consigliamo di consultare in modo dettagliato i commenti rilasciati e poter valutare al meglio se acquistare il corso Big Data Analytics con Python e Spark 2.4: il Corso Pratico.

Corso Gratis

E’ possibile accedere al corso Big Data Analytics con Python e Spark 2.4: il Corso Pratico a gratis ed in modo completamente gratuito? Chi vuole seguire il corso puo’ farlo richiedendo l’offerta speciale e pagare soli 12,99€ ma non puo’ farlo in modo completamente free. Inoltre il corso è disponibile solo per chi vuole formarsi via video, quindi non sono disponibili download di file pdf online da scaricare.

Condividi sui Social

Condividi su facebook
Condividi su twitter
Condividi su linkedin
Condividi su pinterest
Condividi su print
Condividi su email

Altri corsi interessanti

Corsi Data Science

Corso: Corso pratico di Data mining con Python

Questo corso incentrato sull’analisi  e sul preprocesso  dai dati sui quali verr successivamente costruito un modello predittivo con tecniche di Machine Learning.Offre conoscenze utili alla

Corsi Data Science

Corso: Selenium con Python.

Questo corso dedicato alla programmazione in linguaggio Python utilizzando la  libreria Selenium, con lo scopo di sviluppare progetti di automatizzazione web nel campo dei social