Ementa_Python and Spark for Big Data and Machine Learning

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 6

EMENTA DO CURSO

Python and Spark for


Big Data and
Machine Learning
⏱️ CARGA HORÁRIA: 40H
EMENTA DO CURSO PYTHON AND SPARK FOR
BIG DATA AND MACHINE LEARNING

Quem deve fazer este curso:


Proporcionar uma visão geral (“Big Picture”) dos principais algoritmos de
Machine Learning e, de forma crítica, discutir como aplicá-los usando
ferramentas Open Source, tais como Spark e Python;

Entregar ao aluno um RoadMap por meio da transmissão de conhecimentos a


respeito das áreas: Ciência de Dados, Machine Learning (ML) e
Processamento de Alto Desempenho (HPC).

Dar uma visão holística e prática dos princípios fundamentais de Ciência de


Dados e Machine Learning usando como ferramentas a linguagem Python, a
mais usada atualmente para esta finalidade, e frameworks de processamento
de Big Data como o Hadoop, PySpark, Numba e, também, para
processamento de Deep Learning como Tensorflow e Keras.

Diferenciais do curso:
✓ O Único curso no Brasil que apresenta como os temas Big Data,
Machine Learning, Computação de Alto Desempenho e Análise de
Dados estão relacionados e a importância de cada área para um
Cientista de Dados;
✓ Todo material em língua portuguesa (a maioria dos cursos de terceiros
está no idioma inglês);
✓ Oportunidade de conhecer as experiências reais de empresas do Brasil
e do mundo que aplicaram as práticas ensinadas;
✓ Demonstra na prática as diferenças de papéis do Engenheiro de Dados
e do Cientista de Dados.

Conheça o curso em detalhes 1


EMENTA DO CURSO PYTHON AND SPARK FOR
BIG DATA AND MACHINE LEARNING

Ementa:
Introdução a Big Data
● Python para Big Data

● Jupyter Notebook

● Google Colab

Python para Big Data


● O modelo de programação MapReduce

● Introdução à Programação funcional com Python: Funções Lambda em


Python

● Trabalhando com grafos em Python

● Numpy

● Pandas

Análise exploratória de Dados


● Tipos de Variáveis

● Normalização de Dados com Python

● Visualização de Dados com Python (Matplotlib, Searborn, Bokeh)

● Medidas de similaridade

Matemática e Dados
● Introdução à Estatística Descritiva

● Média, Mediana, Desvio Padrão, Variância

● Teorema de Bayes e Inferência Bayesiana

Conheça o curso em detalhes 2


EMENTA DO CURSO PYTHON AND SPARK FOR
BIG DATA AND MACHINE LEARNING

● Teste Estatístico de Hipótese

● Exemplo: Executando um Teste A/B

Spark e Pyspark
● Operações básicas com DataFrames

● Operações avançadas com DataFrames

● Operações com Dados Faltantes e Datas

Introdução a Machine Learning


● Overview dos Algoritmos de Machine Learning

● K-nearest neighbors – kNN

● Construção de Pipeline de Machine Learning com modelo CRISP DM

● Introdução a Sistemas de Recomendação e Filtros Colaborativos

Machine Learning
● Regressão Linear

● Regressão Logística x kNN – Avaliação de Modelos

● Fundamentos de Redes Neurais Artificiais

● Regressão Logística x kNN – Avaliação de Modelos

● Introdução a Processamento Natural de Linguagem (Modelos n-grams)

● Word2Vec com Gensim

● Clusterização usando Kmeans

Conheça o curso em detalhes 3


EMENTA DO CURSO PYTHON AND SPARK FOR
BIG DATA AND MACHINE LEARNING

● Classificação usando Naive Bayes

● Classificação usando Árvores de Decisão e Random Forest

● Classificação usando Support Vector Machine

Introdução ao Machine Learning Spark MLlib


● Introdução ao Spark Mllib

● Tokenização de documentos de textos para tarefas de classificação

● Regressão Logística com Spark Mllib

● KNN com Spark Mllib

● Spark Streaming

Deep Learning
● Introdução a Deep Learning

● Redes Neurais Convolucionais

● Redes Neurais Recorrentes

● Introdução ao TensorFlow

● Conhecendo a base de dados MNIST

● Aplicação Prática de Redes Neurais MLP para Reconhecimento de Imagem

● Aplicação Prática de Redes Neurais Convolucionais para Reconhecimento de


Imagem

● Aplicação Prática de Redes Neurais Recorrentes para Análise de Sentimentos

Conheça o curso em detalhes 4


EMENTA DO CURSO PYTHON AND SPARK FOR
BIG DATA AND MACHINE LEARNING

Processamento de Alto Desempenho com Python para Big Data


● A revolução das GPUs em Machine Learning

● Arquitetura Cuda e Modelo de Programação em GPU

● Introdução ao Numba

● Comparação de desempenho entre Numpy, Numpy assíncrono e Numpy


com Numba em Operações estatísticas

● Conhecendo os principais frameworks Python para Machine Learning que


usam GPUs

Conheça o curso em detalhes 5

Você também pode gostar