Módulo 1 - Unidade 1

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 21

Introdução à Ciência de Dados

Prof. Dr. Agnaldo Antonio dos Santos


Módulo 1 - Ciência de Dados e
Análise de Dados
Unidade 1 - Campo de atuação e utilização
“Dados são o novo petróleo?”

● Cada vez mais volumosos;


● Evolução da imersão do grande volume de dados;
● Milhões e milhões de dados disponíveis;
● Surgimento e aumento do número de redes sociais.
Utilize imagens em alta resolução

● Dados são fatos em sua forma bruta;


● Tornam-se conhecimento;
● Estatística e matemática contribuem para
conhecimento;
● Identificar padrões e direcionar para
tomada de decisão.

Fonte: Flickr
Dados Classificados Organizados e
Contextualizados

Fonte: IFIC (2015)


Volume de Dados

Fonte: Universal Software (2016)


Método
Observações

Questões
Conclusões

Hipóteses
Experimentos
e Análises
Fonte: Imagem de Unsplash
Profissões dos Dados

● Analista de Dados;
● Arquiteto de Dados;
● Cientista de Dados;
● Desenvolvedor de BI;
● Engenheiro de Aprendizado de Máquina;
● Engenheiro de Dados;
● Especialista em Privacidade e Segurança de Dados.
Analista de Dados

● Coleta de dados; ● Monitoramento e avaliação;


● Limpeza de dados; ● Manutenção de ferramentas
● Análise Exploratória; e tecnologias;
● Modelagem de Dados; ● Segurança de dados;
● Comunicação de Resultados; ● Desenvolvimento de
● Apoio à Tomada de relatórios e painéis.
Decisões;
Engº de Aprendizado de Máquina

● Coleta de dados; ● Manutenção e


● Armazenamento de dados; Monitoramento;
● Processamento de dados; ● Desenvolvimento de APIs;
● Integração de dados; ● Colaboração com analistas;
● Segurança de dados; ● Automação de processos;
● Desempenho e ● Adoção de tecnologias de
escalabilidade; Big Data.
Remuneração do Cientista de Dados

4.000 8.000 15.000 30.000

Júnior/Iniciante Júnior Iniciante Experiente/Médio Sênior/Avançado


Data Science x Inteligência Artificial

● Data Science ● Regressão (Linear, Logística);


○ Big Data; ● Classificação (Classificador
○ Qualidade de Dados; Bayesiano, Árvores de
○ Técnicas de análise de Decisão, Análise de Séries
dados: Temporais, Análise de Texto);
○ Categorização (K-means ● Data Warehouse;
clustering, regras de ● Business Intelligence.
associação);
Data Science x Inteligência Artificial

● Inteligência Artificial ● Aprendizado supervisionado,


○ Algoritmos de buscas; não-supervisionado e por
○ Algoritmos genéticos; reforço;
○ Aprendizagem de ● Redes Bayesianas e
máquina: aprendizado Raciocínio Probabilístico;
indutivo, árvores de ● Lógica e conjuntos
decisão e modelos de nebulosos;
redes neurais artificiais; ● Sistemas multiagentes.
Python para Ciência de Dados

Fonte: Wikimedia Commons


Características do Python

● Linguagem de Alto Nível; ● Bibliotecas Poderosas;


● Interpretada; ● Código Aberto;
● Multiplataforma; ● Indentação Significativa;
● Comunidade Ativa; ● Ampla Adoção.
● Versatilidade;
Tarefas do Cientista de Dados com
Python

● Análise de dados; ● Desenvolvimento de


● Visualização de dados; aplicativos web;
● Machine Learning; ● Construção de painéis de
● Processamento de controle;
linguagem natural; ● Integração com bancos de
● Análise estatística; dados;
● Big Data; ● Automação de fluxos de
● Mineração de dados; trabalho e de tarefas.
Notebooks Python

● Jupyter Notebook; ● Zeppelin;


● JupyterLab; ● RMarkdown (RStudio);
● Google Colab; ● Hydrogen (para Atom);
● Visual Studio Code; ● PyCharm.
● nteract
Resumindo

● Dados são o novo petróleo;


● Grande volume de dados que produzimos;
● Surgimento das redes sociais;
● Dado e informação tornam-se conhecimento;
● Cientista de dados é um organizador dos dados;
● Áreas novas relacionadas com a Ciência de dados;
● Remuneração salarial de um cientista de dados;
● Python é utilizado pelos cientistas de dados.
Referências

BARATA, André Montoia. Governança de dados em organizações brasileiras: uma avaliação comparativa
entre os benefícios previstos na literatura e os obtidos pelas organizações. 2015. Dissertação (Mestrado em
Sistemas de Informação) - Escola de Artes, Ciências e Humanidades, Universidade de São Paulo, São Paulo,
2015. Disponível em: https://link.ufms.br/Kil08. Acesso em: 06 nov. 2023.

BARBIERI, Carlos. Governança de Dados: Práticas, conceitos e novos caminhos. Rio de Janeiro: Alta Books,
2019. ISBN 9788550810690. Disponível na Biblioteca Digital da UFMS.

GRANATO, Luísa. Ciência de dados: confira o guia sobre as carreiras em alta na área. Exame, 15 out. 2021.
Disponível em: https://link.ufms.br/foap8. Acesso em: 06 nov. 2023.

GRUS, Joel. Data Science do Zero. Rio de Janeiro: Alta Books, 2021. ISBN 978-85-808-1176-5.

IFIC. El poder de la infografía en los medios sociales. IFIC, 26 jan. 2015. Disponível em:
https://link.ufms.br/cNzsF. Acesso em: 21 nov. 2022.
Referências

PROVOST, Foster; FAWCET, Tom. Data Science para Negócios. Rio de Janeiro: Alta Books, 2016. ISBN
978-85-7608-972-8.

PYTHON. Aplicações para Python. Python, 2023. Disponível em: https://link.ufms.br/VHpI4. Acesso em: 06
nov. 2023.

ROCHA, Isabel. Com salários de até 5 dígitos, estas serão as profissões mais relevantes no Brasil até 2030.
Exame, 04 out. 2023. Disponível em: https://link.ufms.br/c0gRy. Acesso em: 06 nov. 2023.

SILVA, Leandro A.; PERES, Sarajane M.; BOSCARIOLI, Clodis. Introdução à Mineração de Dados: com
aplicações em R. Rio de Janeiro: Elsevier, 2016. ISBN 9788535284461. Disponível na Biblioteca Digital da
UFMS.

UNIVERSAL SOFTWARE. Big Data e o Mercado Imobiliário. Universal Software, 2016. Disponível em:
https://link.ufms.br/WLfRH. Acesso em: 06 nov. 2023.
Licenciamento

Respeitadas as formas de citação formal de autores de acordo com as normas da


ABNT NBR 6023 (2018), a não ser que esteja indicado de outra forma, todo material
desta apresentação está licenciado sob uma Licença Creative Commons -
Atribuição 4.0 Internacional.

Você também pode gostar