01 - Ciência de Dados

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 44

FLUÊNCIA EM

DADOS
Ciência de Dados

Livro Eletrônico
 

Fluência em Dados
Ciência de Dados
Patrícia Quintão

Sumário
Apresentação......................................................................................................................................................................3
Ciência de Dados...............................................................................................................................................................4
Conceitos Relacionados à Análise de Dados....................................................................................................4
Análise de Dados (ou Data Analytics). .................................................................................................................4
Análise de Dados no Setor Público........................................................................................................................4
Aplicações do Big Data e da Análise de Dados...............................................................................................5
Tipos de Análise de Dados..........................................................................................................................................6
As Variáveis na Análise Exploratória de Dados.............................................................................................8
A Análise de Dados no Contexto da Arquitetura de BI (Business Intelligence ou
Inteligência de Negócios)..........................................................................................................................................12
A Ciência de Dados (Data Science).......................................................................................................................16
O Que é Ciência de Dados (ou Data Science). ..................................................................................................16
Ciclo de Vida do Processo de Ciência de Dados............................................................................................17
Big Data x Ciência de Dados....................................................................................................................................23
Data Analytics x Big Data x Ciência de Dados..............................................................................................23
Desafios Enfrentados pelos Cientistas de Dados......................................................................................23
Quais são as Diferentes Tecnologias de Ciência de Dados?. ................................................................ 24
Papeis dos Envolvidos em Projetos de Ciência de Dados e Big Data.............................................. 24
Experiência do Consumidor Orientada por Dados......................................................................................25
Resumo................................................................................................................................................................................26
Questões Comentadas em Aula.. ...........................................................................................................................29
Exercícios.............................................................................................................................................................................31
Gabarito...............................................................................................................................................................................34
Gabarito Comentado....................................................................................................................................................35
Referências.........................................................................................................................................................................41

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 2 de 44
 

Fluência em Dados
Ciência de Dados
Patrícia Quintão

Apresentação
Olá, querido(a) amigo(a)!

Seja você quem for, seja qual for a posição social que você tenha na vida, a mais alta ou a mais
baixa, tenha sempre como meta muita força, muita determinação e sempre faça tudo com muito
amor e com muita fé em Deus, que um dia você chega lá. De alguma maneira você chega lá.

Ayrton Senna

O momento perfeito não “surge”. Ele é construído. Construa o seu. Você tem suas próprias
dificuldades, problemas, vitórias e soluções. Continue firme e, em breve, estará colhendo os
frutos da vitória.
Rumo então à aula sobre os conceitos relacionados à Análise de Dados e à Ciência de Dados!
FORÇA e muita DETERMINAÇÃO nos estudos!
Em caso de dúvidas, acesse o fórum do curso ou entre em contato.
Um forte abraço,

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 3 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

CIÊNCIA DE DADOS

Conceitos Relacionados à Análise de Dados


Análise de Dados (ou Data Analytics)
Análise de dados (ou Data analytics) é “o processo de explorar, transformar e analisar
informações para identificar tendências e padrões que revelam insights significativos que
dão suporte à tomada de decisões”, é o que destaca ALTERYX (2022).
Alteryx (2022) também cita que uma estratégia moderna de analytics permite que os siste-
mas e as organizações ajam com base em análises automatizadas em tempo real, garantindo
resultados impactantes e imediatos.

Análise de Dados no Setor Público


Atualmente, uma quantidade significativa de dados é processada diariamente pelas em-
presas, pelos órgãos públicos etc.
Conforme destaca ENAP (2020), “quando bem trabalhados, monitorados e analisados, os
dados servem para auxiliar as instituições em muitos aspectos. Cada vez mais os órgãos públicos
vêm tomando decisões com base nos dados, seja para detecção de anomalias, monitoramento
de indicadores ou melhoria de processos. Muitos órgãos já perceberam a importância de se
realizar análise sobre os dados e os ganhos que esta atividade fornece”.
A seguir, destacamos várias iniciativas com foco na análise de dados públicos (ENAP,2020):
1. O Ministério da Economia disponibiliza diversos painéis públicos em seu portal, com
o objetivo de dar mais transparência em suas ações e permitir um melhor acompanhamento
de seus trabalhos.
2. O Portal da Transparência, mantido pela CGU, disponibiliza painéis sobre vários temas,
permitindo que os dados sejam baixados para análise individual.

Figura. Portal da Transparência – CGU (ENAP, 2020)

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 4 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

3. Análise de dados para localização de vítimas do rompimento da barragem de Bruma-


dinho, pelo Corpo de Bombeiros Militar de Minas Gerais.
4. Análise de vínculos para detecção de fraudes pelo Tribunal de Contas do Estado de São
Paulo e Conselho Administrativo de Defesa Econômica.
5. Fiscalização contínua de folhas de pagamento da Administração Pública, pelo TCU.
6. Detecção de anomalias para identificar a prática de conluio em licitações do governo
federal, pela CGU.
7. Na área de saúde, centros de controle e prevenção de doenças utilizam os dados para
prever surtos de gripe e rastrear padrões da doença.
8. Na área de detecção e prevenção de crimes, a análise de dados permite identificar pa-
drões de atividades criminosas e lugares com alta incidência de criminalidade.

Aplicações do Big Data e da Análise de Dados


As aplicações do Big Data e da análise de dados são variadas, como (FERNANDES E
ABREU, 2014):
• desenvolvimento de mercado;
• inovação;
• desenvolvimento de produtos e serviços;
• eficiência operacional;
• previsões de demanda de mercado;
• detecção de fraudes;
• gerenciamento de riscos;
• previsão de concorrência;
• vendas;
• campanhas de marketing;
• avaliação do desempenho de funcionários;
• alocação do orçamento anual;
• estabelecimento de previsões financeiras;
• gestão de planos médicos;
• identificação de potenciais compradores;
• entendimento da base de clientes etc.
Ainda, segundo destaca (FERNANDES E ABREU, 2014), em uma análise conjunta do IBM
Institute for Business Value e do Massachussets Institute of Technology (o famoso MIT) iden-
tificou-se que empresas que investem em análise de dados (Business Analytics and Optimi-
zation) possuem uma visão melhor do seu negócio, conseguindo uma receita 33% maior do
que seus concorrentes, crescimento do lucro doze vezes maior e retorno sobre o investimento
de capital 32% maior (IBM (2011)).
Vale a pena assistir! #Ficaadica

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 5 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

(1) http://g1.globo.com/jornal-da-globo/noticia/2013/12/massa-de-informacoes-digitais-
-pode-ser-usada-em-beneficio-da-populacao.html
(2) https://www.youtube.com/watch?v=gny_BR6ID6A

Tipos de Análise de Dados


A análise de dados é frequentemente dividida em alguns tipos, baseada nos propósitos
gerais de sua realização (ENAP, 2020).
Vamos à descrição desses tipos:
Foca no presente, visando descrever as características dos dados
e eventos correntes para subsidiar decisões de efeitos imediatos
(ENAP, 2020).
Representa a área de investigação de dados que busca tanto
Análise descrever fatos relevantes, não triviais e desconhecidos dos
Descritiva usuários, como analisar a base de dados, principalmente pelo seu
aspecto de qualidade, para validar o conhecimento encontrado.
Alteryx (2002) cita que a análise descritiva responde à pergunta
“o que aconteceu?”
(Ex.: Quais foram nossas vendas da última semana?).
Visa entender as relações de causa e efeito entre eventos. Por exemplo, pode-se
Análise Diagnóstica
cruzar fatores como dados de vacinação, saneamento básico e higiene para entender
ou
as causas da erradicação de determinada doença em parte da população (ENAP, 2020).
Análise de
Alteryx (2002) cita que a análise de diagnóstico responde à pergunta “por que isso
Diagnóstico
aconteceu?” (Ex.: Por que nossas vendas aumentaram em relação à semana anterior?)
Busca prever comportamentos futuros e tendências com base nos dados
conhecidos (ENAP, 2020). Visa utilizar dados históricos para aplicar a eventos
Análise Preditiva futuros, desconhecidos.
Alteryx (2002) cita que a análise preditiva responde à pergunta “o que acontecerá?”
(Ex.: Como achamos que as vendas da nossa loja serão durante a temporada de festas?).
A análise prescritiva é parecida com a preditiva, mas a ideia é buscar os efeitos
dos eventos futuros. Traça, portanto, as possíveis consequências de cada ação.
É como se a preditiva fosse capaz de detectar um possível desaquecimento do
mercado no futuro, enquanto a prescritiva seria responsável por prever o impacto
Análise Prescritiva
desse desaquecimento nas vendas da empresa (ENAP, 2020).
Alteryx (2002) cita que a análise prescritiva responde à pergunta “o que devo fazer?”
(Ex.: Com base em nossas previsões, recomendamos o envio de mais de um
determinado produto para evitar falta de estoque).
Veja a figura ilustrada em ALTERYX (2022):

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 6 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura. Tipos de Análises (ALTERYX, 2022)

“Análises descritivas e de diagnóstico permitem que analistas e líderes nivelem o con-


junto. Esses processos são componentes básicos que abrem o caminho para insights mais
sofisticados resultantes de análises preditivas e prescritivas” (ALTERYX, 2022).

001. (CESPE/TCE-RJ/2021) Com relação a noções de mineração de dados e Big Data, julgue
o item que se segue. Na mineração de dados preditiva, ocorre a geração de um conhecimento
obtido de experiências anteriores para ser aplicado em situações futuras.

A mineração de dados preditiva busca prever comportamentos futuros e tendências com base
nos dados conhecidos (ENAP, 2020).

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 7 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura. Tipos de Análises (QUINTÃO, 2023)

Certo.

002. (CESPE/TCE-MG/2018) Uma empresa, ao implementar técnicas e softwares de big


data, deu enfoque diferenciado à análise que tem como objetivo mostrar as consequências
de determinado evento. Essa análise é do tipo
a) preemptiva.
b) perceptiva.
c) prescritiva.
d) preditiva.
e) evolutiva.

A análise prescritiva visa prever os efeitos futuros dos eventos. Busca, portanto, os efeitos dos
eventos futuros.
Letra c.

As Variáveis na Análise Exploratória de Dados


As características estudadas pela análise exploratória de dados são conhecidas como
variáveis.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 8 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Chamamos de variável toda característica que se pretende avaliar estatisticamente em um


determinado conjunto de elementos (amostra ou população). Cada elemento desse conjunto
terá uma medida para essa característica, seja ela expressa em termos numéricos ou não.
Nesse contexto, existem dois tipos de variáveis a serem consideradas: a quantitativa e
a qualitativa.

Figura. Tipos de Variáveis (QUINTÃO, 2023)

Variável Quantitativa
Dividimos esse tipo de variável em duas espécies: as variáveis quantitativas discretas,
e as quantitativas contínuas.
Discretas: expressas em números contáveis. O número de valores possíveis é finito
Pode ser expressa ou “enumerável”.
em termos Exemplos: número de passageiros por viagem, número de crianças por sala de aula,
numéricos (altura, número de computadores por casa, número de revistas vendidas, quantidade de
peso, número de consultas médicas, quantidade de habitantes das cidades brasileiras etc.
ocorrências, dias, Contínuas: são mensuráveis em um intervalo, ou seja, podem assumir qualquer
tempo etc.). número (inteiro ou não) dentro de um intervalo de valores.
Exemplos: tempo para chegar ao trabalho, distância percorrida, tempo para executar
uma tarefa, altura dos alunos de uma escola.

Variável Qualitativa
Dividimos esse tipo em duas espécies, que são: variáveis qualitativas nominais e
É expressa não por ordinais.
valores, mas por um As variáveis qualitativas nominais são aquelas em que não se pode estabelecer
atributo. uma ordem para elas: intenção de voto, cor dos olhos, time de futebol, marcas de
Por exemplo: carros, nome de bebidas, sexo - masculino ou feminino etc.
nacionalidade, As variáveis qualitativas ordinais são aquelas em que é possível estabelecer uma
religião, cor dos olhos, ordem: marco temporal (século XIX, XX, XI), grau de escolaridade (1º, 2º, 3º grau),
sexo, preferência escala de frequência (pouco, médio, muito), nível de escolaridade – (analfabeto /
musical etc.
fundamental / médio / superior) etc.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 9 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Obs.: Os níveis de mensuração podem ser quantitativos (discretos ou contínuos) ou qua-


litativos (nominais ou ordinais).
Em um experimento, ainda podemos considerar as variáveis dependentes ou independentes.
Variável Descrição
Representa uma grandeza cujo valor depende de como a variável
Variável Dependente
independente é manipulada. São apenas medidas ou registradas.
Representa uma grandeza que está sendo manipulada em um
Variável Independente
experimento. São as variáveis manipuladas.

Obs.: O nível de manipulação das variáveis se refere a uma variável independente.


 A manipulação de uma variável independente pode ser realizada em um ou mais níveis.
O nível mínimo de manipulação é de presença-ausência da variável independente.

003. (CESPE/SERPRO/ANALISTA/2010)

Certa empresa, em determinado mês, realizou levantamento acerca da quantidade diária de


acessos simultâneos ao seu sistema, cujo resultado é mostrado na figura acima. A partir das
informações apresentadas nessa figura, e considerando que a distribuição da quantidade diária
de acessos simultâneos é representada pela variável X, julgue os itens seguintes.
É correto classificar a variável X como uma variável quantitativa ordinal.

A variável denominada “Quantidade de Acessos” é uma variável quantitativa, pois pode ser
expressa em termos numéricos.
A partir do indicado no gráfico, podemos afirmar, ainda, que é uma variável quantitativa discreta,
pois a quantidade de acessos é um número “contável”.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 10 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Conforme vimos nesta aula, as variáveis ordinais são relacionadas com as variáveis qualitativas.

Errado.

004. (CESPE/TCU/ANALISTA DE CONTROLE EXTERNO/2008)

Considerando a tabela anterior, que apresenta a distribuição do quadro de colaboradores da


CAIXA, em mil pessoas, no final dos anos de 2006 e 2007, julgue o item seguinte.
Se uma variável X registra a classificação de cada pessoa do quadro como funcionária, estagiária
ou prestadora de serviço, então X é uma variável qualitativa.

Conforme vimos nesta aula, a variável qualitativa é aquela expressa não por valores, mas por
um atributo. Por exemplo: nacionalidade, religião, profissão, sexo, cor dos olhos etc.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 11 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Pode-se observar que a variável “classificação” registra os atributos dos dados, então, trata-se
de uma variável qualitativa.

Certo.

005. (CESPE/TCE-PB/AUDITOR DE CONTAS PÚBLICAS/2018) Na análise exploratória de


dados, são examinados conjuntos de dados cujas principais características serão resumidas,
muitas vezes com métodos visuais. Acerca desse assunto, assinale a opção correta.
a) Uma variável de nível de manipulação nominal identifica as categorias.
b) Uma variável de nível de manipulação contínua pode assumir infinitos
valores.
c) Uma variável de nível de mensuração discreta pode assumir apenas alguns valores.
d) Uma variável de nível de mensuração define como uma variável se relaciona com as outras.
e) Uma variável de nível de manipulação define a quantidade de informação apresentada por
cada variável.

a) Errada. Uma variável de nível de mensuração nominal identifica as categorias.


b) Errada. Uma variável de nível de mensuração contínua pode assumir infinitos valores.
c) Certa. Uma variável de nível de mensuração discreta pode assumir apenas alguns valores.
d) Errada. Uma variável de nível de manipulação define como
uma variável se relaciona com as outras.
e) Errada. Uma variável de mensuração do tipo quantitativa define a quantidade de informação
apresentada por cada variável.
Letra c.

A Análise de Dados no Contexto da Arquitetura de BI (Business


Intelligence ou Inteligência de Negócios)
Cabe destacar o conceito de BI (Business Intelligence), que abrange aplicativos, ferra-
mentas e metodologias usadas para coleta, tratamento, armazenamento, recuperação e

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 12 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

disseminação de informações com o objetivo de auxiliar o processo de tomada de decisões


organizacionais complexas.
Vamos então apreciar as diversas etapas do processo de BI.

Figura. Arquitetura de BI. Fonte: BI Academy (2020)

• Data Source (Fonte de Dados)


Geralmente, o processo de BI começa no Data Source. É nesse local em que se encontram
os dados que ainda não viraram informação.
Alguns exemplos: arquivos de textos e CSVs, arquivos de Excel, ERP, CRM etc.
• Data Integration (Integração de Dados)
Depois de você ter identificado o Data Source, a primeira fase na arquitetura de BI é Data
Integration.
Agora é o momento de desenvolver e executar o processo de ETL (E — Extração (Extract);
T — Transformação (Transform); L — Carga (Load)).

Figura. ETL. Fonte: http://laudosweb.hospitalorione.com.br/manual_html/etl_v4.1.0_painel.png

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 13 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

As ferramentas de software ETL têm como função a extração de dados de diversos sis-
temas, a transformação desses dados de acordo com as regras de negócio e a carga dos
dados em um Data Mart ou um DW.
Existem diversas ferramentas que podem ser utilizadas para implementar isso, como:
Pentaho Data Integration, Power Center, Talend, SSIS (SQL Server Integration Services) e ODI
(Oracle Data Integrator).
• Data Storage (Armazenamento de Dados)
O Data Warehouse (Armazém de Dados) é o repositório de dados centrais, em que fica a
informação. Para a criação do Data Warehouse, podemos usar bancos de dados relacionais,
como PostgreSQL, Oracle Database, SQL Server e Teradata.
• Data Analysis (Análise de Dados)
Aqui temos os cubos OLAP (Online Analytical Processing), Data Mining etc.
É nessa etapa, por exemplo, que começamos a cruzar as informações disponibilizadas,
bem como podem ser feitas análises iniciais e a identificação de padrões passados, proble-
mas futuros etc.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 14 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura. Data Analysis. Fonte: BI Academy (2020)

Exemplos de ferramentas que se pode utilizar para criar os cubos: Qlikview, Microsoft BI,
Microstrategy, OBIEE, Pentaho Mondrian etc.
• Data Visualization (Visualização de Dados)
Os usuários podem percorrer as diferentes dimensões e seus cruzamentos, visualizando
os valores resultantes das medidas em cada caso.

Obs.: A visualização de dados é mais fácil de implementar quando os dados necessários


estão em um Data Warehouse ou, melhor ainda, em um banco de dados multidimen-
sional especial ou servidor.
 Desde o fim dos anos 90, a visualização de dados evoluiu tanto na computação
convencional, em que é integrada às ferramentas e aplicações de suporte à decisão,
como na visualização inteligente, que inclui a interpretação de dados (informação)
(TURBAN, 2009).

Veja a seguir alguns tipos de ferramentas que podem ser utilizadas para navegar pelo cubo:
• planilhas de cálculo: podem ser conectadas com a estrutura dimensional e alimentar
uma tabela dinâmica com a informação retirada dos cubos;
• painéis de controle (Dashboards): conectam-se com a estrutura dimensional e geram
indicadores que permitem uma rápida visão do status atual das variáveis básicas e sua
relação com os objetivos da empresa e/ou negócio. Apresenta visualmente as informa-
ções mais importantes e necessárias para tomada de decisão. Assim, em uma única tela,
por exemplo, é possível organizar análises, gráficos, KPI (Key Performance Indicator - é
uma métrica associada a um processo) e reports de toda a empresa ou de um ponto de
vista do negócio ou departamento.
Importante: Dashboard bom não é o que tem gráficos bonitos, é o que entrega as infor-
mações necessárias para a tomada de decisão.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 15 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura. Exemplo de Dashboard. Fonte: BI Academy (2020)

• soluções ou aplicativos desenvolvidos sob medida especialmente para a empresa, ou


aplicativos genéricos ou orientados para algum mercado em particular;
• geradores de relatórios que podem ser conectadas na estrutura dimensional e gerar
relatórios com a informação retirada dos cubos. A técnica de BI reporting consegue trans-
formar os dados em informações compreensíveis, flexíveis e fáceis de serem analisadas
pelo usuário final em relatórios pré-formatados.
A tabela a seguir resume a relação entre BI tradicional e ciência de dados (ENAP, 2020).
Data Warehouse / BI Ciência de Dados / Análise Ciência de Dados / Análise
Tradicional Preditiva Prescritiva
Retrospectiva Percepção Predição
Baseado na histórico: O que Com base em cenários: O que
Com base em modelos preditivos:
a c o n t e c e u ? Po r q u e i s s o devemos fazer para que as coisas
O que é provável que aconteça?
aconteceu? aconteçam?
Descritivo Preditivo Prescritivo

A Ciência de Dados (Data Science)


O Que é Ciência de Dados (ou Data Science)
Data science ou ciência de dados, conforme destaca ENAP (2020) é a arte de extrair
conhecimento por meio dos dados para se tomar melhores decisões, realizar previsões e
entender o passado.
Nesse sentido, a ciência de dados é encarregada de transformar dados em informação.

Obs.: Ciência de Dados é a exploração e análise de todos os dados disponíveis, com o obje-
tivo de desenvolver compreensão, extrair conhecimento e formular ações que gerem
resultados (DATA SCIENCE ACADEMY, 2022)

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 16 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Analisando o diagrama de Venn (http://drewconway.com/zia/2013/3/26/the-data-scien-


ce-venn-diagram) seguinte, é possível perceber que Data Science é a intersecção de várias
áreas de conhecimento. Trata-se de uma área multidisciplinar baseada em conceitos e áreas
bem consolidadas, como a matemática, a estatística e a ciência da computação (ENAP, 2020).

Figura. Diagrama de Venn (DREW CONWAY DATA CONSULTING, 2010)

ENAP (2020) cita o papel dessas áreas na ciência de dados:


Consiste em desenvolver e aplicar métodos para coletar,
Estatística
analisar e interpretar os dados.
Em diversas técnicas da matemática, como álgebra linear e cálculo, a análise de
Matemática
dados é usada para a criação de algoritmos inteligentes.
Área específica de A análise de dados pode ser aplicada em diversas áreas de conhecimento, como
conhecimento finanças, administração, negócios, mídias sociais, governo e ciência.
Machine learning
É uma área de estudo que busca dar aos computadores a habilidade de aprender
(Aprendizado de
sem serem programados explicitamente.
Máquina)

Ciclo de Vida do Processo de Ciência de Dados


A literatura destaca inúmeras variações de ciclos específicos que cada organização
pode utilizar.

Ciclo de Vida Conforme ENAP (2020)


ENAP (2020) cita que, para que seja bem-sucedido, o processo de Data Science deve seguir
pelo menos 5 etapas básicas, destacadas a seguir:

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 17 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura. Processo de Data Science. Fonte: ENAP (2020)

1. Definição do Problema
Nesta etapa busca-se entender o problema e as questões de negócio que devem ser res-
pondidas. Alguns questionamentos:
• O que se quer resolver com a análise?
• Que tipo de análise será feita? Descritiva, diagnóstica, preditiva?
• Quais dados são necessários?
2. Preparação dos Dados
Está relacionada com a obtenção, limpeza, normalização e transformação dos dados.
3. Análise Exploratória dos Dados
Busca-se obter um panorama de como os dados estão organizados. A apresentação
dos dados é fundamental, pois o objetivo é entender as características e os relacionamentos
deles. Algumas questões:
• Quais são os tipos das variáveis (atributos)?
• Como estão as distribuições dos dados?
• Existem valores missing (NA/Null)?
• Existem variáveis redundantes?
• Existem outliers (registros que apresentam grande discrepância em relação à maioria
dos registros). A figura seguinte identifica visualmente a presença de outliers, em que os
pontos externos aos polígonos são valores fora dos padrões da população observada.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 18 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

• Quais variáveis possuem correlação?


4. Construção do Modelo Preditivo
A modelagem preditiva permite realizar previsões com base em dados históricos por
meio da criação de um modelo. Nem todos os projetos passam por esta etapa, depende da
definição do problema de negócio.
5. Visualização dos Resultados
São apresentados os resultados da análise por meio de várias formas, como: dashboard
(painel gerencial), relatório, planilha, arquivo csv etc. Existem diversas ferramentas que podem
ajudar nesta parte.

Obs.: Para cada etapa do processo de Data Science, existem diversas ferramentas que
podem ser utilizadas, dentre elas a linguagem R.

Ciclo de Vida Conforme DAMA (2017)


DAMA (2017) cita as etapas seguintes para o ciclo de vida de Data Science:
1. Definir a estratégia de Big Data e as necessidades de negócios;
2. Escolher as fontes de dados;
3. Adquirir e ingerir fontes de dados (obter conjuntos de dados e integrá‑los);
4. Desenvolver hipóteses e métodos de ciência de dados;
5. Integrar e alinhar dados para análise;
6. Explorar dados usando modelos;

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 19 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

7. Implantar e monitorar.

Ciclo de Vida Conforme FIA (2022)


FIA (2022) destaca que toda ciência tem o seu modus operandi – e com a de dados não
é diferente. A instituição ainda cita que a base dos seus resultados vêm dos projetos, que se
estruturam em um framework de trabalho próprio conhecido pelo acrônimo OSEMN, desta-
cado a seguir.
O (Obter Dados)
A ciência dos dados começa por essa etapa, em que o cientista faz a coleta de dados.
S (Suprimir Dados)
Nesta segunda etapa, os dados são depurados, o que leva boa parte deles a serem supri-
midos. Nesse processo, realiza-se a conversão dos dados de um formato para outro, conso-
lidando-os em um formato padronizado (FIA, 2022).
E (Explorar Dados)
Agora é a vez de examinar os dados antes que eles possam ser tratados (FIA, 2022).
Nessa etapa, o cientista inspeciona os dados e suas propriedades, considerando suas
características. Diferentes tipos de dados como números, categorias, dados ordinais e nomi-
nais, por exemplo, demandam tratamentos distintos (FIA, 2022).
O próximo passo é computar estatísticas descritivas para extrair características e testar
variáveis, por meio de testes por correlação. Ex. desse tipo de análise: é a que mensura o
risco de alguém ter pressão alta considerando sua altura e peso (FIA, 2022).
M (Modelar Dados)
Nesta etapa, uma das primeiras coisas a serem feitas é reduzir a dimensionalidade do
conjunto de dados, já que nem todos são essenciais para elaborar um modelo.
Nesse ponto, o cientista de dados pode trabalhar com um outro profissional muito impor-
tante, o engenheiro de dados (FIA, 2022).
A modelagem é usada para agrupar dados, de modo que se possa entender a lógica por
trás dos “clusters” - grupos de dados com uma ou mais características em comum (FIA, 2022).
N (Interpretar Resultados)
Na fase final do processo em ciência de dados, é feita a apresentação dos resultados,
que devem ser inteligíveis para pessoas leigas (FIA, 2022).
Uma habilidade essencial nesta etapa é a capacidade de contar uma história, de modo a
despertar algum tipo de reação nas pessoas.
Por isso, o cientista de dados deve ser alguém capaz não só de ler e interpretar dados,
como de comunicá-los com clareza e empatia (FIA, 2022).

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 20 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Ciclo de Vida Conforme Microsoft (2022)


Microsoft (em https://learn.microsoft.com/pt-br/azure/architecture/data-science-process/life-
cycle-data) apresenta um ciclo de vida do TDSP (Processo de Ciência de Dados da Equipe),
constituído por 5 estágios:
(1) entendimento do negócio;
(2) aquisição e entendimento dos dados;
(3) modelagem;
(4) implantação; e
(5) aceitação do cliente.

Figura. Ciclo de Vida Conforme Microsoft (2022)

Ciclo de Vida Conforme CRISP-DM


Ainda, FGV (2022) considera que CRISP-DM é um modelo de referência não proprietário,
neutro, documentado e disponível na Internet, sendo amplamente utilizado para descrever o
ciclo de vida de projetos de Ciência de Dados.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 21 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura - Fases do CRISP-DM Process Model (Baseado em [The CRISP-DM Consortium, 2000])

Destacamos na tabela seguinte uma visão geral das fases do CRISP-DM, para melhor
fixação desse assunto! Vamos lá!
Foco no entendimento do negócio que visa obter
(1) Entendimento do Negócio
conhecimento sobre os objetivos do negócio e seus
(Business Understanding)
requisitos.
Consiste no entendimento dos dados, que visa à familiarização com
(2) Seleção dos Dados
o banco de dados pelo grupo de projeto, utilizando-se de conjuntos
(Data Understanding)
de dados “modelo”.
(3) Limpeza dos Dados ou Preparação dos Fase de preparação de dados, buscando a limpeza, a transformação,
Dados (Data Preparation) a integração e a formatação dos dados da etapa anterior.
Fase que consiste na modelagem dos dados, a qual visa à aplicação
de técnicas de modelagem sobre o conjunto de dados preparado
(4) Modelagem dos Dados
na etapa anterior.
(Modeling)
Técnicas são baseadas em conceitos de: aprendizagem de máquina;
reconhecimento de padrões; estatística; clusterização etc.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 22 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Foco no entendimento do negócio que visa obter


(1) Entendimento do Negócio
conhecimento sobre os objetivos do negócio e seus
(Business Understanding)
requisitos.
Visa garantir que o modelo gerado atenda às expectativas da
(5) Avaliação do processo
organização. Os resultados do processo de descoberta do conhecimento
(Evaluation)
podem ser mostrados de diversas formas.
(6) Execução Esta fase consiste na definição das fases de implantação do projeto
(Deployment) de Mineração de Dados.

Figura – Visão Geral das Fases do CRISP-DM Process Model (Elaboração Própria)

Big Data x Ciência de Dados

Fonte: DSAACADEMY (2022)

Data Analytics x Big Data x Ciência de Dados


No universo corporativo, o Data Analytics vem representar a essência do Data Science,
a ciência de dados. Entre esses dois conceitos, está o de big data, que se refere à coleta e
organização de uma imensa quantidade de dados de fontes diversas, estruturados ou não
(FIVEACTS, 2022).
O resultado das atividades online (por exemplo, mais de 3,8 milhões de buscas são feitas
no Google por minuto, mais de 4,5 milhões de vídeos são assistidos no YouTube etc.) é que
vai gerar o big data, que, por sua vez, será estudado pelo data science, o qual toma forma por
meio do data analytics (FIVEACTS, 2022).

Desafios Enfrentados pelos Cientistas de Dados


AWS (2022) cita diversos desafios enfrentados pelos cientistas de dados, como:

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 23 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura. Desafios Enfrentados pelos Cientistas de Dados (QUINTÃO, 2023)

Quais são as Diferentes Tecnologias de Ciência de Dados?


AWS (2022) cita que os profissionais de ciência de dados trabalham com tecnologias
complexas, envolvendo por exemplo:
• inteligência artificial: uso de modelos de Aprendizado de Máquina e outros para análises
preditivas e prescritivas;
• computação em nuvem: oferecem aos cientistas de dados a flexibilidade e a capacidade
de processamento necessárias para análise de dados avançada;
• Internet das Coisas (IoT): com inúmeros dispositivos conectados à Internet fornecendo
dados para iniciativas de ciência de dados;
• uso de computadores quânticos: podem fazer cálculos complexos em alta velocidade etc.

Papeis dos Envolvidos em Projetos de Ciência de Dados e Big Data


Machado (2018) cita três perfis básicos de profissionais engajados em Big Data:
a. Cientistas de dados são “profissionais capacitados em estatística, ciência da computa-
ção e/ou matemática, capazes de analisar grandes volumes de dados e extrair deles insights
que criem novas oportunidades de negócio” (MACHADO, 2018, p.218).

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 24 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

b. Analistas de negócio, “que, conhecendo bem o negócio em que atuam, consigam formu-
lar as perguntas corretas, analisar as respostas e tomar decisões estratégicas e táticas que
alavanquem novos negócios ou aumentem a lucratividade da empresa. Esta função tende a
ser acoplada às funções do cientista de dados” (MACHADO, 2018, p.218).
c. Profissionais de tecnologia e infraestrutura, “que cuidarão da infraestrutura de servi-
dores para processamento e clusters de armazenamento, e seu consequente suporte técnico
com objetivo de suportar Big Data.” (MACHADO, 2018, p.218)

Obs.: “O cientista de dados assimila-se a um cientista tradicional pelos conhecimentos


que tem; sua diferença reside em ter conhecimentos adicionais (em computação e
estatística) em mesmo nível de profundidade, se possível, de uma área de negócios,
como vendas, marketing ou operações.
 Analisar, processar e perceber. Essa é a tríade do Data Scientist, ou cientista de dados.
É um profissional que ainda está em pleno desenvolvimento e descoberta, tanto do
mercado quanto de si mesmo. Estima-se que hoje em dia faltem algo como 190 mil
cientistas de dados para atender ao mercado, número que só tende a crescer nos
próximos anos.” (MACHADO, 2018, p.220).

Experiência do Consumidor Orientada por Dados


Conforme Data Science Academy (2023), na experiência do consumidor orientada por
dados tem-se uma das tendências mais fortes em Ciência de Dados.
A ideia envolvida nesse contexto é que as empresas usem os dados para fornecer expe-
riências cada vez mais valiosas ou agradáveis. O software poderia ser mais fácil de usar, ter
menos tempo de espera, uma ligação ser transferida entre departamentos ao entrar em con-
tato com o atendimento ao cliente e reduzir o atrito e o aborrecimento no comércio eletrônico
(DATA SCIENCE ACADEMY, 2023).
À medida que as interações com as empresas se tornam cada vez mais digitais (por
exemplo com uso de Chatbots de IA a lojas de conveniência sem caixa da Amazon), a ideia é
medir e analisar todos os aspectos das interações para melhorar os processos ou torná-los
mais agradáveis (DATA SCIENCE ACADEMY, 2023).
Como resultado, surgem serviços e produtos mais personalizados e veremos mais apli-
cações e chatbots de atendimento ao cliente baseado em tecnologias como o ChatGPT para
gerar um atendimento personalizado e aprender com as interações dos clientes.
Em 2023, muitos profissionais da Ciência de Dados estarão buscando novas formas de
aproveitar os dados obtidos, para criar experiências e atendimento ao cliente melhores e
exclusivos (DATA SCIENCE ACADEMY, 2023).

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 25 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

RESUMO

Figura. Tipos de Análises (QUINTÃO, 2023)

Figura. Tipos de Variáveis (QUINTÃO, 2023)

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 26 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Fonte: DSAACADEMY (2022)

Vamos então apreciar as diversas etapas do processo de BI.

Figura. Arquitetura de BI. Fonte: BI Academy (2020)

Análise de Dados
Processo de inspecionar/coletar, limpar, transformar e modelar dados, para que eles
possam fornecer informações úteis para a tomada de decisão.

Visualização de Dados

A tabela a seguir resume a relação entre BI tradicional e ciência de dados (ENAP, 2020).

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 27 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Data Warehouse / BI Ciência de Dados / Análise Ciência de Dados / Análise


Tradicional Preditiva Prescritiva
Retrospectiva Percepção Predição
Baseado na histórico: O que Com base em cenários: O que
Com base em modelos preditivos:
a c o n t e c e u ? Po r q u e i s s o devemos fazer para que as coisas
O que é provável que aconteça?
aconteceu? aconteçam?
Descritivo Preditivo Prescritivo

Figura. Processo de Data Science. Fonte: ENAP (2020)

DAMA (2017) cita as etapas seguintes para o ciclo de vida de Data Science:
1. Definir a estratégia de Big Data e as necessidades de negócios;
2. Escolher as fontes de dados;
3. Adquirir e ingerir fontes de dados (obter conjuntos de dados e integrá‑los);
4. Desenvolver hipóteses e métodos de ciência de dados;
5. Integrar e alinhar dados para análise;
6. Explorar dados usando modelos;
7. Implantar e monitorar.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 28 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

QUESTÕES COMENTADAS EM AULA


001. (CESPE/TCE-RJ/2021) Com relação a noções de mineração de dados e Big Data, julgue
o item que se segue. Na mineração de dados preditiva, ocorre a geração de um conhecimento
obtido de experiências anteriores para ser aplicado em situações futuras.
002. (CESPE/TCE-MG/2018) Uma empresa, ao implementar técnicas e softwares de big
data, deu enfoque diferenciado à análise que tem como objetivo mostrar as consequências
de determinado evento. Essa análise é do tipo
a) preemptiva.
b) perceptiva.
c) prescritiva.
d) preditiva.
e) evolutiva.
003. (CESPE/SERPRO/ANALISTA/2010)

Certa empresa, em determinado mês, realizou levantamento acerca da quantidade diária de


acessos simultâneos ao seu sistema, cujo resultado é mostrado na figura acima. A partir das
informações apresentadas nessa figura, e considerando que a distribuição da quantidade diária
de acessos simultâneos é representada pela variável X, julgue os itens seguintes.
É correto classificar a variável X como uma variável quantitativa ordinal.
004. (CESPE/TCU/ANALISTA DE CONTROLE EXTERNO/2008)

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 29 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Considerando a tabela anterior, que apresenta a distribuição do quadro de colaboradores da


CAIXA, em mil pessoas, no final dos anos de 2006 e 2007, julgue o item seguinte.
Se uma variável X registra a classificação de cada pessoa do quadro como funcionária, estagiária
ou prestadora de serviço, então X é uma variável qualitativa.
005. (CESPE/TCE-PB/AUDITOR DE CONTAS PÚBLICAS/2018) Na análise exploratória de
dados, são examinados conjuntos de dados cujas principais características serão resumidas,
muitas vezes com métodos visuais. Acerca desse assunto, assinale a opção correta.
a) Uma variável de nível de manipulação nominal identifica as categorias.
b) Uma variável de nível de manipulação contínua pode assumir infinitos
valores.
c) Uma variável de nível de mensuração discreta pode assumir apenas alguns valores.
d) Uma variável de nível de mensuração define como uma variável se relaciona com as outras.
e) Uma variável de nível de manipulação define a quantidade de informação apresentada por
cada variável.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 30 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

EXERCÍCIOS
006. (CESPE/CEBRASPE/MINISTÉRIO DA ECONOMIA/TECNOLOGIA DA INFORMAÇÃO-
-CIÊNCIA DE DADOS/2020) Acerca de conceitos, premissas e aplicações de big data, julgue
o item subsequente.
Um atributo é denominado ordinal quando as variáveis podem ser colocadas em ordem, mas
não é possível quantificar a diferença entre os resultados.
007. (INÉDITA/2023) O ciclo de vida de um projeto de mineração de dados, segundo a abor-
dagem CRISP-DM, consiste de 5 (cinco) fases. A sequência dessas fases NÃO é obrigatória.
008. (FGV/SEFAZ-AM/2022) Leia o fragmento a seguir. “CRISP-DM é um modelo de referência
não proprietário, neutro, documentado e disponível na Internet, sendo amplamente utilizado
para descrever o ciclo de vida de projetos de Ciência de Dados. O modelo é composto por
seis fases:
1. entendimento do negócio;
2. _____;
3. _____;
4. Modelagem;
5. _____; e
6. implantação”.
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na
ordem apresentada.
a) modelagem do negócio – limpeza de dados – testagem.
b) modelagem de requisitos – raspagem de dados – execução.
c) modelagem do negócio – mineração de dados – reexecução.
d) compreensão dos dados – preparação dos dados – avaliação.
e) mapeamento de metadados – mineração de dados – testagem.
009. (CESPE/INPI/ANALISTA DE PLANEJAMENTO/ESTATÍSTICA/ 2013) Um indicador
de desempenho X permite avaliar a qualidade dos processos de governança de instituições
públicas. A figura mostra, esquematicamente, a sua distribuição, obtida mediante estudo
amostral feito por determinada agência de pesquisa. A tabela apresenta estatísticas descri-
tivas referentes a essa distribuição.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 31 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Com base nessas informações, julgue o item a seguir.


X – representa uma variável qualitativa ordinal.
010. (CESPE/INPI/ANALISTA DE PLANEJAMENTO-ESTATÍSTICA/2013) 0 0 3 3 3 4 1 2 2
11233412204
Considerando os dados acima, que representam a quantidade de doutores presentes em pes-
quisas que geraram patentes industriais, julgue os próximos itens.
O nível de mensuração da variável é qualitativo ordinal.
011. (CEBRASPE/CESPE/TCM-BA/AUDITOR ESTADUAL-CONTROLE EXTERNO/2018)
Acerca de visualização e análise exploratória de dados, assinale a opção correta.
a) As variáveis são características que podem ser observadas ou medidas em cada elemento
pesquisado, sendo classificadas em inteiras, textuais ou imagens.
b) A entrada de dados deve assumir convenções tais como: os dados devem estar no formato
de matriz; cada linha da matriz deve ter pelo menos um atributo identificador; e cada coluna da
matriz deve ter um nome distinto.
c) A informação de uma ou mais variáveis que não estiver disponível (por exemplo, falta de
resposta, rasura etc.) deve ser marcada (ou indicada) com zero.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 32 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

d) Um arquivo csv (comma separated values), no qual as colunas de um conjunto de dados são
separadas por vírgula, pode ser aberto em qualquer editor de texto ou planilha eletrônica.
e) A eliminação completa (casewise deletion) consiste em eliminar os arquivos que apresentem
mais de um dado perdido.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 33 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

GABARITO

1. C
2. c
3. E
4. C
5. c
6. C
7. E
8. d
9. E
10. E
11. d

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 34 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

GABARITO COMENTADO
006. (CESPE/CEBRASPE/MINISTÉRIO DA ECONOMIA/TECNOLOGIA DA INFORMAÇÃO-
-CIÊNCIA DE DADOS/2020) Acerca de conceitos, premissas e aplicações de big data, julgue
o item subsequente.
Um atributo é denominado ordinal quando as variáveis podem ser colocadas em ordem, mas
não é possível quantificar a diferença entre os resultados.

A variável qualitativa é aquela expressa não por valores, mas por um atributo. Elas também
podem ser divididas da seguinte maneira:

• As variáveis qualitativas nominais são aquelas em que não se pode estabelecer uma
ordem para elas: intenção de voto, cor dos olhos, time de futebol, marcas de carros, nome
de bebidas, sexo - masculino ou feminino etc.
• As variáveis qualitativas ordinais são aquelas em que é possível estabelecer uma or-
dem: marco temporal (século XIX, XX, XI), grau de escolaridade (1º, 2º, 3º grau), escala
de frequência (pouco, médio, muito), nível de escolaridade – (analfabeto / fundamental
/ médio / superior) etc.
Certo.

007. (INÉDITA/2023) O ciclo de vida de um projeto de mineração de dados, segundo a abor-


dagem CRISP-DM, consiste de 5 (cinco) fases. A sequência dessas fases NÃO é obrigatória.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 35 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Destacamos na tabela seguinte uma visão geral das fases do CRISP-DM, para melhor fixação
desse assunto! Vamos lá!

Foco no entendimento do negócio que visa obter


(1) Entendimento do Negócio
conhecimento sobre os objetivos do negócio e seus
(Business Understanding)
requisitos.
Consiste no entendimento dos dados, que visa à familiarização com
(2) Seleção dos Dados (Data Understanding) o banco de dados pelo grupo de projeto, utilizando-se de conjuntos
de dados “modelo”.
(3) Limpeza dos Dados ou Preparação
Fase de preparação de dados, buscando a limpeza, a transformação,
dos Dados
a integração e a formatação dos dados da etapa anterior.
(Data Preparation)
Fase que consiste na modelagem dos dados, a qual visa à aplicação
de técnicas de modelagem sobre o conjunto de dados preparado
(4) Modelagem dos Dados
na etapa anterior.
(Modeling)
Técnicas são baseadas em conceitos de: aprendizagem de máquina;
reconhecimento de padrões; estatística; clusterização etc.
Visa garantir que o modelo gerado atenda às expectativas da
(5) Avaliação do processo
organização. Os resultados do processo de descoberta do conhecimento
(Evaluation)
podem ser mostrados de diversas formas.
(6) Execução Esta fase consiste na definição das fases de implantação do projeto
(Deployment) de Mineração de Dados.

Figura – Visão Geral das Fases do CRISP-DM Process Model (Elaboração Própria)

Na figura seguinte é mostrado o ciclo de vida de um projeto de mineração de dados, que con-
siste de 6 (seis) fases.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 36 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Figura - Fases do CRISP-DM Process Model (Baseado em [The CRISP-DM Consortium, 2000])

A sequência dessas fases NÃO é obrigatória, ocorrendo a transição para diferentes fases, depen-
dendo do resultado de cada fase, e que etapa particular de cada fase precisa ser executada em
seguida. As setas indicam as mais importantes e mais frequentes dependências entre as fases.
O ciclo externo na figura simboliza o ciclo natural da mineração de dados. Um processo de
mineração de dados continua após a solução ter sido desenvolvida. Processos subsequentes
se beneficiarão das experiências de processos anteriores.
Errado.

008. (FGV/SEFAZ-AM/2022) Leia o fragmento a seguir. “CRISP-DM é um modelo de referência


não proprietário, neutro, documentado e disponível na Internet, sendo amplamente utilizado
para descrever o ciclo de vida de projetos de Ciência de Dados. O modelo é composto por
seis fases:
1. entendimento do negócio;
2. _____;
3. _____;
4. Modelagem;
5. _____; e
6. implantação”.
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na
ordem apresentada.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 37 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

a) modelagem do negócio – limpeza de dados – testagem.


b) modelagem de requisitos – raspagem de dados – execução.
c) modelagem do negócio – mineração de dados – reexecução.
d) compreensão dos dados – preparação dos dados – avaliação.
e) mapeamento de metadados – mineração de dados – testagem.

Os nomes variam um pouco, mas temos que: (2) Entendimento/Compreensão de Dados; (3)
Preparação dos Dados; (5) Teste e Avaliação.
Letra d.

009. (CESPE/INPI/ANALISTA DE PLANEJAMENTO/ESTATÍSTICA/ 2013) Um indicador


de desempenho X permite avaliar a qualidade dos processos de governança de instituições
públicas. A figura mostra, esquematicamente, a sua distribuição, obtida mediante estudo
amostral feito por determinada agência de pesquisa. A tabela apresenta estatísticas descri-
tivas referentes a essa distribuição.

Com base nessas informações, julgue o item a seguir.


X – representa uma variável qualitativa ordinal.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 38 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

X – representa uma variável quantitativa contínua. As variáveis quantitativas contínuas são


mensuráveis em um intervalo, ou seja, podem assumir qualquer número (inteiro ou não) den-
tro de um intervalo de valores. Exemplos: tempo para chegar ao trabalho, distância percorrida,
tempo para executar uma tarefa, altura dos alunos de uma escola.
Errado.

010. (CESPE/INPI/ANALISTA DE PLANEJAMENTO-ESTATÍSTICA/2013) 0 0 3 3 3 4 1 2 2


11233412204
Considerando os dados acima, que representam a quantidade de doutores presentes em pes-
quisas que geraram patentes industriais, julgue os próximos itens.
O nível de mensuração da variável é qualitativo ordinal.

O nível de mensuração da variável é quantitativo discreto.

Errado.

011. (CEBRASPE/CESPE/TCM-BA/AUDITOR ESTADUAL-CONTROLE EXTERNO/2018)


Acerca de visualização e análise exploratória de dados, assinale a opção correta.
a) As variáveis são características que podem ser observadas ou medidas em cada elemento
pesquisado, sendo classificadas em inteiras, textuais ou imagens.
b) A entrada de dados deve assumir convenções tais como: os dados devem estar no formato
de matriz; cada linha da matriz deve ter pelo menos um atributo identificador; e cada coluna da
matriz deve ter um nome distinto.
c) A informação de uma ou mais variáveis que não estiver disponível (por exemplo, falta de
resposta, rasura etc.) deve ser marcada (ou indicada) com zero.
d) Um arquivo csv (comma separated values), no qual as colunas de um conjunto de dados são
separadas por vírgula, pode ser aberto em qualquer editor de texto ou planilha eletrônica.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 39 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

e) A eliminação completa (casewise deletion) consiste em eliminar os arquivos que apresentem


mais de um dado perdido.

Vamos aos comentários das assertivas:


a) Errada. As variáveis são características que podem ser observadas ou medidas em cada
elemento pesquisado, sendo classificadas em quantitativas e qualitativas.

Figura. Tipos de Variáveis (QUINTÃO, 2023)

b) Errada. A entrada de dados deve assumir certas convenções, conforme https://www.inf.ufsc.


br/~andre.zibetti/probabilidade/aed.html
• Os dados devem estar no formato de matriz.
• Cada linha da matriz corresponde a uma unidade experimental.
− Elemento da população ou amostra no qual observamos as variáveis.
• Cada coluna da matriz corresponde a uma variável.
c) Errada. O zero, nesse caso, indicará uma quantidade que foi medida.
d) Certa. Um arquivo csv (comma separated values), em que as colunas de um conjunto de dados
são separadas por vírgula, pode ser aberto em qualquer editor de texto ou planilha eletrônica.
e) Errada. A eliminação completa (“casewise deletion”) consiste em eliminar todos os casos
(linhas) que apresentem pelo menos um dado perdido.
Letra d.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 40 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

REFERÊNCIAS
17 CASOS de uso de machine learning. Data Science Academy, [s. l.], 8 ago. 2018. Dispo-
nível em: http://datascienceacademy.com.br/blog/17-casos-de-uso-de-machine-learning/.
Acesso em: 28 junho 2020.
ALECRIM, E. O que é big data? 2013. Disponível em: <http://www.infowester.com/big-data.
php>. Acesso em: 05 jul. 2020.
ALTERYX. Data Analytics. 2022. Disponível em: <https://www.alteryx.com/pt-br/glossary/
data-analytics>. Acesso em: 04 set. 2022.
AWS. O que é ciência de dados? Guia de ciência de dados para iniciantes. 2022. Disponível
em: <O que é ciência de dados? – Guia de ciência de dados para iniciantes – AWS (amazon.
com)>. Acesso em: 30 jan. 2023.
BIG DATA BUSINESS. Big Data Analytics: você sabe o que é? Disponível em: <http://www.
bigdatabusiness.com.br/voce-sabe-o-que-e-big-data-analytics/> Acesso em: 10 mar. 2019.
___________. Tipos de análise de Big Data: você conhece todos os 4? Disponível em: <http://
www.bigdatabusiness.com.br/conheca-os-4-tipos-de-analises-de-big-data-analytics/>. Acesso
em: 10 mar. 2019.
BRASIL. Controladoria-Geral da União. Portal da Transparência. Brasília: CGU, c2020. Dis-
ponível em: http://portaltransparencia.gov.br/. Acesso em: 17 ago. 2020.
BRASIL. Ministério do Planejamento, Desenvolvimento e Gestão. Painéis. Brasília: MPDG,
2020. Disponível em: http://www2.planejamento.gov.br/planejamento/paineis. Acesso em:
17 ago. 2020.
BRASIL. Ministério do Planejamento, Desenvolvimento e Gestão. Secretaria de Tecnologia
da Informação. O que são dados abertos? Brasília: MPDG, 2020. Disponível em: http://dados.
gov.br/pagina/dados-abertos. Acesso em: 17 ago. 2020.
BRASIL. Ministério do Planejamento, Desenvolvimento e Gestão. Secretaria de Tecnologia
da Informação. Portal Brasileiro de Dados Abertos. Brasília: MPDG, 2020. Disponível em: http://
dados.gov.br/. Acesso em: 17 ago. 2022.
BRITO, S. H. B. Afinal, O Que é Big Data? 2013. Disponível em: <http://labcisco.blogspot.
com.br/2013/08/afinal-o-que-e-big-data.html>.
CÁNEPA, G. What You Need to Know about Machine Learning. Birmingham: Packt Pu-
blishing, 2016.
CETAX. HADOOP: O que é, conceito e definição. Cetax, [s. l.]. Disponível em: https://www.
cetax.com.br/blog/apache-hadoop/. Acesso em: 25 maio 2020.
CUESTA, H.; KUMAR, S. Practical Data Analysis. 2. ed. Birmingham: Packt Publishing, 2016.
DAMA. Guide to the Data Management Body of Knowledge (DAMA-DMBOK2). Copyright
DAMA International - Second Edition, First Printing 2017.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 41 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

Data Science Academy. 12 Tendências em Análise de Dados, Data Science e IA Para 2023.
2023. Disponível em: < https://blog.dsacademy.com.br/12-tendencias-em-analise-de-dados-
-data-science-e-ia-para_2023/>. Acesso em: 30 jan. de 2023.
Drew Conway Data Consulting. The Data Science Venn Diagram, 2010. Disponível em: <http://
drewconway.com/zia/2013/3/26/the-data-science-venn-diagram>. Acesso em: 31 jan. 2023.
ENAP. Análise de Dados em Linguagem R. Fundação Escola Nacional de Administração
Pública. Brasília, DF. 2020.
FELDMAN, S. A Minute on the Internet in 2019. Statista, New York, 29 mar. 2019. Disponível
em: https://www.statista.com/chart/17518/internet-use-one-minute/. Acesso em: 7 ago. 2020.
FIA. Ciência de dados: o que é, principais conceitos e como atuar? 2022. Disponível em:
<https://fia.com.br/blog/ciencia-de-dados-data-science/>. Acesso em: 31 jan. 2023.
FIVEACTS. Data Analytics: entenda o que é e como utilizá-lo nas organizações. Disponível
em: <https://www.fiveacts.com.br/data-analytics/>.
FREITAS JUNIOR, J. C. S.; MAÇADA, A. C. G.; OLIVEIRA, M.; BRINKHUES, R. A. Big Data
e Gestão do Conhecimento: Definições e Direcionamentos de Pesquisa. Revista Alcance,
v. 23, n. 4, p. 529-546, out./dez. 2016. Disponível em: https://www.redalyc.org/jatsRe-
po/4777/477749961006/477749961006.pdf. Acesso em 22 maio 2020.
FUENTES, A. Hands-On Predictive Analytics with Python. Birmingham: Packt Publishing, 2018.
GOLLAPUDI, S. Practical Machine Learning. Birmingham: Packt Publishing, 2016.
GOMES, G. L. Análise de dados na prática com R Studio. DevMedia, Brasília, 2018. Disponível
em:https://www.devmedia.com.br/analise-de-dados-na-pratica-com-r-studio/39279. Acesso
em: 17 ago. 2020.
JOSEPH, R. Big Data Analytics in Government: How the Public Sector Leverages Data In-
sights. Intellectyx, Denver, 26 jun. 2019. Disponível em: https://www.intellectyx.com/blog/
big-dataanalytics-in-government-how-the-public-sector-leverages-data-insights/. Acesso em:
7 ago. 2020.
LANTZ, B. Machine Learning with R. 2. ed. Birmingham: Packt Publishing, 2015.
LIU, Y. H. Python Machine Learning By Example. Birmingham: Packt Publishing, 2017.
MONTEIRO, L. P. Dados Estruturados e Não Estruturados. Blog Tecnologia da Informação.
São Paulo: Universidade da Tecnologia, 2019. Disponível em: https://universidadedatecnologia.
com.br/dados-estruturados-e-nao-estruturados/. Acesso em: 25 jun. 2020.
OZDEMIR, S. Principles of Data Science. Birmingham: Packt Publishing, 2016.
PENG, R. D. R Programming for Data Science. Victoria, BC: Leanpub, 2015.
PERRICOS, C.; KAPUR, V. Anticipatory government: Preempting problems through predictive
analytics. Deloitte Insights, New York, 24 jun. 2019. Disponível em: https://www2.deloitte.com/
us/en/insights/industry/public-sector/government-trends/2020/predictive-analytics-ingover-
nment.html. Acesso em: 7 ago. 2020.
QUINTÃO, P. L. Tecnologia da Informação para Concursos, 2023.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 42 de 44
Fluência em Dados
Ciência de Dados
Patrícia Quintão

REZA, M. Machine Learning. Pittsburg, PA: CMUCC, c1995. Disponível em: http://www.
contrib.andrew.cmu.edu/~mndarwis/ML.html. Acesso em: 7 ago. 2020.
SAGAH. Introdução à ciência de dados. Centro Universitário das Faculdades Metropolita-
nas Unidas.
SANT’ANA, R. C. G. Ciclo de vida dos dados: uma perspectiva a partir da ciência da infor-
mação. Informação & Informação, v. 21, n. 2, p. 116-142, 2016.
SAS. MACHINE Learning: o que é e qual sua importância?, São Paulo, 2019. Disponível
em: <https://www.sas.com/pt_br/insights/analytics/machine-learning.html>. Acesso em: 10
ago. 2020.
Seminário Internacional sobre Análise de Dados na Administração Pública, 5., 2019, Bra-
sília. Programa [...]. Brasília: TCU: Enap, 2019. Disponível em: http://www.brasildigital.gov.br/
brasil-digital/programa/. Acesso em: 17 ago. 2020.
SILVA, M. N. P. da S. Variáveis na Estatística. Disponível em: <https://mundoeducacao.uol.
com.br/matematica/variaveis-na-estatistica.htm>. Acesso em: 7 abr.2021.
SIX Big Data Use Cases for the Public Sector. Ingram Micro, Irvine, 25 jan. 2017. Disponível
em: https://imaginenext.ingrammicro.com/data-center/six-big-data-use-cases-for-the-public-
-sector. Acesso em: 17 ago. 2020.
VORHIES, W. Prescriptive versus predictive analytics - a distinction without a difference?
2014. Disponível em: <https://www.datasciencecentral.com/profiles/blogs/prescriptive-ver-
sus-predictive-analytics-a-distinction-without-a>. Acesso em: 20 ago. 2020.
WALKOWIAK, S. Big Data Analytics with R. Birmingham: Packt Publishing, 2016.
WIKERSON, L. De que maneira o Big Data melhora nossa vida diária? 2015. Disponível em:
<http://www.tecmundo.com.br/tecnologia-da-informacao/80027-maneira-big-data-melhora-
-nossa-vida-diaria-infografico.htm>. Acesso em: 04 jul. 2020.

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

www.grancursosonline.com.br 43 de 44
Patrícia Quintão
Mestre em Engenharia de Sistemas e computação pela COPPE/UFRJ, Especialista em Gerência de
Informática e Bacharel em Informática pela UFV. Atualmente é professora no Gran Cursos Online;
Analista Legislativo (Área de Governança de TI), na Assembleia Legislativa de MG; Escritora e Personal &
Professional Coach.
Atua como professora de Cursinhos e Faculdades, na área de Tecnologia da Informação, desde 2008. É
membro: da Sociedade Brasileira de Coaching, do PMI, da ISACA, da Comissão de Estudo de Técnicas de
Segurança (CE-21:027.00) da ABNT, responsável pela elaboração das normas brasileiras sobre gestão da
Segurança da Informação.
Autora dos livros: Informática FCC - Questões comentadas e organizadas por assunto, 3ª. edição e 1001
questões comentadas de informática (Cespe/UnB), 2ª. edição, pela Editora Gen/Método.
Foi aprovada nos seguintes concursos: Analista Legislativo, na especialidade de Administração de Rede, na
Assembleia Legislativa do Estado de MG; Professora titular do Departamento de Ciência da Computação
do Instituto Federal de Educação, Ciência e Tecnologia; Professora substituta do DCC da UFJF; Analista de
TI/Suporte, PRODABEL; Analista do Ministério Público MG; Analista de Sistemas, DATAPREV, Segurança da
Informação; Analista de Sistemas, INFRAERO; Analista - TIC, PRODEMGE; Analista de Sistemas, Prefeitura
de Juiz de Fora; Analista de Sistemas, SERPRO; Analista Judiciário (Informática), TRF 2ª Região RJ/ES, etc.
Redes Sociais: @coachpatriciaquintao (Instagram) /profapatriciaquintao (YouTube) / @plquintao (Twitter) /
t.me/coachpatriciaquintao (Telegram)

O conteúdo deste livro eletrônico é licenciado para GUTEMBERG DE OLIVEIRA QUEROZ - 06381121416, vedada, por quaisquer meios e a qualquer título,
a sua reprodução, cópia, divulgação ou distribuição, sujeitando-se aos infratores à responsabilização civil e criminal.

Você também pode gostar