Modelagem e Arquitetura Do DW

Fazer download em txt, pdf ou txt
Fazer download em txt, pdf ou txt
Você está na página 1de 7

Prepare-se! Chegou a hora de você testar o conhecimento adquirido nesta disciplina.

A Avaliação Virtual (AV) é composta por questões objetivas e corresponde a 100% da


média final. Você tem até cinco tentativas para “Enviar” as questões, que são
automaticamente corrigidas. Você pode responder as questões consultando o material
de estudos, mas lembre-se de cumprir o prazo estabelecido. Boa prova!
1)
Sobre a construção do DW, considere as seguintes afirmações:
( ) A construção de um DW inicia com a recuperação dos dados históricos da empresa.
( ) A construção pressupõe necessidades de informações especializadas, indicadores
de performance da organização.
( ) Uma base histórica auxilia na criação de comparações com dados atuais e
tendências futuras.
( ) Um banco de dados analítico é um sistema somente de leitura e escrita que
armazena dados.
( ) A construção não prevê também a utilização de ferramentas.
Assinale a alternativa que contenha a sequência correta:

Alternativas:

V –V - V – V – F.
V – V – V – F – F.checkCORRETO
F - F - F – V – V.
F – V – V – F – F.
F – V – F – V – F.
Resolução comentada:
A construção de um DW inicia com a recuperação dos dados históricos da empresa.
Isso significa realizar cópias da história da organização, de acordo com os dois
anos anteriores, como recomenda Machado (2010).
A construção pressupõe necessidades de informações especializadas, indicadores de
performance da organização. Uma base histórica auxilia na criação de comparações
com dados atuais e tendências futuras.
A construção prevê também a utilização de ferramentas de EIS e DSS. Essas
ferramentas são utilizadas em diferentes níveis de gestão das organizações, de
acordo com Turban (2007).

Código da questão: 52076


2)
Rob e Coronel (2011) enfatizam que a mineração de dados é proativa, ou seja, as
ferramentas buscam automaticamente identificar anomalias e possíveis
relacionamentos entre os dados, identificando problemas ainda não identificados
pelos usuários estratégicos para, assim, prover o conhecimento e aplica-lo às
necessidades dos negócios, sendo que a mineração de dados contempla quatro fases
básicas.

(ROB, P.; CORONEL, C. Sistemas de banco de dados: projeto, implementação e


administração. 8. ed. São Paulo: Cengage Learning, 2011).

Sobre as fases do processo de mineração de dados, julgue os itens a seguir:

A primeira fase, seleção dos dados, refere-se à seleção dos principais conjuntos de
dados e do tratamento de limpeza e integração desses dados a serem utilizados pela
operação de transformação de dados.
A segunda fase, análise e classificação dos dados, refere-se ao estudo dos dados
para identificar características e padrões comuns com a aplicação de algoritmos
para encontrar análises, vínculos ou dependências, padrões, tendências e desvios de
dados.
A terceira fase, aquisição do conhecimento, refere-se à seleção dos algoritmos mais
comuns de modelagem e aquisição de conhecimentos, baseados em redes neurais, lógica
indutiva, árvores de decisão, classificação ou regressão, etc., e a definição
desses algoritmos com possível interação dos usuários finais.
A quarta fase, transformação dos dados, refere-se às descobertas de mineração de
dados para garantirem o comportamento futuro e adquirirem conhecimento, para os
usuários estratégicos analisarem seus negócios, por exemplo, o provável lançamento
de um produto novo ou de uma campanha de marketing.
Estão corretos os itens

Alternativas:

I – II – IV.
II – III.checkCORRETO
I – II.
III – IV.
I – II – III.
Resolução comentada:
o item I está errado, porque a primeira fase é definida como preparação dos dados e
refere-se à identificação dos principais conjuntos de dados e do tratamento de
limpeza e integração desses dados a serem utilizados pela operação de mineração de
dados.
O item IV está errado porque a quarta fase é definida como prognóstico e refere-se
às descobertas de mineração de dados para preverem o comportamento futuro e
projetarem resultados de negócios, como o provável lançamento de um produto novo ou
de uma campanha de marketing.

Código da questão: 42613


3)
Na concepção de Poe, Klauer, Brobst (1998), o Esquema Estrela possui uma estrutura
simples com poucas tabelas e associações bem definidas, aproximando do contexto do
modelo de negócio e facilitando a geração de consultas complexas de forma intuitiva
e interativa, por meio dos vários parâmetros de consultas. Neste esquema, o assunto
principal fica ao centro do esquema, representada pela tabela de Fatos, e suas
características, as dimensões, representadas por tabelas de Dimensões, ficam
posicionadas ao seu redor, permitindo a leitura e compreensão até mesmo de usuários
finais que não estão adaptados com estruturas de banco de dados.
(POE V.; KLAUER P.; BROBST S. Building a data warehouse for decision support. New
Jersey: Prentice Hall PTR, 1998).
Sobre as principais vantagens do Esquema Estrela, julgue os itens a seguir,
indicando “V” para o item verdadeiro e “F” para o item falso:
1. ( ) A estrutura padronizada e regular do esquema é bastante simples,
faciliatando a apresentação, o desempenho das consultas geradas e a compreensão até
mesmo de usuários finais que não estão adaptados com estruturas de banco de dados.
2. ( ) As consultas ocorrem inicialmente nas tabelas de Dimensões e depois nas
tabelas de Fatos, assegurando a consistência dos dados por meio de uma estrutura de
chaves que garante o acesso aos dados com melhor desempenho.
3. ( ) A aplicação da técnica de normalização nas tabelas de Dimensões aumenta o
número de dimensões, consequentemente diminuindo a performance das consultas
dinâmicas.
4. ( ) A facilidade e a flexibilidade da inclusão de novos elementos de dados, a
partir do relacionamento da tabela de Fatos com uma nova tabela de Dimensão, bem
como o acréscimo de novas colunas às mesmas tabelas de Dimensões.
5. O suporte para transformar e proceder à carga dos dados, para recuperar,
analisar e extrair os dados dos sistemas transacionais.

Assinale a alternativa correta:

Alternativas:
F – V – F – V – F.
V – V – V – V – V.
V – V – F – V – F.checkCORRETO
F – F – V – F – V.
F – F – F – F – F.
Resolução comentada:
o item 3 é falso, porque é o Esquema Floco de Neve que separa as hierarquias das
dimensões em tabelas diferentes, especificando variantes da dimensão principal.
Considera-se que a aplicação da técnica de normalização nas tabelas de Dimensões
aumenta consideravelmente o número de dimensões e, consequentemente, diminuindo a
performance das consultas dinâmicas.
O item 5 é falso, porque o processo de transformar e proceder à carga dos dados,
para recuperar, analisar e extrair os dados dos sistemas transacionais refere-se a
uma etapa do processo de criação de um Data Warehouse, conhecido como ETL.

Código da questão: 42602


4)
As ferramentas que apresentam características OLAP passaram a ser referenciadas
como ferramentas OLAP. As ferramentas OLAP podem ser classificadas de acordo com a
estratégia de armazenamento, sendo chamadas de OLAP Multidimensional (MOLAP), OLAP
Relacional (ROLAP), OLAP Híbrido e OLAP Web.

Assinale a alternativa correta que descreve as características das ferramentas do


tipo MOLAP.

Alternativas:

O MOLAP refere-se à utilização da ferramenta OLAP em ambiente remoto, disparando


consultas via um navegador web para o servidor que, por sua vez, retorna o cubo
processado para análise do usuário.
O MOLAP refere-se à utilização de banco de dados relacional para implementar
soluções OLAP, permitindo análise multidimensional dos dados que estão armazenados
em uma base de dados relacional, sendo feito todo o processamento no servidor da
base de dados e depois gerados os comandos SQL e as tabelas temporárias.
O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo operações que ocorrem quando o usuário navega pelas
informações contidas entre dimensões de esquemas diferentes, acessados remotamente.
O MOLAP refere-se à abordagem de uso combinado de um banco de dados relacional com
um banco de dados orientado a objetos, onde as estruturas relacionais são
utilizadas para os dados com maior granularidade e as estruturas orientadas a
objetos são utilizadas para dados com menor granularidade.
O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real,
a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas
com ótimo desempenho.checkCORRETO
Resolução comentada:
O MOLAP refere-se à utilização de banco de dados com características
multidimensionais, permitindo a navegação com níveis de detalhamento em tempo real,
a partir da combinação das dimensões do cubo, proporcionando análises sofisticadas
com ótimo desempenho. Segundo Machado (2013), em um banco de dados
multidimensional, os cruzamentos de valores são realizados automaticamente,
agilizando a visualização multidimensional das informações sob o ponto de vista de
todas as dimensões. A forma de acesso e de agregação dos dados faz com que esta
ferramenta tenha um excelente desempenho.

Código da questão: 42604


5)
Ferramentas de mineração de dados (Data Mining) são integradas aos ambientes de
Data Warehouse para gerarem informações em conhecimento potencialmente útil. Sua
função principal é a extração de grande volume de dados com o objetivo de
encontrarem padrões e correlações significativas, estimarem tendências e novas
perspectivas que agreguem, satisfatoriamente, com contexto do negócio explorado.
Sobre as técnicas de Data Mining, julgue os itens a seguir:
I. Árvores de Decisão (Decision Tree): caracterizam-se pelo método de classificação
de dados, sendo conveniente adotar essa técnica quando o objetivo é gerar regras
que possam ser entendidas, explicadas e traduzidas para a linguagem natural.
II. Redes Neurais Artificiais: caracterizam-se em resolver problemas complexos e
construir representações internas de modelos ou padrões detectados nos dados que
envolvem o desenvolvimento de estruturas matemáticas com habilidade de aprendizado,
por meio de experiências de operações da própria máquina.
III. Predição com Séries Temporais: caracteriza-se em identificar a existência de
diferentes grupos dentro de um conjunto de dados e, constatada está existência,
agrupa-se os elementos estudados de acordo com suas similaridades, podendo refiná-
los e definir a priorização entre eles.
IV. Análise de Regressão: utiliza-se algoritmos genéticos para encontrar soluções
de problemas dinâmicos e complexos que envolvem centenas ou milhares de variáveis
e/ou fórmulas para identificar as descobertas, gerando possíveis soluções
simultaneamente.
Estão corretos os itens:

Alternativas:

III – IV.
I – II – III – IV.
I – II – III.
I – II.checkCORRETO
II – III.
Resolução comentada:
o Item III está errado porque refere-se a técnica de Análise de Aglomerações
(Cluster Analysis): caracteriza-se em identificar a existência de diferentes grupos
dentro de um conjunto de dados e, constatada esta existência, agrupa-se os
elementos estudados de acordo com suas similaridades, podendo refiná-los e definir
a priorização entre eles.
O item IV está errado, porque refere-se à técnica de Algoritmos Genéticos: utiliza-
se algoritmos genéticos para encontrar soluções de problemas dinâmicos e complexos
que envolvem centenas ou milhares de variáveis e/ou fórmulas para identificar as
descobertas, gerando possíveis soluções simultaneamente.

Código da questão: 42614


6)
Em um processo de tomada de decisões, a disponibilidade e o fácil acesso às
informações organizacionais contribuem para uma decisão de sucesso. Assim, a
extração eficaz de informações de um ambiente de Data Warehouse (DW) para gerar
conhecimento é proporcionada por ferramentas que disponibilizam recursos avançados
para suportar operações sobre o conjunto de dados multidimensional. Pela maior
popularidade do uso das ferramentas de acesso a um DW, destaca-se as ferramentas
__________________________.

Assinale a alternativa correta que indica o termo que preenche a lacuna acima:

Alternativas:

Online Transaction Processing (OLTP).


Staging Area.
Business Inteligence (BI).
Online Analytical Processing (OLAP).checkCORRETO
Operational Data Store (ODS).
Resolução comentada:
Machado (2013) descreve que as ferramentas OLAP surgiram com os sistemas de apoio à
decisão para fazerem a consulta e análise dos dados dos DW, sendo às aplicações às
quais os usuários têm acesso para extrair os dados de suas bases e construir os
relatórios com recursos que atendem os gestores.

Código da questão: 42605


7)
Para a definição da arquitetura de um ambiente de Data Warehouse (DW) ou de Data
Marts, deve-se levar em conta o porte da empresa, tempo, capacitação da equipe de
desenvolvimento e recursos disponibilizados para os investimentos.

Sobre a arquitetura de um Data Warehouse e de Data Marts, analise os itens a


seguir:

São classificadas como global, independente ou a combinada; e o tipo de


implementação como top down, bottom up ou a integrada.
A arquitetura global pode ser fisicamente centralizada ou pode ser fisicamente
distribuída nas instalações da empresa.
III. A arquitetura independente é considerada aquela que comporta as necessidades
do DW organizacional com alto nível de acessos e utilização das informações geradas
e disponibilizadas, a partir de ferramentas de apoio a decisão para todos os
departamentos da empresa.

IV. A arquitetura independente mantém Data Marts stand-alone, onde têm-se dados
específicos da necessidade da empresa, considerando que cada departamento tem sua
informação sem a integração com outros departamentos.

V. A arquitetura integrada de Data Marts é implementada por Data Marts


separadamente por grupos específicos ou departamentos, sendo integrados ou
interconectados posteriormente, provendo uma visão organizacional maior dos dados e
informações.

Estão corretos os itens:

Alternativas:

I – II – III – IV – V.
I – II – III.
III – IV – V.
II – III – IV – V.
II – IV – V.checkCORRETO
Resolução comentada:
os itens I e III estão errados. O item I está errado porque a arquitetura é
classificada como global, independente ou a integrada; e o tipo de implementação é
do tipo top down, bottom up ou a combinada.
O item III está errado porque é a arquitetura global que mais independente,
considerada a arquitetura que comporta as necessidades do DW organizacional com
alto nível de acessos e utilização das informações geradas e disponibilizadas, a
partir de ferramentas de apoio a decisão para todos os departamentos da empresa.

Código da questão: 42583


8)
Machado (2013) afirma que uma das principais vantagens de se implantar um Data Mart
em uma empresa, é a possibilidade de retorno rápido, garantindo um maior
envolvimento do usuário final, capaz de avaliar os benefícios extraídos de seu
investimento.

(MACHADO, Felipe N. Tecnologia e projeto de data warehouse. 6. ed. São Paulo, SP:
Erica, 2013).

Sobre as características dos Data Marts, analise os itens a seguir:

I. São orientado por assunto, integrado, volátil e variável no tempo.

II. Fornecem suporte às decisões de um pequeno grupo de pessoas, departamentos ou


área específica do negócio.

III. Demandam menos investimento porque são mais baratos, em função de serem
implementados mais rápidos.

IV. Simulam o raciocínio e a capacidade de aprender de um ser humano, permitindo às


organizações administrarem melhor seus processos.

Estão corretos os itens:

Alternativas:

I – II.
II – III.
I – II – III.checkCORRETO
III – IV.
I – II – III – IV.
Resolução comentada:
os itens I, II e III referem-se às características e/ou vantagens dos Data Marts. O
item IV é uma característica
dos sistemas de inteligência artificial.

Código da questão: 42582


9)
O banco de dados analítico é diferente do banco de dados operacional, transacional
ou OLTP (Online Transaction Processing), usado para processar as transações. Embora
os bancos de dados transacionais possam ser usados para suportar o armazenamento de
dados e as aplicações de BI, não se recomenda seu uso por questões de integridade e
escalabilidade.
I. O banco de dados convencional deve ser preservado, e o banco de dados analíticos
deve estar em outro schema.
PORQUE
II. Um banco de dados analítico tem uma estrutura baseada em coluna, tornando os
cálculos individuais muito rápidos. Já os bancos de dados transacionais dependem de
armazenamento de dados baseado em linha, impróprio para operar com grandes volumes
de dados.
Assinale a alternativa acerca das asserções supracitadas, bem como a relação entre
elas:

Alternativas:

A primeira asserção está correta e a segunda está incorreta.


A primeira e a segunda asserções estão incorretas.
A primeira e a segunda asserções estão corretas, mas a segunda não tem relação com
a primeira.
A primeira asserção está incorreta e a segunda está correta
A primeira e a segunda asserções estão corretas, e a segunda complementa a
primeira.checkCORRETO
Resolução comentada:
Os bancos de dados transacionais são bancos baseados em armazenamento por linha, o
que impossibilita o desempenho quando submetido a cálculos em processos analíticos.
Isto deteriora o desempenho para a finalidade base ao qual foi projetado, que é
armazenar, acessar, incluir e excluir os registros ali depositados. Portanto, para
projetos que envolvam cálculos analíticos outro banco com processo de armazenamento
por coluna é mais eficiente, como os bancos de dados analíticos, pois os registros
ficam livres para serem submetidos aos cálculos volumétricos, essenciais para BI e
Big Data.

Código da questão: 50534


10)
Os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para
análises complexas de dados históricos e descoberta de conhecimento, assegurando o
suporte à tomada de decisão. Um ________________ organizacional pode manter um
armazém central de dados da organização inteira, ou pode manter armazéns menores,
descentralizados, denominados ________________.

Assinale a alternativa que completa adequadamente as lacunas acima:

Alternativas:

Data Warehouse; Data Marts. checkCORRETO


Data Mining; Data Source.
Data Mining; Data Marts.
Data Warehouse; Data Mining.
Data Mining; Data Warehouse.
Resolução comentada:
os ambientes de Data Warehouses (DW) integram sofisticadas ferramentas para
análises complexas de dados históricos e descoberta de conhecimento, assegurando o
suporte à tomada de decisão. Um Data Warehouse organizacional pode manter um
armazém central de dados da organização inteira, ou pode manter armazéns menores,
descentralizados, denominados Data Mart.

Você também pode gostar