ANT202 Modernizando El Data Warehouse Spanish

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 32

AMERICAS

ANT202

Modernizando el data warehouse

Luis Caro, PhD


Solutions Architect
AWS

© 2020, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Agenda
Por que escoger una estrategia de lago de datos
Arquitectura y Conceptos
Funcionalidades recientes de Amazon Redshift
Como migrar
Nielsen transforma
su negocio utilizando
Amazon Redshift y
un lago de Datos

Amazon Redshift Amazon S3 Amazon Athena


Nielsen usa un lago de datos y
Amazon Redshift para analizar las
mediciones de Canales de TV
CI/CD

Data collection Procesamiento de datos Aplicaciones


nacional

Sistema's de ingesta Amazon EMR Amazon Redshift Appliciones cliente

Lago de datos de media


Amazon EMR
Amazon Redshift ayuda a superar el reto de la
analítica a gran escala

Volumen, Alta Multiple Sistemas dificiles Seguiridad y Incremento en


variedad y concurrencia y necesidades de manejar compliance los costos y baja
velocidad de desempeño analiifcas flexibilidad
datos
Data warehouse Amazon
(business data) Transaction
RDS
system
Amazon
PostgreSQL
Aurora
Amazon
Redshift

Lago de
datos
Amplio portafolio de analítica y base de datos

Amazon Amazon Amazon Amazon Amazon Amazon Amazon Amazon Amazon Amazon
Aurora RDS DynamoDB DocumentDB ElastiCache Redshift EMR ES MSK QuickSight

DB DB No Data Hadoop Analítica Tiempo BI


Relacional relacional warehouse and Spark operacional real

Elasticsearch

Logstash

Kibana
PostgreSQL
Beneficios de Amazon Redshift
Mas de 10 miles de clientes usan Amazon Redshift y procesan mas de 2 EB de datos diarios

3x mejor desempeño que otros DW 75% mas económico que


AWS Lake Formation otros DW en nube
Costo predecible

Escalamiento lineal illimitado Certificaciones como SOC, ; soporte


PCI DSS, ISO, FedRAMP, HIPAA de AWS; y SLAs de 99.9%
© 2020, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Amazon Redshift: En que consiste?

Amazon Redshift
Amazon Redshift
Integración con Lago de Datos
Arquitectura de Amazon Redshift
Arquitectura basada en paralelismo, SQL clients / BI tools
modelo columnar con esquema de JDBC / ODBC
no compartir recursos
Nodo
Nodo Lider Lider
Punto de conexión SQL
Almacena metadata
Coordina el procesamiento SQL Nodo de Nodo de Nodo de
Computo Computo Computo
Nodo de Computo Query

Almacenamiento colmnar Carga, Amazon


Ejecuta queries en paralello descarga, ... Redshift
backup, 1 2 3 4 N Spectrum
Interactua con S3 para carga y descarga restore
de datos

Nodos de Amazon Redshift Spectrum Amazon S3


Queries directos a S3
AQUA: Advanced Query Accelerator
Preview

Compute
Compute Compute Compute
Compute
Compute
Compute
Clusters
Clusters
RA3
Compute
Compute
Compute
Clusters
Compute
Compute
Clusters
Clusters
RA3
Nueva capa de procesamiento de queries
Clusters Clusters
RA3 Clusters
Clusters
cluster
Clusters
Clusters
cluster
Clusters
cluster distribuido de hardware

Minimiza tranferencia de datos sobre la red

AQUA AQUA AQUA AQUA


node node node node Nodos con procesadores diseñados por AWS

Disponible en preview para nodos RA3 sin cambio


en el codigo

Amazon Redshift managed storage


Tipos de Nodo
Amazon Redshift analytics – Tipo de instancia Tipo de disco Memoria CPUs
RA3 (new)
RA3 4xlarge (new) RMS 96 GB 12
Dense compute – DC2 RA3 16xlarge (new) RMS 384 GB 48

Dense storage – DS2 DC2 large SSD 16 GB 2

DC2 8xlarge SSD 244 GB 32

DS2 xlarge Magnetic 32 GB 4

DS2 8xlarge Magnetic 244 GB 36

Escala de TBs a 10x PBs de almacenamiento


Concurrency scaling
Amazon Redshift agrega clusters trancientes en segundos para soportas picos en la demanda
Concurrency scaling
Amazon Redshift agrega clusters trancientes en segundos para soportas picos en la demanda
Concurrency scaling
Amazon Redshift agrega clusters trancientes en segundos para soportas picos en la demanda

Backup
Concurrency scaling
Amazon Redshift agrega clusters trancientes en segundos para soportas picos en la demanda

Backup Capa de cache


Concurrency scaling
Amazon Redshift agrega clusters trancientes en segundos para soportas picos en la demanda

Backup Capa de cache


Elastic resize: Escala en minutos
Agrega o quita nodos de un
cluster existente
JDBC / ODBC

Amazon
1 Redshift
El desempeño escala cluster

proporcionalmente

Solo toma unos cuantos 3

minutos 2
Backup

Amazon Redshift managed S3

Las sesiones y queries tienen


mínima interrupción
© 2020, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Funcionalidades para resolver necesidades de los clientes

200+
Funcionalidades nuevas
En los últimos 18 meses
Nodos RA3 con almacenamiento administrado
Escala y paga por computo y almacenamiento independientemente

Leader node

Almacenamient Cache de alta Red de alto


Administrado velocidad desempeño RA3
compute
nodes
Escala nodos solamente basado en
necesidades de computo

Automático, no hay que realizar


ningún cambio Amazon Redshift
managed storage
Vistas materializadas de Amazon Redshift
Acelera queries
Joins, filters, agregaciones, y projecciones
ubi_ventas
ubi ventastotal
SF 12.00
Facilita y agiliza la migracion hacia NY 10.00

Amazon Redshift Ventas


totales
por ubi?

tienda ventas
tienda du ubi item tiend cli prec
s1 Joe SF i1 s1 c1 12.0
s2 Ann NY i2 s2 c1 3.0
s3 Lisa SF i3 s2 c2 7.0
Amazon Redshift Queries federados
Queries en Amazon RDS y Amazon
Aurora PostgreSQL
JDBC / ODBC
Analítica en el origen de los datos

Flexibilidad y facilidad de ingestión de


datos
Amazon Redshift
Alto desempeño y seguridad Almacenamiento
© 2020, Amazon Web Services, Inc. or its affiliates. All rights reserved.
Herramientas de migracion

AWS Schema Conversion Tool (AWS SCT)

AWS Database Migration Service (AWS DMS)


AWS SCT
AWS SCT ayuda a automatizar el esquema de la base de
datos y las tareas de conversión de código al migrar de
los motores de base de datos de origen a destino
Funcionalidades

Crea informes de evaluación para migraciones Convierte


homogéneas / heterogéneas

Convierte esquema de base de datos

Convierte esquema de Data Warehouse Base de AWS SCT Base de


datos datos
fuente destino
Usa conexiones seguras a las BD con SSL

Optimiza esquemas en Amazon Redshift


AWS DMS

Migra bases de Migra entre on premises y AWS

datos a AWS Migra entre diferentes motores

Conversión de schema automatizada

Replicación de datos para


minimizar downtime
Continua aprendiendo
Aprende sobre Amazon Redshift: www.aws.com/redshift
Recursos: www.aws.amazon.com/redshift/resources/
FAQs: www.aws.amazon.com/redshift/faqs/
Blog de AWS Big Data : www.aws.amazon.com/blogs/big-data/
Historias de clientes: www.aws.amazon.com/big-data/datalakes-and-
analytics/customers/
Aprenda bases de datos con la formación y certificación de AWS
Recursos creados por los expertos de AWS para ayudarle a crear y validar habilidades de bases de
datos
Más de 25 cursos de formación digital gratuitos cubren temas y
servicios relacionados con bases de datos relacionales y no
relacionales

Aulas ofreciendo planeación y diseño de bases de datos en AWS,


funcionalidades e instructores expertos de AWS con actividades
prácticas

Valide su experiencia con la certificación especializada de base de


datos de AWS

Visite la ruta de aprendizaje de bases de datos en aws.amazon.com/training/path-databases


¡Gracias!

© 2020, Amazon Web Services, Inc. or its affiliates. All rights reserved.

También podría gustarte