Investigacion Base de Datos Procesamiento OLTP y OLAP

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 13

Base de Datos

Una base de datos es un conjunto de datos pertenecientes a un mismo


contexto y almacenados sistemáticamente para su posterior uso. En este
sentido; una biblioteca puede considerarse una base de datos compuesta en su
mayoría por documentos y textos impresos en papel e indexados para su
consulta. Actualmente, y debido al desarrollo tecnológico de campos como
la informática y la electrónica, la mayoría de las bases de datos están en
formato digital, siendo este un componente electrónico, por tanto se ha
desarrollado y se ofrece un amplio rango de soluciones al problema
del almacenamiento de datos.
Hay programas denominados sistemas gestores de bases de datos, abreviado
SGBD (del inglés Database Management System o DBMS), que permiten
almacenar y posteriormente acceder a los datos de forma rápida y
estructurada. Las propiedades de estos DBMS, así como su utilización y
administración, se estudian dentro del ámbito de la informática.
Las aplicaciones más usuales son para la gestión de empresas e instituciones
públicas; También son ampliamente utilizadas en entornos científicos con el
objeto de almacenar la información experimental.

Una base de datos es un “almacén” que nos permite guardar grandes


cantidades de información de forma organizada para que luego podamos
encontrar y utilizar fácilmente. A continuación te presentamos una guía que te
explicará el concepto y características de las bases de datos.

El término de bases de datos fue escuchado por primera vez en 1963, en un


simposio celebrado en California, USA. Una base de datos se puede definir
como un conjunto de información relacionada que se encuentra agrupada ó
estructurada.

Desde el punto de vista informático, la base de datos es un sistema formado


por un conjunto de datos almacenados en discos que permiten el acceso
directo a ellos y un conjunto de programas que manipulen ese conjunto de
datos.

Cada base de datos se compone de una o más tablas que guarda un conjunto
de datos. Cada tabla tiene una o más columnas y filas. Las columnas guardan
una parte de la información sobre cada elemento que queramos guardar en la
tabla, cada fila de la tabla conforma un registro.

Se define una base de datos como una serie de datos organizados y


relacionados entre sí, los cuales son recolectados y explotados por los sistemas
de información de una empresa o negocio en particular.

Características

Entre las principales características de los sistemas de base de datos podemos


mencionar:

 Independencia lógica y física de los datos.


 Redundancia mínima.
 Acceso concurrente por parte de múltiples usuarios.
 Integridad de los datos.
 Consultas complejas optimizadas.
 Seguridad de acceso y auditoría.
 Respaldo y recuperación.
 Acceso a través de lenguajes de programación estándar.
El procesamiento de datos

El procesamiento de datos se produce cuando se recaban datos y se traducen a


información utilizable. Suelen ocuparse los científicos de datos, solos o en
equipo, y es importante que el procesamiento se realice correctamente para
no afectar negativamente al producto final o los resultados obtenidos a partir
de los datos.

El procesamiento empieza con datos en su forma en bruto y los convierte a un


formato más legible (gráficos, documentos, etc.), dándoles la forma y el
contexto necesarios para que los ordenadores los interpreten y los empleados
los utilicen en toda una organización.

Las seis etapas del procesamiento de datos

1. Recogida de datos
La recogida de datos es el primer paso del procesamiento. Los datos se extraen
de las fuentes disponibles, entre las cuales se cuentan los data lakes y los
almacenes de datos. Es importante que las fuentes de datos disponibles sean
fiables y estén bien creadas para que los datos recabados (que posteriormente
se emplearán como información) sean de la más alta calidad posible.

2. Preparación de datos
Una vez recabados los datos, se pasa a la fase de la preparación de datos. La
preparación de datos, a menudo llamada «preprocesamiento», es la etapa en
la que los datos en bruto se limpian y organizan para la siguiente fase del
procesamiento. Durante la preparación, los datos en bruto se verifican
diligentemente para detectar errores. El objetivo de este paso es eliminar los
datos erróneos (datos redundantes, incompletos o incorrectos) y empezar a
crear datos de gran calidad para obtener la mejor business intelligence.

3. Introducción de datos
A continuación los datos limpios se introducen en su destino (puede ser un
CRM, como Salesforce, o un almacén de datos, como Redshift y se traducen a
un lenguaje comprensible. La introducción de datos es el primer paso en el que
los datos en bruto empiezan a cobrar forma como información utilizable.
4. Procesamiento
Durante esta fase los datos ingresados en el ordenador en la fase anterior se
procesan realmente para su interpretación. El procesamiento se efectúa por
medio de algoritmos de machine learning, si bien el proceso en sí puede variar
ligeramente según cuál sea la fuente de los datos que se esté procesando (data
lakes, redes sociales, dispositivos conectados, etc.) y su uso previsto (estudiar
patrones publicitarios, diagnósticos médicos a partir de dispositivos
conectados, determinar necesidades de clientes, etc.).

5. Salida/interpretación de datos
La etapa de salida/interpretación es la fase en la que los datos resultan
finalmente utilizables para los que no son científicos de datos. Están
traducidos, son legibles y muchas veces se presentan en forma de gráficos,
vídeos, imágenes, texto simple, etc. A partir de ese momento los miembros de
una empresa o institución pueden empezar a autogestionarse los datos para
sus propios proyectos de analíticas de datos.

6. Almacenamiento de datos
La última fase del procesamiento de datos es el almacenamiento. Cuando
todos los datos están procesados, se almacenan para su futuro uso. Si bien hay
alguna información que ya puede emplearse de inmediato, gran parte tendrá
utilidad a posteriori. Además, almacenar correctamente nuestros datos es una
necesidad para dar cumplimiento a la legislación de protección de datos, como
el RGPD. Cuando los datos están bien almacenados, a los miembros de la
organización les resulta fácil y rápido acceder a ellos siempre que lo necesiten.
OLTP - On-Line Transactional Processing

Los sistemas OLTP son bases de datos orientadas al procesamiento de


transacciones. Una transacción genera un proceso atómico (que debe ser
validado con un commit, o invalidado con un rollback), y que puede involucrar
operaciones de inserción, modificación y borrado de datos. El proceso
transaccional es típico de las bases de datos operacionales.

   El acceso a los datos está optimizado para tareas frecuentes de lectura y


escritura. (Por ejemplo, la enorme cantidad de transacciones que tienen
que soportar las BD de bancos o hipermercados diariamente).

   Los datos se estructuran según el nivel aplicación (programa de gestión a


medida, ERP o CRM implantado, sistema de información
departamental...).

   Los formatos de los datos no son necesariamente uniformes en los


diferentes departamentos (es común la falta de compatibilidad y la
existencia de islas de datos).

   El historial de datos suele limitarse a los datos actuales o recientes.

OLAP - On-Line Analytical Processing

Los sistemas OLAP son bases de datos orientadas al procesamiento analítico.


Este análisis suele implicar, generalmente, la lectura de grandes cantidades de
datos para llegar a extraer algún tipo de información útil: tendencias de ventas,
patrones de comportamiento de los consumidores, elaboración de informes
complejos… etc. Este sistema es típico de los datamarts.

   El acceso a los datos suele ser de sólo lectura. La acción más común es la
consulta, con muy pocas inserciones, actualizaciones o eliminaciones.

   Los datos se estructuran según las áreas de negocio, y los formatos de


los datos están integrados de manera uniforme en toda la organización.

   El historial de datos es a largo plazo, normalmente de dos a cinco años.

   Las bases de datos OLAP se suelen alimentar de información procedente


de los sistemas operacionales existentes, mediante un proceso de
extracción, transformación y carga (ETL).
Las BD OLTP (Procesamiento de Transacciones en Línea) son bases de datos
para uso diario (la BD operacional de la empresa para realizar transacciones)
en donde podemos manejar la información en tablas normalizadas en su 3ra
forma, mediante sentencias SQL como INSERT, UPDATE, DELETE y SELECT
teniendo de esta manera un almacén de información para un periodo de
tiempo en específico haciendo de esta manera más fácil la búsqueda o
manipulación de los datos. Las aplicaciones OLTP se caracterizan por la
creación de muchos usuarios, actualizaciones o recuperación de registros
individuales. Por consiguiente, las bases de datos OLTP se perfeccionan para
actualización de transacciones.

Las BD OLAP (Procesamiento Analítico en Línea) guardan datos agrupados que


provienen de una base de datos OLTP. Las aplicaciones OLAP son usadas por
analistas y gerentes que frecuentemente quieren una vista de datos de nivel
superior (la BD histórica de la empresa para hacer análisis y planificaciones),
como las ventas totales por línea de producto, por región, etc. desde el inicio
de los tiempos de la empresa los cuales pueden ser décadas de miles de
registros y por consiguiente requiere de datos históricos. Las bases de datos
OLAP normalmente se actualizan en lote, a menudo de múltiples fuentes, se
usan para ayudarles a los usuarios en la toma de decisiones. En las aplicaciones
OLAP lo que se busca es conseguir la máxima velocidad, por lo tanto cuanto
más pequeña sea la Base de Datos mucho mejor. La cantidad de usuarios con
acceso a estas es mucho menor.

Una aplicación OLTP se encarga de insertar/borrar/modificar las filas que se


guardarán en las tablas de una Base de Datos OLTP.

 Un programa agrupa esas filas y el resultado lo guarda en una Base de Datos
OLAP. 

Cuando la consulta de un usuario envuelve a tablas pequeñas (de pocos miles


de filas) se utiliza la Base de Datos OLTP, en cambio cuando envuelve a tablas
que en la Base de Datos OLTP tienen millones de filas se usa la Base de Datos
OLAP.
Las empresas grandes actualmente tienen BD OLTP inmensas con tablas con
muchos millones de filas y necesitan gran rapidez en las consultas, y esa
rapidez no la pueden obtener con aplicaciones OLTP. La rapidez que necesitan
solamente la pueden conseguir con aplicaciones OLAP. Como quienes compran
estas aplicaciones son empresas grandes, pagan muy buen dinero por ellas.

Aquí es donde entran las herramientas para Business Intelligent:

El Analysis Services se utiliza para generar un cubo de análisis de los datos de la


base de datos OLAP, el Reporting Services se utiliza para obtener informes
gráficos tanto de la base de datos OLTP como de la OLAP, y el Integration
Services sirve normalmente para migrar los datos
desde la base de datos OLTP a la OLAP. Dichas herramientas, a diferencia del
resto, utilizan un entorno gráfico distinto al Management Studio y se ejecutan
desde el Business Intelligence Development Studio, que no es más que un
Visual Studio empotrado en SQL Server que contiene plantillas para trabajar
con el BI. 

Diferencias entre OLTP y OLAP


TECNOLOGÍAAbril 23, 2018
Anteriormente, hemos visto por separado en que consiste tanto OLTP como
OLAP. En este post vamos a ver sus diferencias.

OLTP y OLAP son los dos sistemas de tratamiento transacciones online. OLTP es
un procesamiento transaccional mientras que OLAP es un sistema de
procesamiento analítico.
OLTP es un sistema que gestiona aplicaciones orientadas a transacciones en
Internet, por ejemplo, ATM. OLAP es un sistema en línea que reporta a
consultas analíticas multidimensionales como informes financieros,
pronósticos, etc. La diferencia básica entre OLTP y OLAP es que OLTP es un
sistema de modificación de base de datos online, mientras que OLAP es un
sistema de respuesta de consulta de base de datos online.
Tabla Comparativa
Diferencias Principales
El punto que distingue a OLTP y OLAP es que OLTP es un sistema de
transacciones en línea, mientras que OLAP es un sistema de recuperación y
análisis de datos en línea.
Los datos transaccionales en línea se convierten en la fuente de datos para
OLTP. Sin embargo, la base de datos OLTPs diferente se convierte en la fuente
de datos para OLAP.
Las operaciones principales de OLTP son insertar, actualizar y eliminar,
mientras que la operación principal de OLAP es extraer datos
multidimensionales para su análisis.
OLTP tiene transacciones cortas pero frecuentes, mientras que OLAP tiene
transacciones largas y menos frecuentes.
El tiempo de procesamiento para la transacción OLTPs es mayor en
comparación con OLAP.
Las consultas OLAPs son más complejas con respecto a los OLTPs.
Las tablas de la base de datos OLTP deben estar normalizadas (3NF), mientras
que las tablas de la base de datos OLAP pueden no estar normalizadas.
Como los OLTPs frecuentemente ejecutan transacciones en la base de datos,
en caso de que cualquier transacción falle en el medio puede dañar la
integridad de los datos y por lo tanto debe cuidar la integridad de los datos.
Mientras que en OLAP la transacción es menos frecuente por lo tanto, no se
preocupa mucho por la integridad de los datos.
En Resumen
OLTP es un sistema de modificación de datos online, mientras que OLAP es un
sistema de recuperación de datos multidimensionales históricos en línea, que
recupera los datos para el análisis que pueden ayudar en la toma de
decisiones. Cuál de ellos usar depende de los requerimientos de los usuarios,
ambos trabajan para diferentes propósitos.
Bibliografia
https://pc-solucion.es/2018/04/23/diferencias-entre-oltp-y-
olap/#:~:text=OLTP%20es%20un%20procesamiento%20transaccional,un
%20sistema%20de%20procesamiento%20anal%C3%ADtico.&text=La
%20diferencia%20b%C3%A1sica%20entre%20OLTP,de%20base%20de
%20datos%20online.
https://www.sinnexus.com/business_intelligence/olap_vs_oltp.aspx
https://es.wikipedia.org/wiki/Base_de_datos
http://www.maestrosdelweb.com/que-son-las-bases-de-datos/

También podría gustarte