Integración de Datos de Diversas Fuentes y Formatos
Integración de Datos de Diversas Fuentes y Formatos
Integración de Datos de Diversas Fuentes y Formatos
Desde Consola:
Salida: Ctrl + Z
Fundamentos de Python
print('Hola Mundo desde Python')
variable = 5
print(variable)
resultado = variable + 7
print(resultado)
x = 9
y = 6489544444444440000000
print(x+y)
#numeros complejos
p = 5j
q = 3 + 7j
r = 9 - 5j
print(p)
print(q+r)
print("-----")
# conversion de datos
s = 1
t = 2.8
u = 1j
a = float(s)
b = int(t)
c = complex(s)
print(a)
print(b)
print(c)
type(a)
type(b)
type(c)
print("-----")
# valores booleanos
valor_verdadero = True
valor_falso = False
print(valor_verdadero)
print(valor_falso)
print(una_cadena)
print(dos_cadena)
print(tres_cadena)
print(cuatro_cadena)
print(cinco_cadena)
print(seis_cadena)
print(siete_cadena)
print(ocho_cadena)
print(nueve_cadena)
#Tipo None
variable_None = None
print(variable_None)
print("-----")
#Casteo
texto = "10"
un_entero = int(texto)
print(un_entero)
type(un_entero)
flotante = float(4)
print(flotante)
type(flotante)
entero = 5
entero_cadena = str(entero)
print(entero_cadena)
type(entero_cadena)
entero_I = 500
hexadecimal = hex(entero_I)
octal = oct(entero_I)
print(hexadecimal)
print(octal)
num_uno = 10
num_dos = 5
suma = num_uno + num_dos
resta = num_uno - num_dos
multipli = num_uno * num_dos
divi = num_uno / num_dos
potencia = num_uno ** num_dos
print(suma)
print(resta)
print(multipli)
print(divi)
print(potencia)
num_tres = 3
division_entera = num_uno // num_tres
modulo = num_uno % num_tres
print(division_entera)
print(modulo)
print("-----")
#version con asignación
num_uno += num_dos #ahora num_uno vale 15
print(num_uno)
num_uno -= num_dos #ahora num_uno vale 10
print(num_uno)
num_uno *= num_dos #ahora num_uno vale 50
print(num_uno)
num_cuatro = 7
texto = "Hola Mundo"
print(3 == 2)
print(3 > 2)
print(texto == "Hola Mundo")
print(7 >= 6)
#operadores cadena
saludo = "Hola " + "Mundo"
gallina = 5 * "Co"
print(saludo)
print(gallina)
otro_saludo += "Mundo"
otra_gallina *= 5
print(otro_saludo)
print(otra_gallina)
otro_resultado = 3 == 2
print(otro_resultado)
print(True and True)
print(True and otro_resultado)
print(not True)
print(False or otro_resultado)
print("-----")
#operador de identidad
varia_ocho = 5
varia_nueve = 5.0
print(varia_ocho is varia_nueve)
print("-----")
#operadores de pertenencia
lista_uno = ["silla","mesa","armario","butaca"]
print("silla" in lista_uno)
print("sofa" in lista_uno)
print("mesa" not in lista_uno)
lista_vacia = []
print("-----")
lista_sentido_inverso = ["primero", "segundo", "tercero",
"cuarto", "quinto"]
lista_sentido_inverso_extrae = lista_sentido_inverso[1:4]
print(lista_sentido_inverso_extrae)
lista_rango_indicado =
[1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18]
print(lista_rango_indicado[3:15])
print(lista_rango_indicado[3:15:2])
print(lista_rango_indicado[3:15:3])
print("-----")
#tuplas: lo mismo que un lista pero no puede modificarse
variable_diez = 10
tupla = 10,
print(variable_diez)
print(tupla)
print("-----")
#Diccionarios
diccionario_uno = {"animal": "gato", "cosa": "piedra",
"planta": "lechuga"}
print(diccionario_uno)
print(diccionario_uno["animal"])
print(diccionario_uno["planta"])
diccionario_uno["planta"] = "coliflor"
print(diccionario_uno["planta"])
diccionario_vacio = {}
print(diccionario_vacio)
print(diccionario_dos)
print("-----")
#Sets
cubiertos = {"tenedor", "cuchara", "cuchillo", "cucharita"}
vajilla = set(["plato","taza","copa"])
print(cubiertos)
print(vajilla)
print("-----")
#Mutable e Inmutable
var1 = "Hola"
var2 = var1
var3 = "Adios"
print(id(var1))
print(id(var2))
print(id(var3))
# en Python una variable es una referencia a un dato, es mas
rapido crear una referencia que copiar el contenido de la
variable
print("-----")
#Condicionales
mivar = 2
if mivar > 3:
print("la variable es mayor que tres")
print("No esta mal")
else:
print("La variable es tres")
print("Justo tres, ni mas ni menos")
print("-----")
#Ciclos
aa = 0
while aa < 8:
aa += 1
print(aa)
aaa = 0
while aaa < 8:
aaa += 1
if aaa == 4:
break
print(aaa)
aaaa = 0
while aaaa < 8:
aaaa += 1
if aaaa == 4:
continue
print(aaaa)
print("-----")
#Excepciones
dividendo = "A"
divisor = 2
try:
resultado_div = dividendo / divisor
except ZeroDivisionError:
if divisor == 0:
print("No se puede dividir por cero")
except TypeError:
print("Hay un error en el divisor")
else:
print("El resultado es: ", resultado_div)
print("-----")
#Funciones
def saludo_tres():
print(""""Hola Mundo
que bueno es saludar
y ser saludado
""")
saludo_tres()
def valorde_pi():
numero_pi = 3.14159
return numero_pi
pi = valorde_pi()
print(pi)
print(valorde_pi())
def saludo_cuatro():
return "Hola", "Mundo"
hola = saludo_cuatro()
print(hola)
def cuadrado(numero):
cuadrado = numero * numero
return cuadrado
resultado_dos = cuadrado(5)
print(resultado_dos)
saluda("Juan", "Hombre")
tabla_multiplicar("Nicolas", 1)
print(ambito_variable)
una_funcion()
una_funcion_2()
print(var4)
print("*****")
una_funcion_3()
print(var5)
#Generadores
def genera_lista(num):
lista = []
i = 1
while i <= num:
lista.append(i)
i += 1
return lista
for i in genera_lista(5):
print(i)
#Decorador
def decorador(funcion_entrada):
def funcion_salida():
funcion_entrada()
print("Esto no estaba en la funcion original")
return funcion_salida
@decorador
def saludo():
print("Hola")
saludo()
def decorador2(funcion_entrada):
def funcion_salida(param):
if param == "Laura":
print("Buenos Días, campeona")
elif param == "Nicolas":
print("Buenos Días, campeon")
else:
funcion_entrada(param)
print("Que tengas un buen dia")
return funcion_salida
@decorador2
def saludo2(nombre):
print("Hola " + nombre)
saludo2("Nicolas")
print("*****")
#funcion lambda
suma_lambda = lambda x, y : x + y
resultado_cuatro = suma_lambda(3, 9)
print(resultado_cuatro)
• Limpieza de Datos:
Eliminar datos incompletos, incorrectos o irrelevantes.
Aplicar técnicas de limpieza de datos para corregir errores y asegurar
la calidad de los datos.
• Análisis Exploratorio de Datos:
Realiza un análisis exploratorio para comprender mejor la naturaleza
de los datos combinados.
Identificar patrones, tendencias y posibles relaciones entre los datos.
• Visualización de Datos:
Utiliza visualizaciones como gráficos, tablas y diagramas para
representar los datos integrados de manera clara y comprensible.
Las visualizaciones ayudarán a identificar insights y patrones de
manera más efectiva.
datos1.csv:
id;clave_comun;nombre;apellido;edad
1;A001;Carlos;Gómez;25
2;A002;Marta;López;30
3;A003;Ana;Rodríguez;28
4;A004;Luis;Fernández;35
datos2.xlsx:
clave_comun,departamento,salario,tipo_contrato
A001,Ventas,30000,Tiempo completo
A002,Marketing,35000,Medio tiempo
A003,Operaciones,32000,Tiempo completo
A004,RRHH,40000,Tiempo completo
datos3.json:
[
{"clave_comun": "A001", "ubicacion": "Ciudad 1", "departamento":
"Zona Norte"},
{"clave_comun": "A002", "ubicacion": "Ciudad 2", "departamento":
"Zona Sur"},
{"clave_comun": "A003", "ubicacion": "Ciudad 3", "departamento":
"Zona Este"},
{"clave_comun": "A004", "ubicacion": "Ciudad 4", "departamento":
"Zona Oeste"}
]
datos4.txt:
clave_comun|ventas_anuales
A001|100000
A002|120000
A003|90000
A004|110000
En la consola:
import pandas as pd