9 agosto, 2022

REALIZAR JOINS ENTRE TABLAS UTILIZANDO CONSULTAS MERGE CON PANDAS EN PYTHON

Llevaba ya mucho tiempo sin publicar nada sobre Python. Lo cierto es que me centrado en Typescript durante los últimos meses y no tuve ocasión de seguir trabajando con Python (en Visual Studio Code).

Uno de los post que ya adelanté en su momento fue el de hacer «joins», similares a los de SQL con Pandas y volcar el resultado a Excel: REALIZAR CONSULTAS JOIN EN PYTHON CON PANDAS Y EXPORTAR A EXCEL

Hoy me he propuesto simular un ejercicio típico de plantillas de personal, el de generar las altas, las bajas y la plantilla estable entre ambas tablas.

Vamos a imaginar estas dos tablas,

Si hiciésemos un cruce con buscarv o con SQL podríamos diferenciar:

En color rojo las personas que han sido baja, en verde las personas que han sido altas y en color olivo las personas que se mantienen.

Para hacer esto en Python he optado por utilizar Pandas y las consultas Merge(). Lo que me permitirá realizar «Joins» entre las tablas para extraer los resultados.

El código que he programado es el siguiente:

from winreg import QueryValue
from numpy import where
import pandas as pd
import xlsxwriter
#Importamos las dos tablas
df1 = pd.read_excel(r"C:\Users\USUARIO\OneDrive\Documents-Segu\TABLAS\TABLAS.xlsx",sheet_name='Hoja1')
df2 = pd.read_excel(r"C:\Users\USUARIO\OneDrive\Documents-Segu\TABLAS\TABLAS.xlsx",sheet_name='Hoja2')
#combinamos tablas utilizando inner, left, right ...
df3= pd.merge(df1, df2.set_index('ID'), left_on=['ID'], right_index=True,  how='outer',indicator=True).query('_merge == "both"').drop('_merge', 1)
df4= pd.merge(df1, df2.set_index('ID'), left_on=['ID'], right_index=True,  how='outer',indicator=True).query('_merge == "left_only"').drop('_merge', 1)
df5= pd.merge(df1, df2.set_index('ID'), left_on=['ID'], right_index=True,  how='outer',indicator=True).query('_merge == "right_only"').drop('_merge', 1)
#Seleccionamos archivo para exportar y asignamos nombre a la hoja
writer=pd.ExcelWriter(r'C:\Users\USUARIO\OneDrive\Documents-Segu\TABLAS\RESULTADO.xlsx')
#Omitimos la columna del índice en los datos escritos en excel
df3.to_excel( writer,'AMBOS', index=False)
df4.to_excel( writer,'BAJAS', index=False)
df5.to_excel( writer,'ALTAS', index=False)
print(df3) 
print(df4)
print(df5)    
writer.save()

Siguiendo con la documentación de las consultas merge he utilizado el «How» en Outer con el indicador de la consulta en True para conocer si el resultado es both (si están en ambas tablas), si es left (si están en la tabla izquierda, por lo tanto son bajas) o si es right ( que están en la tabla de de la derecha, es decir, que son altas).

La salida de Python sería así:

y con xlsxwriter pasamos los datos a cada una de las hojas que previamente hemos renombrado como: AMBOS, BAJAS y ALTAS.

El resultado es el esperado:

Como podéis observar, hemos generado la información correctamente con Pandas y Python. Perfecto!!.

Nota: se puede obtener el mismo resultado utilizando otras consultas y también otros métodos o bibliotecas.

Espero que sea de utilidad!!.

¿Te ha resultado de interés?, puedes apoyar a Excel Signum con una pequeña donación.

Donate Button with Credit Cards

¡¡Muchas gracias!!

Mediante la suscripción al blog, la realización comentarios o el uso del formulario de contacto estás dando tu consentimiento expreso al tratamiento de los datos personales proporcionados según lo dispuesto en la ley vigente (LOPD). Tienes más información al respecto en esta página del blog: Política de Privacidad y Cookies

Comparte este post

Si te ha gustado o tienes alguna duda, puedes dejar aquí tu comentario.

Este sitio web utiliza cookies para que usted tenga la mejor experiencia de usuario. Si continúa navegando está dando su consentimiento para la aceptación de las mencionadas cookies y la aceptación de nuestra política de cookies, pinche el enlace para mayor información.plugin cookies

ACEPTAR
Aviso de cookies