Transformación Digital de ONG

Análisis de datos con Python y Pair Grid

Sebastian Murillo
3 min readJul 16, 2020

Recientemente tuve la oportunidad de realizar una propuesta de transformación digital a una ONG usando tecnologías no code y low code. Para llegar a dicha propuesta se realizó un análisis exhaustivo de los procesos que integraban la operación de la organización y como parte de ello se desarrollaron varios diagramas. Uno de los más importantes es un Pair Grid que compara todas las variables categóricas detrás de cada formato operativo que integra un proceso (lee más sobre el proyecto aquí).

Gracias a este diagrama fue posible discernir cuales procesos del universo disponible eran los más adecuados para transformar por medio de la digitalización y herramientas no code y low code. La comparativa de todas las variables permitió contestar preguntas sobre los procesos como: ¿cuáles procesos son prioritarios pero tienen un nivel bajo de implementación? ¿Cuáles procesos ven un uso periódico semanal pero tienen una experiencia de usuario baja?¿Cuáles procesos considerados de prioridad baja tienen un alto impacto en la operación?

A continuación el desglose de como fue realizado el diagrama usando Python en una Jupyter Notebook¹.

1. Instalar módulos y librerías.

Para empezar, hay que instalar los módulos que permitirán el extraer información del documento de Google Sheets en donde se encuentra almacenada. También hay que importar algunas de las librerías más usadas para trabajar con análisis de datos en Python. Pandas, Seaborn y Matplotlib serán usadas para el desarrollo de dataframes y visualizaciones.

Input:

2. Configurar API de Google Sheets y crear dataframe de Pandas.

El siguiente paso es configurar el acceso con tus credenciales de Google y definir el documento de Google Sheets de donde se quiere extraer la información.

Input:

Output:

3. Limpiar y formatear datos.

El siguiente código sirve para mantener sólo las columnas definidas como parte del script. El resto de las columnas quedan fuera del dataframe.

Input:

Output:

4. Agrupar datos.

Una vez realizada la selección de columnas, se realiza un grupo usando la variable Proceso. Esto permitirá realizar el análisis a nivel de procesos y no de cada uno de los formatos.

Input:

Output:

5. Generar Pair Grid.

Con la información estructurada para desarrollar el diagrama sólo resta configurar el diagrama agregando etiquetas, colores y leyendas.

Input:

Output:

El diagrama Pair Grid generado permitió la comparación de los formatos operativos de una ONG y facilitó al equipo de trabajo determinar cuáles procesos eran los mejores para transformar digitalmente y mejorar así el servicio. Usa diagramas Pair Grid para comparar múltiples variables y y sus valores de manera visual 👍.

¿Quieres leer más sobre el proyecto? Da click aquí.

¹ Los comentarios en el código están en inglés para mantener la convención*.

--

--

Sebastian Murillo

I work with companies in Innovation and No Code Tech (mostly). Home is Monterrey, MX.