Generador Automático de Reportes PDF 🚀 ManageYourData
ManageYourData es una herramienta diseñada para analizar datasets de manera automática y generar reportes detallados en formato PDF con métricas clave con la finalidad de facilitar la comprensión del mismo. También se permite la conversación con un asistente de IA capaz de contestar preguntas sobre el dataset mediante la interfaz gráfica de Streamlit.
Este proceso se realizará desde el mismo ordenador en el que se encuentre dicho fichero de datos y por lo tanto no se mandará ninguna información a terceros (exceptuando el uso opcional de la API de Google para la realización del análisis).
✅ Carga automática de datasets en formato CSV o EXCEL.
✅ Generación de reportes en PDF con estadísticas detalladas.
✅ Exportación a otros formatos como CSV o EXCEL.
✅ Chatbot inteligente mediante Ollama (local) o Google Gemini (cloud).
✅ Interfaz gráfica para facilitar todos los procesos.
✅ Paquete de Python como método alternativo mediante terminal.
Actualmente existen dos alternativas para poner en funcionamiento ManageYourData en su dispositivo:
Note
Visite manageyourdata.streamlit.app para visualizar la herramienta sin necesidad de instalación previa.
git clone https://github.com/MarkosHB/ManageYourData
cd ManageYourData
Caution
Desde este instante usted deberá tener instalado Python>=3.11 si desea seguir con este método.
Opcionalmente, puede crear un entorno virtual para el proceso de instalación.
python -m venv .venv
A continuación, deberá instalar las dependencias de la herramienta...
pip install -r requirements.txt
... y compilar la librería ManageYourData elaborada.
pip install .
Warning
El paquete de Python no ha sido publicado, por lo que debe ser descargado y compilado manualmente.
Finalmente, usted podrá elegir una de las siguientes opciones:
manageyourdata -f data/titanic.csv -r reports/titanic-report.pdf -e excel
streamlit run frontend.py
fastapi dev api.py
Caution
Desde este instante usted deberá tener instalado Docker si desea seguir con este método.
En primer lugar, deberá crear la imagen de la aplicación...
docker build -t manage_your_data .
... para después ejecutar un contenedor incluyéndola.
docker run --name ManageYourData -p 8501:8501 manage_your_data
Tip
Aunque sea una posibilidad puesto que se ha elaborado un paquete de Python, es recomendable haber seguido alguno de los métodos anteriores para evitar tener que escribir código al utilizar la herramienta. Usted puede acceder a las funciones de la siguiente manera:
from manageyourdata.data_manager import DataManager
dm = DataManager()
dm.load_data("data/titanic.csv")
dm.report_pdf("reports/titanic-report.pdf")
dm.export_data("exports/titanic-exported.xlsx")
📊 ManageYourData
├── 📁 data/ # Archivos de datos para analizar.
├── 📁 reports/ # Reportes generados en formato PDF.
├── 📁 exports/ # Ficheros de datos exportados a otros formatos.
├── 📁 images/ # Gráficos elaborados para incluir en el informe.
├── 📁 manageyourdata/ # Código fuente principal (Paquete de Python).
│ ├── 📝 main.py # Analizador lexicográfico interacción por consola.
│ ├── 📝 data_manager.py # Módulo con los métodos y funcionalidades.
│ ├── 📝 pdf_generator.py # Generador de reportes en PDF.
│ ├── 📝 metrics.py # Productor de información para el reporte.
│ ├── 📝 models.py # Generador de llms a partir de diferentes proveedores.
│ ├── 📁 utils/ # Archivos de apoyo (estilos, constantes, etc).
├── 📝 frontend.py # Interfaz gráfica en Streamlit.
└── 📝 Dockerfile # Contenedorizador de la aplicación.
...
Important
Se recomienda no modificar la estructura de carpetas para no interferir con el correcto funcionamiento del programa. No obstante, se anima al usuario a colocar y retirar los archivos de datos y generados que allí se encuentran.
- Python 🐍 (Lenguaje principal)
- Pandas (Análisis de datos)
- Langchain (Agentes de IA)
- FPDF (Generación de PDFs)
- Matplotlib (Visualización de datos)
- Streamlit (Interfaz gráfica)
- CarPrice, una colección de aspectos relacionados con el proceso de venta de automóviles.
- Titanic, con los detalles históricos del famoso transatlántico y su naufragio.
¡Las contribuciones son bienvenidas! Para mejorar el proyecto:
- Haga un fork del repositorio.
- Cree una rama nueva (
git checkout -b feature/nueva-funcionalidad
). - Realice los cambios y haga commit (
git commit -m "Agregada nueva funcionalidad"
). - Haga un pull request y se valorarán sus aportes.