Leyes Mexicanas en Markdown
315 leyes federales mexicanas convertidas a Markdown estructurado y JSON, listas para IA
Resumen
mx-md convierte los PDFs oficiales de las 315 leyes federales mexicanas de la Cámara de Diputados a dos formatos complementarios: un JSON canónico (AST) con IDs estables y jerárquicos, y Markdown limpio generado desde ese JSON. El resultado son 37,939 artículos, 58,310 fracciones y 35,176 notas de reforma — todo estructurado y listo para agentes de IA, pipelines RAG, búsqueda semántica y APIs legales.
Problema Resuelto
Los PDFs oficiales de las leyes mexicanas son casi inutilizables programáticamente — llenos de encabezados repetidos, marcadores de página y sin estructura semántica. mx-md elimina todo eso y produce Markdown limpio y un AST JSON tipado con IDs estables.
Audiencia Objetivo
Ingenieros de IA construyendo agentes legales o sistemas RAG, desarrolladores de productos legal tech para el mercado mexicano, investigadores y abogados que necesitan legislación en formato legible por máquinas.
Tecnologías
- Python
- pdfplumber
- Tesseract OCR
- JSON Schema