impuestosde.com

Metodología de datos

Principio general: sin estimaciones

Todo dato publicado en impuestosde.com procede de una fuente oficial primaria verificable. La regla más importante de este proyecto es la línea roja sobre estimaciones: ninguna cifra se interpola, se estima por analogía, se infiere de prensa o se toma de agregadores secundarios. Si un dato no existe en una fuente oficial o no se ha podido verificar, se publica como nulo (sin dato) o directamente no se publica.

Pipeline de ingesta de datos

Los datos se incorporan mediante pipelines Python que descargan los archivos originales, los normalizan a JSON validado y los cargan en la base de datos mediante operaciones de upsert idempotentes. El proceso tiene tres etapas:

  1. Descarga: se obtiene el archivo original de la fuente (CSV, XLSX, PDF, SDMX JSON) y se guarda en data/raw/ con la fecha de descarga.
  2. Normalización: el script de ingesta extrae los campos relevantes y los convierte a JSON normalizado en data/staging/. Cada registro lleva la referencia normativa que lo acredita.
  3. Carga: el orquestador load_db.py lee el staging y hace upsert en la base de datos Turso. La carga es idempotente: ejecutarla dos veces deja la base en el mismo estado.

Modelo de vigencias temporales

Los tipos tributarios no son valores puntuales sino períodos de vigencia. Cada registro de tipo lleva dos campos clave:

Ejemplo: el IVA general subió del 18% al 21% el 1 de septiembre de 2012. Hay dos registros para 2012: uno con vigencia desde 2010-07-01 hasta 2012-08-31 (18%), y otro con vigencia desde 2012-09-01 (21%).

Normas de referencia

Cada tipo lleva asociada la norma jurídica que lo introduce: identificador BOE (formato BOE-A-YYYY-NNNNN), identificador de boletín autonómico o referencia de la fuente estadística. Esto permite a cualquier usuario verificar la cifra directamente en el BOE o el organismo correspondiente.

Categorización de fuentes

Se clasifican en tres tiers:

No se usa ninguna fuente de nivel inferior: nada de Wikipedia, Statista, DatosMacro, Newtral ni medios de comunicación.

Criterios de cobertura

El objetivo es cobrir todos los tributos estatales (IRPF, IS, IVA, IIEE, cotizaciones SS) con series históricas desde su creación y todos los tributos cedidos autonómicos (ISD, ITP, AJD, Patrimonio, IRPF autonómico) para los ejercicios 2022-2025 y en expansión histórica. Los tributos locales (IBI, IIVTNU, IAE) requieren acceso a más de 500 ordenanzas municipales y se incorporan progresivamente.

Unidades de medida

Catálogo de fuentes · Cobertura · Registro de cambios