Producto Lector de facturas Asesorías Tecnología Recursos Guía del IVA en hostelería Coste de empleado en hostelería Modelo 303 en hostelería Iniciar sesión Reservar demo
Modelos propios · Datos en infraestructura controlada · RGPD

Modelos propios para datos sensibles.

Construimos los modelos que leen tus facturas. Los entrenamos con datos españoles reales. Los desplegamos en GPU dedicada. Tus documentos no pasan por OpenAI ni Anthropic.

Modelo en producción

diffu-0.4 — el lector de facturas españolas.

Un modelo de visión fine-tuned para nuestro dominio: facturas, albaranes y nóminas en español, con sus particularidades fiscales (IVA, retenciones, modelo 303, etc.).

diffu-0.4 · vision · es-ES

96.1% de precisión sobre facturas reales.

Modelo de visión propio, entrenado con miles de facturas españolas anotadas a mano. Sirve los cinco puntos de entrada de OCR (web, WhatsApp, portal, agencia, bulk admin). Sin fallback a Claude o GPT.

Precisión

96.13%

Latencia p50

<2s

Arquitectura

Visión + lenguaje

Adaptador

Fine-tuned propio

Cómo lo construimos

Tres decisiones que definen el producto.

Por qué entrenamos en lugar de llamar a APIs. Por qué la infra es nuestra. Por qué el corpus es español.

Modelo propio, no API

Coste por documento predecible. Latencia controlada. No nos rompemos cuando OpenAI cae o cambia precios. Cada caso de error lo podemos diagnosticar en el modelo, no en una caja negra.

model: diffu-0.4 type: visión propio training: facturas ES anotadas

Despliegue dedicado

GPU dedicada en RunPod. Endpoint serverless con auto-scale. Versionado por adaptador: cambiar de diffu-0.2 a 0.3 es una variable de entorno, rollback es la inversa.

runtime: RunPod serverless endpoint: 5vpjqmayciwnvn swap: env var per version

Corpus español real

Datos anotados a mano de facturas reales: hostelería, distribución, retail. Particularidades fiscales que ningún modelo genérico ve: retenciones IRPF, IVA reducido, recargo de equivalencia.

data: facturas ES anotadas domain: contabilidad PYME labels: campos + PGC

Por qué importa

Una factura es información sensible.

Identifica al proveedor, el cliente, los importes, el régimen fiscal, las relaciones comerciales. Procesarla con un proveedor cloud genérico es enviar todo eso a un sistema que no controlas. Por eso la procesamos nosotros.

Sin entrenamiento con tus datos

Tus facturas no entran en ningún corpus de entrenamiento, propio o de terceros. Política contractual.

Auditoría completa

Cada paso del flujo (extracción, clasificación, exportación) queda registrado. Trazable hasta el documento original.

Cumplimiento RGPD

Contrato de tratamiento de datos firmable. Borrado a petición. Datos del cliente cifrados en tránsito y reposo.

Roadmap

Qué viene en los próximos meses.

Lo que ya está en producción, lo que estamos entrenando, y lo que tenemos planeado.

SHIPPED
diffu-0.4 — facturas EUR
Modelo de visión, 96.1% sobre facturas españolas, sirviendo los cinco puntos de OCR.
EN CURSO
diffu multicurrency
Eval set para facturas no-EUR antes de prometer paridad con OCR Loop. Bloqueador para clientes con operativa internacional.
EN CURSO
diffu albaranes (Agora)
Albaranes con marcas de stock y partidas. Eval inicial sobre el corpus de Grupo Amida (3,188 albaranes).
PLANEADO
drag-0.1 — clasificador PGC
Clasificador automático línea-a-línea al PGC español. Sustituye el desplegable manual de cuentas en el flujo de la asesoría.
PLANEADO
FacturaE / VeriFactu
Ingesta de FacturaE como formato adicional, sin construir VeriFactu/SII core (no somos software de facturación).
PLANEADO
SAP Business One
Adaptador push para SAP B1. En la lista por demanda directa de SMBs en el pipeline.

Reserva una demo técnica.

Te enseñamos el modelo procesando tus facturas, los benchmarks vs cloud OCR, y el flujo end-to-end. Sin compromiso.