Por qué tenemos modelo propio

La mayoría de productos que leen facturas mandan cada documento a OpenAI o a Anthropic. La factura de tu proveedor de pescado pasa por servidores en Estados Unidos, se loguea, y según el contrato de cada API, puede o no entrenar el siguiente modelo del proveedor.

Decidimos no jugar a eso.

diffu-0.4 es nuestro modelo de visión propio. Lo entrenamos durante 2025 con miles de facturas españolas reales etiquetadas a mano por nuestro equipo. Corre en GPUs dedicadas en Frankfurt, vía RunPod. Métricas actuales: 96,1% de precisión en facturas reales, latencia menor a 2 segundos por documento.

Cuando subes una factura a V10, esa imagen y los datos extraídos no salen de nuestra infraestructura europea. No hay paso intermedio por un proveedor de IA americano. No hay logueo de tus documentos en sistemas de terceros.

Cero fallback a proveedores externos. diffu es el único modelo que toca la imagen de tu factura. Si una factura es difícil de leer (escaneado horrible, formato raro), o falla la extracción o cae a revisión manual en el portal. Nunca se reenvía a OpenAI ni a Anthropic como rescate.

Lo que no entrena a nadie

Política contractual, no aspiracional:

  1. Tus facturas, mensajes y números no entrenan a diffu. Cada versión del modelo se entrena con un dataset cerrado, etiquetado por nosotros, completamente separado de los datos de producción. Si en el futuro queremos usar datos reales para entrenar diffu-0.5, te pediremos consentimiento explícito por separado, por cliente, por escrito.
  2. Tampoco entrenan a OpenAI ni a Anthropic. El asistente de WhatsApp y el portal usan Claude (de Anthropic) como motor de razonamiento, vía API empresa con no-training activado y zero data retention. Recibe solo los datos contables específicos que necesita para responder tu pregunta. Tus facturas escaneadas nunca llegan al LLM.
  3. Tampoco se usan internamente "para mejorar el producto". No hay un equipo en V10 leyendo tus facturas para sacar insights. Las consultas a tu base de datos las hace código, no personas, salvo soporte explícito que tú nos pides.

Solo lectura en lo que ya usas

V10 se conecta a tu POS, tu ERP y tu banco para sincronizar los datos. La regla de oro es leemos, no escribimos, salvo cuando tú apruebas explícitamente una acción.

Concretamente:

Cuando V10 sí escribe en tu sistema (por ejemplo, empujar el asiento del cierre del mes a Holded), lo hace con dedupe por (proveedor, número de factura, fecha) para evitar duplicados, porque las APIs de Holded y ContaSimple no tienen idempotencia del lado del servidor.

Aislamiento entre clientes

Cada cliente es un tenant aislado en la base de datos. Los datos de Mama Carmen no pueden ser vistos por Grupo Amida, ni siquiera por accidente de query.

Auditoría completa

Cada acción significativa queda registrada con timestamp y autor:

Si tu auditor o tu inspector te pregunta de dónde salió un asiento concreto, lo contestas con un click desde el portal.

Dónde viven tus datos

Toda tu información está en infraestructura europea. Ningún byte sale de la UE en ningún punto del flujo.

ComponenteProveedorRegión
Aplicación web + APIRailwayFrankfurt (DE)
Base de datos PostgreSQLRailwayFrankfurt (DE)
Modelo de visión (diffu)RunPodEuropa
Asistente conversacionalAnthropic (Claude API)EU residency · zero retention
WhatsApp Cloud APIMetaIrlanda (UE)
Email transaccionalResendUE
Backups (diarios, retención 30 días)RailwayFrankfurt (DE)

La lista de subprocesadores vive también en /privacidad y se actualiza cuando cambia. Cuando añadamos o quitemos uno, te avisamos por email a la persona de contacto técnico de tu tenant.

Cumplimiento RGPD

Lo que no hacemos

Lista clara, por escrito:

Lo que aún tenemos abierto

Cosas que todavía no tenemos pero queremos. Las listamos abiertamente para no venderte humo:

Si tu requisito de compliance pasa por alguno de estos puntos, dilo en la demo y vemos cómo encajamos en tu calendario. Si la respuesta es "no podemos esperar a que esté", también te lo decimos directamente.