PaellaDoc vs Superset: revisar diffs de agentes a escala o decidir con un gate de ejecución

Superset y PaellaDoc están en la misma capa. Las dos corren muchos agentes de código en worktrees de git aislados, las dos son agent-agnostic y las dos te dejan usar tu propia suscripción. La diferencia aparece cuando un agente dice que ha terminado. Superset te pone ese diff delante, rápido y a escala, y tú decides mirándolo. PaellaDoc decide ejecutando el código contra los criterios de aceptación que escribiste primero. Esa es toda la conversación, y vale la pena contarla con concreción.

Qué hace Superset

Superset, de Superset Inc., es una app de escritorio para Mac respaldada por YC que se presenta como el editor de código para agentes de IA. Corre muchos agentes en paralelo, desde diez hasta cien o más, cada uno en su propio worktree de git aislado, y funciona con Claude Code, Cursor, Codex, Copilot, Gemini y otros. Lo que hace bien es escala y revisión. Puedes lanzar muchos agentes a la vez, ver cómo aterriza su trabajo y revisar diffs rápido sin que se pisen entre ellos.

También es fuerte donde un editor de código debe serlo. Abre el trabajo de cualquier agente directamente en VS Code, Cursor, Xcode, JetBrains o una terminal. Gestiona una pared de terminales. Port forwarding. Cloud workspaces cuando quieres salir de tu máquina. Se descarga gratis en Mac y tiene planes premium encima. Está cuidado, escala los agentes de una forma que impresiona de verdad al verla, y su integración con el IDE es mejor que la de PaellaDoc. Eso lo digo de entrada.

Qué hace PaellaDoc

PaellaDoc corre la misma clase de flota, agentes en worktrees aislados en tu máquina, model-agnostic, con tu propia suscripción. La diferencia empieza en la palabra “hecho”.

PaellaDoc tiene un gate de ejecución. Antes de que el agente arranque, escribes los criterios de aceptación. Cuando el agente dice que ha terminado, PaellaDoc ejecuta el código contra esos criterios. Un build en verde no cuenta como hecho. El gate pasa porque el comportamiento está, o falla y te devuelve qué falló. No hace falta que estés delante para que esto se cumpla.

Alrededor de ese gate hay una capa de producto. Tu trabajo se convierte en artefactos .paella versionados, un PRD, épicas, historias de usuario, criterios de aceptación, comparables entre runs y dentro del equipo. Hay un modo No-coder que construye un producto entero a partir de una descripción en lenguaje llano, para alguien que no sabe leer un diff. Hay reverse intake que lee un repo existente y reconstruye su contexto de producto. Hay control por Telegram para arrancar trabajo, mirar un gate o aprobar un paso desde el móvil. Y hay un sala de control multi-repo, porque en la era de la IA tienes cien repos en tu máquina y necesitas un sitio único para abrirlos, organizarlos y etiquetarlos todos.

La diferencia clave: revisar a escala, o verificar

Diagrama que compara Superset (100+ agentes en paralelo, un editor para revisar sus diffs, mergeas lo que se ve bien) con PaellaDoc (un gate ejecuta el código contra tus criterios y el trabajo se vuelve artefactos .paella versionados).

Superset te hace más rápido en lo que ya haces, mirar diffs. Más agentes, más diffs, menos roce entre ellos, todo en una ventana. La decisión sigue en tus ojos. Es un trabajo real y Superset lo hace bien.

PaellaDoc saca la decisión de tus ojos. Los criterios se escriben primero, el gate ejecuta el código, y el veredicto sale de la ejecución, no de cómo se lee el diff. Esto importa porque un diff que parece correcto y un diff que es correcto no son el mismo diff, y a escala no los distingues leyendo más rápido. Revisar cincuenta diffs que parecen todos plausibles siguen siendo cincuenta juicios bajo presión de tiempo.

Aquí entra el benchmark. En 210 runs, la salida de un agente sin más pasaba el build pero estaba genuinamente mal el 40% de las veces. Incluso el modelo frontier más fuerte a máximo esfuerzo falló una tarea difícil dos de cada tres veces, y fallaba en runs distintos cada vez. Leer el diff no lo habría pillado, porque el build estaba en verde y el código tenía buena pinta. Esa es la trampa que revisar-a-escala comparte con cualquier herramienta que termina en el diff. Lo contamos aquí: un build en verde no es una feature correcta.

Código, o producto

Superset se llama a sí mismo el editor de código para agentes de IA, y el nombre es exacto. Opera a nivel de código, el diff, el worktree, la terminal, el IDE. PaellaDoc opera un nivel por encima, en el producto. Los artefactos .paella son el producto convertido en ciudadano de primera, y están construidos sobre un SDK abierto. La comunidad publica cuatro tipos de packs: method packs para la metodología, stack packs para tu stack técnico, design packs para theming y design tokens, validator packs para los propios gates. Ensamblas los packs que encajan con tu trabajo y versionan y se comparan como el código. La idea es hacer producto, no solo mover código por worktrees más deprisa.

PaellaDoc no reemplaza tu editor

Conviene dejarlo claro, porque Superset y PaellaDoc tocan los dos el tema del editor. Superset es un sitio de calidad IDE para correr y revisar agentes. PaellaDoc no intenta ser tu editor ni intenta reemplazar la superficie de revisión de Superset. Si lo que quieres es revisión de diffs a escala entre decenas de agentes, ese es el terreno de Superset y ahí es mejor. PaellaDoc añade el gate y la capa de producto encima de las corridas de agentes. Las dos apuestas no ocupan la misma casilla.

Qué compartimos

Bastante. Agentes en paralelo en worktrees de git aislados. Agent-agnostic, así que eliges el modelo. Local-first en un Mac con tu propia suscripción. Gratis para empezar. Y Superset va por delante en lo que cuesta tiempo y equipo construir: está más cuidado, hoy escala los agentes más lejos, su integración con el IDE es más profunda, y tiene el respaldo de YC detrás. PaellaDoc es temprano y lo construye un solo fundador. Son diferencias reales y caen del lado de Superset.

	Superset	PaellaDoc
Agentes en paralelo en worktrees aislados	Sí	Sí
Agent-agnostic (Claude Code, Codex, otros)	Sí	Sí
Local-first, con tu propia suscripción	Sí	Sí
Visualización y revisión de diffs a escala	Sí, decenas a 100+	Básico
Integración con el IDE (VS Code, Cursor, Xcode, JetBrains)	Sí, profunda	Limitada
Gate de ejecución (hecho = el código corre contra criterios)	No, revisión a ojo	Sí
Capa de producto (`.paella`: PRD, épicas, historias, criterios)	No	Sí
Packs de SDK abierto (method, stack, design, validator)	No	Sí
Modo No-coder (producto a partir de una descripción)	No	Sí
Reverse intake de un repo existente	No	Sí
Control remoto por Telegram	No	Sí
Madurez, acabado, escala, financiación	Por delante	Temprano, fundador solo

Para quién es cada una

Elige Superset si tu cuello de botella es revisar más trabajo de agentes, más rápido, y vives en un IDE. Si corres una pared de agentes, quieres abrir cualquiera de sus worktrees en tu editor con un clic, gestionar terminales y puertos, y revisar diffs deprisa, Superset está hecho justo para eso y es bueno.

Elige PaellaDoc si quieres que el “hecho” lo decida ejecutar el código y no leer el diff, y si quieres que el trabajo exista como producto, artefactos .paella versionados que tú y tu equipo podéis comparar, con packs que ensamblas desde un SDK abierto. También encaja si necesitas modo No-coder, reverse intake sobre un repo existente, o control desde el móvil.

PaellaDoc no es mejor que Superset. Hace un trabajo distinto. Superset te hace rápido revisando agentes a escala. PaellaDoc decide el hecho por ejecución y sube el trabajo a producto. Mira la lista completa en el hub de comparativas.