caveman: el truco para que la IA se calle y vaya al grano

1. La cortesía de la IA es un impuesto que pagas cada día

Programas a cuatro manos con la IA, decenas de rondas al día. ¿Qué es lo que más te saca de quicio?

No es que no sepa de lo técnico. Es que antes de cada respuesta te suelta tres líneas de cortesía:

¡Por supuesto! Encantado de ayudarte. El problema que describes probablemente se deba a…

Lo único que sirve es la última frase. Todo lo demás es relleno antes de llegar a ella.

Y ese relleno no solo te cansa la vista. Quema tokens de verdad, ralentiza la respuesta y te va llenando la ventana de contexto poco a poco — cuanto más larga es la conversación, más caro te sale ese «impuesto de cortesía». Un impuesto que, por cierto, nunca pediste pagar.

Lo que hace caveman se resume en una frase: hacer que la IA hable como un cavernícola inteligente. Ni una coma menos de contenido técnico; fuera la cortesía, los preámbulos y esas frases tibias que se cubren las espaldas sin decir nada.

Es la skill más pequeña de toda la colección de Matt Pocock — el archivo entero son 50 líneas. Pero la instalas, la usas una vez y lo más probable es que ya no quieras volver atrás.

2. No hay magia: solo un pacto de «cállate y ve al grano»

Quizá te imagines algún mecanismo enrevesado detrás. No lo hay. El SKILL.md completo de caveman es un pacto sobre cómo te responde la IA, y se sostiene sobre tres pilares:

Qué recorta. Las muletillas sin información (en realidad, básicamente, dicho de forma sencilla), las fórmulas de cortesía (por supuesto, encantado de ayudarte) y esas frases que se andan con rodeos para no comprometerse. Si una palabra basta, no uses una frase. La relación causa-efecto va directa con una flecha: X -> Y.

Pero hay una línea roja, y te la marca en negrita:

Los términos técnicos se respetan, los bloques de código van tal cual, los mensajes de error no se tocan ni una letra.

Dicho de otro modo: recorta la paja, no la información. Esto no tiene nada que ver con soltarle un «sé más breve» — porque eso último tira a la basura los detalles útiles junto con todo lo demás, y caveman no.

Una vez encendido, sigue encendido (en la skill se llama Persistence). No es que a las pocas rondas se vaya relajando y vuelva poco a poco a la verborrea. Mientras no le digas que pare, sigue hablando así.

Cuando la cosa se pone seria, vuelve solo al modo normal (la excepción Auto-Clarity de la skill). Ante un borrado de base de datos, una operación irreversible o algo que necesita varios pasos para explicarse bien, recupera temporalmente la expresión completa, lo deja claro, y luego vuelve al modo cavernícola.

Este tercer pilar es justo lo que hace a caveman más listo que un simple «sé escueto»: ahorra tokens, pero no se hace el vago donde sí hace falta extenderse. Fíjate en el detalle — ese sentido de la medida está diseñado a propósito.

3. Tres pasos y ves la diferencia al instante

Hablar es fácil. Instálalo y mira tú mismo el antes y el después.

Instala. Es una de las skills de mattpocock/skills. Se instala con el comando oficial de una línea; sigue las indicaciones y marca caveman:

npx skills@latest add mattpocock/skills

(Si ya tienes el repositorio clonado en local, también puedes copiar ese directorio directamente a .claude/skills/ de tu proyecto.)

Enciende. Dile a Claude Code caveman mode, o escribe /caveman. Cuando ya no lo quieras, di normal mode.

Compara. Hazle la misma pregunta — por ejemplo: «¿por qué mi componente de React se vuelve a renderizar cada vez que se renderiza el padre?»

Normalmente te suelta tres o cuatro párrafos: el comportamiento por defecto, React.memo, useMemo/useCallback, los children, y de remate el sermón de no optimizar antes de tiempo. En modo caveman, queda así (esto es una ejecución real, no me lo invento):

Comportamiento por defecto. Render del padre -> render del hijo, da igual si las props cambiaron o no.

Cómo cortar el re-render:

React.memo(hijo) -> compara props en superficie, si no cambian se salta el render

Objetos/arrays/funciones que pasas al hijo: envuélvelos en useMemo / useCallback, si no cada render crea una referencia nueva -> memo deja de servir

Baja el estado, para que el padre no se renderice por un cambio de state que no le incumbe

Para diagnosticar: instala React DevTools Profiler, mira quién se renderiza y por qué.

React.memo, comparación superficial, referencias estables, bajar el estado, Profiler — no falta ni un solo punto de información. Pero lo lees de una pasada.

Ese es el primer resultado real. No hace falta que te lo venda: córrelo una vez y te lo crees solo.

4. Te eché las cuentas: en español ahorras un 70%, pero depende del idioma

La descripción original de caveman afirma que «ahorra alrededor del 75% de los tokens».

Pero ese es un número que da el propio autor, sin enseñar el método. Esa clase de afirmaciones uno se las toma con pinzas — que otro diga cuánto ahorra no cuenta; hay que medirlo uno mismo.

Así que lo medí, y lo probé en tres idiomas. Elegí 6 preguntas que cualquier dev hace a diario (re-render en React, pool de conexiones, fugas de memoria en Node, async/await, deshacer un commit en git, JWT vs session), le pedí a la IA que respondiera cada una en modo normal y en modo caveman, y conté caracteres. Como referencia usé respuestas reales, sin verborrea forzada — nada de un hombre de paja inflado a propósito para que el número quede bonito.

El resultado:

Idioma (normal vs caveman, cada uno con su par)	Reducción de caracteres
Español	~70%
Inglés	~63%
Japonés	~52%

Un setenta, un sesenta, un cincuenta por ciento — todos son recortes considerables, y sin perder ni un dato. Pero ya lo ves venir: la reducción cambia bastante según el idioma. El español arrastra mucha cortesía y muchas muletillas, así que hay mucha agua que escurrir; el japonés, incluso en modo normal, ya es relativamente compacto, así que a caveman le queda menos margen. Por eso «ahorra un 75%» no sirve como eslogan universal — depende del idioma en que hables.

Pongo el método sobre la mesa, sin fingir rigor: usé el conteo de caracteres sin espacios como aproximación, no el número exacto de tokens (el entorno de prueba no tenía tokenizer instalado). Dentro de un mismo idioma, la proporción de caracteres equivale más o menos a la de tokens, así que la reducción intra-idioma es fiable; pero los caracteres absolutos no se comparan entre idiomas, así que lo que comparo es la reducción propia de cada uno. La muestra son solo 6 preguntas, lo justo para darte un orden de magnitud.

Y de paso, una sorpresa que salió de la medición: caveman tiende por defecto a derivar al inglés telegráfico — la skill se diseñó pensando en inglés, así que le preguntas en español y a menudo te responde en un inglés minimalista. Esto, para nosotros, no es un detalle menor: el inglés telegráfico es legible para casi cualquier dev, pero deja de ser tu idioma y el del proyecto, y eso rompe cualquier respuesta que vayas a pegar en un comentario, un ticket o documentación en español. Si quieres que conteste en español, tienes que decírselo explícitamente al encenderlo: «responde en español». (En mi primera medición no lo sujeté, y los números se contaminaron con ese salto de «español -> inglés»; al fijar el idioma y repetir, salió la tabla de arriba, ya limpia.)

5. Pero no lo dejes encendido todo el día — tiene su carácter

caveman es comodísimo, pero no es un interruptor de «lo enciendo y me olvido». Un par de cosas que conviene tener claras de entrada:

Deriva al inglés (ya lo vimos arriba). El idioma que quieras, lo pides explícitamente al encender. Para quien trabaja en español, este punto pesa más de lo que parece: si no lo sujetas, acabas con la mitad de las respuestas en inglés sin haberlo pedido.
Frases cortadas, poco margen de error. Recorta conectores, tira de frases breves y entrecortadas; la densidad de información es altísima, pero te despistas un segundo y lees mal. Así que: lo que vayas a enseñar a otra persona, la documentación formal que vas a publicar, los razonamientos largos de varios pasos — ahí no enciendas caveman. En esos casos, «que se entienda» importa muchísimo más que «ahorrar tokens». (Por suerte Auto-Clarity recupera la expresión completa en escenarios peligrosos o de varios pasos, pero tenlo claro: caveman es para tu conversación a toda velocidad con la IA, no para cuando la IA escribe algo que va a leer otra persona.)
Es un estilo, no una capacidad. caveman no hace ni una tarea más por ti; solo cambia la forma en que la IA te habla. Tómalo como un «modo ahorro de datos» siempre activo y ya está — no esperes que te resuelva ningún flujo de trabajo.

En una frase: enciéndelo para conversar, apágalo cuando toque producir algo en serio. Le coges el punto a esa medida y se queda como una buena herramienta para siempre.

6. Chuleta

Instalar:  npx skills@latest add mattpocock/skills      # marca caveman en las indicaciones
Encender:  dile a la IA "caveman mode"  o  /caveman
Apagar:    "normal mode" / "stop caveman"
Idioma:    pídelo explícito al encender ("responde en español"), si no deriva al inglés

Recorta:   muletillas sin info (en realidad/básicamente), cortesía (encantado de ayudarte), rodeos
Conserva:  términos técnicos, bloques de código, errores literales — sin tocar una letra
Causa:     con flecha  X -> Y
Excepción: operación peligrosa / varios pasos -> recupera la expresión completa (Auto-Clarity)
Evítalo:   documentación formal / tutoriales / lo que lee otra persona -> apágalo
Medido:    español ~70%, inglés ~63%, japonés ~52% (el autor declara ~75%)

7. Para seguir

El código fuente de esta skill: mattpocock/skills · caveman (licencia MIT).
¿Te gusta esto de «un prompt y cambias el comportamiento de la IA»? En ese repositorio de Matt hay un montón más, y esta serie los irá desmenuzando uno a uno.
Si quieres comentar estas skills con el propio Matt y con decenas de miles de devs, su newsletter es un buen sitio para empezar.

Este artículo es contenido educativo original de usesuperpowers.com; la skill caveman que explica proviene de mattpocock/skills (source_commit: 2bf7005), bajo su licencia MIT. Las reglas originales citadas son propiedad de su autor; nuestro análisis, nuestras mediciones y nuestro texto son originales.