Cosa è Caveman
Cosa è Caveman: la skill di Claude Code che taglia il 75% dei token
Indice dei contenuti – Cosa è Caveman
- Il problema: i token costano (e tanto)
- Cosa è Caveman?
- Come funziona: meno parole, stessa tecnica
- Installazione e utilizzo pratico
- I livelli di intensità
- Funzionalità avanzate: commit, review e compress
- I benchmark reali
- Best practice: pro e contro di Caveman
- Conclusioni e formazione continua
1. Il problema: i token costano (e tanto)
Se lavori quotidianamente con Claude Code, Cursor, Copilot o uno qualsiasi degli agenti AI di nuova generazione, avrai notato una cosa: le risposte sono spesso lunghe. Molto lunghe. E nel mondo degli LLM, lunghezza equivale a costo.
Ogni parola che il modello genera corrisponde a uno o più token. Ogni token ha un prezzo. Su API Anthropic, ad esempio, Claude Sonnet costa 3$/milione di token in input e 15$/milione in output. Moltiplica questo per sessioni intensive di sviluppo e il conto sale in fretta. Anche chi usa piani in abbonamento (“Max” o “Pro”) si scontra con i limiti orari di utilizzo.
Ma c’è un altro costo spesso sottovalutato: il tempo. Attendere una risposta prolissa di 200 parole quando ne basterebbero 30 è una perdita di focus e produttività. È qui che entra in gioco Caveman.
2. Cosa è Caveman?
Caveman è una skill open source per Claude Code — e non solo — creata da Julius Brussee e disponibile su GitHub con oltre 44.000 stelle. Il concept è tanto semplice quanto geniale: insegnare all’agente AI a rispondere come un uomo delle caverne, cioè usando il minimo indispensabile di parole, ma senza perdere nemmeno un grammo di accuratezza tecnica.
Il claim del progetto lo dice in modo impagabile: “why use many token when few do trick”.
In pratica, Caveman istruisce il modello a eliminare articoli, avverbi ridondanti, frasi di cortesia, preamboli e tutto il “fluff” linguistico che non porta informazione tecnica. Il codice rimane intatto, i termini tecnici rimangono precisi, ma il contorno verbale cade.
Il risultato? Fino al 75% di token in output risparmiati, con uno speed-up percepito di circa 3x nelle risposte. La skill è installabile su Claude Code, Cursor, Windsurf, Cline, GitHub Copilot, Gemini CLI e oltre 40 altri agenti.
3. Come funziona: meno parole, stessa tecnica
Caveman non “semplifica” le risposte: le comprime. La differenza è fondamentale. Vediamo un esempio pratico con un bug React:
Risposta normale di Claude (69 token):
“The reason your React component is re-rendering is likely because you’re
creating a new object reference on each render cycle. When you pass an inline
object as a prop, React’s shallow comparison sees it as a different object
every time, which triggers a re-render. I’d recommend using useMemo to
memoize the object.”
Risposta con Caveman attivo (19 token):
“New object ref each render. Inline object prop = new ref = re-render.
Wrap in `useMemo`.”
Stesso fix. Stessa soluzione. 75% di token in meno. Un paper pubblicato a marzo 2026, “Brevity Constraints Reverse Performance Hierarchies in Language Models” (arXiv), ha persino dimostrato che costringere i grandi modelli a risposte brevi ha migliorato l’accuratezza del 26% su certi benchmark. La verbosità non è sinonimo di qualità.
4. Installazione e utilizzo pratico
L’installazione è una riga. Per Claude Code:
claude plugin marketplace add JuliusBrussee/caveman
claude plugin install caveman@caveman
Per tutti gli altri agenti supportati (Cursor, Windsurf, Cline, Copilot, ecc.):
npx skills add JuliusBrussee/caveman
# oppure specificando l’agente:
npx skills add JuliusBrussee/caveman -a cursor
npx skills add JuliusBrussee/caveman -a github-copilot
Una volta installato, l’attivazione avviene con comandi naturali:
- “/caveman” o “talk like caveman” — attiva la modalità
- “less tokens please” o “be brief” — trigger automatici
- “stop caveman” o “normal mode” — torna alla modalità normale
Su Claude Code, Caveman si auto-attiva a inizio sessione grazie ai hook SessionStart. Non devi ricordartelo ogni volta: è sempre lì, pronto.
Se vuoi che sia sempre attivo su qualsiasi agente, basta aggiungere questo snippet al system prompt o al file di regole del tuo agente:
Terse like caveman. Technical substance exact. Only fluff die.
Drop: articles, filler (just/really/basically), pleasantries, hedging.
Fragments OK. Short synonyms. Code unchanged.
Pattern: [thing] [action] [reason]. [next step].
ACTIVE EVERY RESPONSE. No revert after many turns.
5. I livelli di intensità
Caveman non è una modalità binaria on/off. Offre sei livelli graduati, da usare a seconda del contesto:
- Lite (/caveman lite) — rimuove solo hedge e filler, mantiene la grammatica. Ottimo per contesti professionali o code review formali.
- Full (/caveman full) — default. Elimina articoli, usa frammenti. Il vero “caveman speak”.
- Ultra (/caveman ultra) — massima compressione telegrafica. Abbrevia tutto il possibile.
- Wenyan-Lite, Wenyan-Full, Wenyan-Ultra — modalità in cinese classico letterario (文言文), il linguaggio scritto più compresso della storia umana. Curioso e molto efficiente.
Il livello rimane attivo fino a cambio esplicito o fine sessione. Ecco un confronto sullo stesso output:
- Lite: “Your component re-renders because you create a new object reference each render. Wrap it in `useMemo`.”
- Full: “New object ref each render. Inline prop = re-render. `useMemo`.”
- Ultra: “Inline obj prop → new ref → re-render. `useMemo`.”
- Wenyan: “物出新參照,致重繪。useMemo Wrap之。”
6. Funzionalità avanzate: commit, review e compress
Caveman non si ferma alla compressione delle risposte. L’ecosistema include tre tool aggiuntivi molto utili nel flusso di lavoro quotidiano dello sviluppatore:
caveman-commit
Genera messaggi di commit corti e precisi seguendo il formato Conventional Commits, con soggetto di massimo 50 caratteri. Perché perdere tempo a formulare “feat(auth): add token expiry validation via middleware” quando il modello lo fa in un secondo?
/caveman-commit
# Output: feat(auth): fix token expiry check use <= not <
caveman-review
Genera review one-liner per PR e code review. Il formato è chirurgico:
/caveman-review
# Output: L42: bug: user null. Add guard.
caveman-compress
Questa è la funzionalità più sofisticata. Caveman agisce sugli output token, ma il tuo file CLAUDE.md viene caricato ad ogni sessione come input. Se è verboso, brucia token prima ancora che tu abbia scritto una parola.
caveman-compress riscrive file come CLAUDE.md in stile caveman-speak, mantenendo una copia leggibile .original.md per te. I risultati sui benchmark interni mostrano un risparmio medio del 46% di token in input per ogni sessione.
/caveman:compress CLAUDE.md
# Genera: CLAUDE.md (compresso) + CLAUDE.original.md (backup leggibile)
Codice, URL, path di file, comandi e intestazioni passano completamente intatti. Solo la prosa viene compressa.
7. I benchmark reali
Ecco i dati reali misurati via API Claude (riproducibili con il codice nel repo):
- Spiegazione bug React re-render: da 1.180 a 159 token (-87%)
- Fix auth middleware token expiry: da 704 a 121 token (-83%)
- Setup PostgreSQL connection pool: da 2.347 a 380 token (-84%)
- Docker multi-stage build: da 1.042 a 290 token (-72%)
- Implement React error boundary: da 3.454 a 456 token (-87%)
- Media complessiva: da 1.214 a 294 token (-65%)
Il range va dal 22% all’87% di risparmio a seconda del tipo di task. I compiti che generano più testo esplicativo (debug, architettura) beneficiano di più; i task già concisi per natura (refactoring breve) di meno.
Nota importante: Caveman agisce solo sugli output token. I reasoning/thinking token non vengono toccati. Il modello “pensa” tanto quanto prima, ma “parla” molto meno.
8. Best practice: pro e contro di Caveman
PRO
- Risparmio immediato e misurabile: installazione in un comando, riduzione dei costi API documentata e riproducibile.
- Nessuna perdita di accuratezza tecnica: il codice nei blocchi è intatto, i termini tecnici esatti. La compressione riguarda solo la prosa.
- Scalabilità dei livelli: puoi scegliere l’intensità in base al contesto. Lite per i colleghi, Ultra per sessioni in solitaria.
- Multi-agente: funziona con Claude Code, Cursor, Windsurf, Cline, Copilot, Gemini CLI e oltre 40 agenti. Non sei vincolato a un vendor.
- Funzionalità dell’ecosistema: caveman-commit e caveman-review velocizzano i workflow Git. caveman-compress riduce anche i token in input.
- Safety integrata: la modalità caveman si disattiva automaticamente su avvisi di sicurezza e operazioni distruttive, dove la chiarezza ha la priorità.
CONTRO
- Non adatto a output destinati a terzi: se stai generando documentazione per clienti o comunicati ufficiali, la sintassi telegrafica di Caveman non è appropriata. Usalo nelle sessioni di sviluppo interno.
- Modalità Wenyan richiede conoscenza: il cinese classico è massimamente compresso ma illeggibile se non conosci la lingua. Sconsigliato in team internazionali misti.
- Non comprime i reasoning token: il costo del “pensiero” del modello resta invariato. Se il grosso della spesa viene da extended thinking, Caveman da solo non risolve il problema.
- Auto-attivazione variabile per agente: su Claude Code funziona out-of-the-box con hook SessionStart. Su Cursor, Windsurf e altri va configurato manualmente il system prompt per l’attivazione automatica.
- Curve di lettura iniziale: le prime sessioni in Full o Ultra mode possono sembrare “brutali”. È normale: il cervello si adatta in pochi minuti.
Consiglio pratico: usa Caveman Lite come default di team per mantenere la leggibilità, e Full/Ultra per sessioni personali di debug intensivo dove velocità e risparmio contano più della forma.
9. Conclusioni e formazione continua
Caveman è un esempio perfetto di come l’ecosistema degli strumenti AI per sviluppatori stia maturando a velocità sorprendente. Non si tratta solo di usare Claude Code o qualsiasi altro agente AI: si tratta di saperlo usare bene, in modo efficiente, con gli strumenti giusti.
Il mercato del software e dell’intelligenza artificiale è in continua e rapidissima evoluzione. Nuovi modelli, nuovi agenti, nuove skill, nuovi paradigmi di costo emergono ogni settimana. In questo contesto, l’unico modo per mantenere un team di sviluppo competitivo è la formazione continua e strutturata. Non basta “imparare sul campo”: serve una guida che aiuti a navigare l’ecosistema con metodo.
Per questo, se sei un responsabile tecnico, un CTO o un team lead, ti consigliamo di dare un’occhiata al
Corso Claude Code per Sviluppatori, disponibile su innovaformazione.net. È un percorso formativo pensato specificamente per aziende che vogliono portare i propri team di sviluppo a padroneggiare Claude Code, le sue skill, le best practice di ottimizzazione token e i workflow AI-assisted moderni. Include moduli pratici, esempi reali e si aggiorna costantemente al ritmo del mercato.
La formazione è un investimento, non un costo. E c’è una buona notizia: le aziende possono accedere a Fondimpresa per la formazione finanziata dei propri dipendenti, abbattendo significativamente i costi di accesso ai percorsi formativi. Chiedici come.
Per informazioni, preventivi personalizzati e per scoprire come attivare la formazione finanziata per il tuo team, contattaci:
- Email: info@innovaformazione.net
- Telefono: TEL. 3471012275 — Dario Carrassi
- Sito: innovaformazione.net
Richiedi subito informazioni e un preventivo senza impegno. Il tuo team ti ringrazierà.
Per altri articoli tecnici di settore consigliamo invece di navigare sul nostro blog QUI.
Vuoi essere ricontattato? Lasciaci il tuo numero telefonico e la tua email, ti richiameremo nelle 24h:
Articoli correlati
Oracle Cloud Infrastructure
Guida per diventare AI Engineer
Confronto Clickhouse con altri database
Guida Mirage per sviluppatori
Guida OpenCode 2026
