Non è quel Token delle criptovalute, ma è il token nell'AI—ogni parola, ogni risposta emessa dal grande modello è composta da un insieme di token.
Jensen Huang di NVIDIA ha dichiarato direttamente alla conferenza GTC 2026: “I token sono la nuova materia prima!”
I data center sono ora fabbriche di token: inserisci energia + dati, ottieni token, guadagni!
Ha anche fornito una formula semplice:
Entrate = numero di token per watt × capacità disponibile in gigawatt
Significa che: con un limite massimo di energia fissato, chi riesce a generare più token per ogni kWh, guadagna di più. Anche l'hardware più potente non può sfuggire alle leggi fisiche—una fabbrica da 1 gigawatt non diventerà mai una da 2 gigawatt.
Il direttore della National Data Bureau della Cina, Liu Liehong, ha anche dichiarato pochi giorni fa: a marzo di quest'anno, il volume medio di chiamate ai token in Cina ha già superato i 140 trilioni!
Rispetto ai 100 miliardi di inizio 2024, è cresciuto di oltre 1000 volte; rispetto ai 100 trilioni di fine 2025, in tre mesi è aumentato di oltre il 40%.
Questa cosa non è più fantascienza, sta diventando una vera e propria nuova catena industriale.
Cos'è esattamente l'economia dei token?
In breve: l'unità minima di informazione elaborata dai grandi modelli AI è il token.
Se chiedi a un AI una domanda, prima divide le tue parole in un sacco di token, poi le riassembla in una frase per restituirtele.
Ogni volta che si genera un token, bisogna consumare potenza di calcolo GPU, bruciare elettricità.
Quindi i token sono naturalmente un'unità di misura — proprio come il "grado" dell'elettricità o il "barile" del petrolio.
In passato, i token erano solo un costo, tutti si confrontavano su parametri e dati di addestramento.
Ora l'AI è nell'era dell'inferenza, ogni volta che un utente parla, ogni volta che un agente esegue un compito, sta bruciando token.
Le aziende AI addebitano in base ai token, più ne consumano, più vendono, i token passano da "costo" a merce che può essere prodotta in massa, prezzata e scambiata.
Il CEO di OpenAI, Sam Altman, ha anche detto: il nostro (e di tutti i fornitori di modelli AI) business è fondamentalmente vendere token.
Il vecchio Huang chiama il data center "fabbrica di token", le materie prime sono dati ed elettricità, il prodotto è il token. L'indicatore chiave è Tokens per Watt (numero di token per watt) — chi ha l'efficienza più alta, ha il costo più basso, vince.
"Fabbrica di token" scomposizione della catena industriale (quattro fasi, facilissimo da capire)
Una fabbrica di token è simile a una fabbrica tradizionale, suddivisa in queste sezioni:
1. Fase di produzione (la più costosa, la prima a beneficiare)
Chip AI & server (NVIDIA, Huawei, Haiguang, ecc.)
Centro dati AIDC (intelligenza artificiale)
Raffreddamento a liquido, sistema di alimentazione (attrezzature elettriche, energia verde)
A determinare il limite di capacità della fabbrica sono hardware ed elettricità. Con la stessa unità di elettricità, chi riesce a produrre più token ha un costo inferiore.
2. Fase di ottimizzazione (aumento della produzione senza aggiungere hardware)
Algoritmi di ottimizzazione dell'inferenza, sistemi di programmazione
Moduli ottici, rete, ecc.
Il vecchio Huang fa un esempio: Fireworks AI e Lynn, due aziende, non hanno cambiato hardware, hanno solo aggiornato il software stack di NVIDIA, la velocità di generazione dei token è passata da 700 al secondo a quasi 5000, un aumento di 7 volte!
Se l'algoritmo è potente, può far guadagnare molto di più a fabbriche a potenza fissa.
3. Fase di circolazione (consegna rapida dei token agli utenti)
CDN (rete di distribuzione dei contenuti) — distribuzione dell'ultimo miglio
Rete privata transfrontaliera, cavi sottomarini — logistica internazionale
La produzione e la consegna dei token avvengono quasi simultaneamente, con latenze molto basse.
Il costo di inferenza dei modelli domestici è solo 1/6-1/10 di quello estero, grazie all'API si sta esportando massivamente "token" e trasformando la potenza di calcolo e l'elettricità della Cina in "esportazione digitale".
4. Fase di applicazione (il luogo della monetizzazione finale)
Fornitori di grandi modelli (OpenAI, ByteDance, Alibaba, ecc.)
Applicazioni di Agent (agenti intelligenti)
SaaS di settore verticale, piattaforme di generazione multimodale
In futuro, ogni SaaS diventerà un Agent-as-a-Service (agente come servizio).
Gli ingegneri avranno un budget annuale di token, più ne usano, più diventano bravi.
Gli scenari di consumo si espandono dalla chat all'analisi finanziaria, generazione di contenuti, decisioni automatizzate... più è intenso il consumo, più l'upstream deve espandere la produzione, creando un volano positivo.
Dal punto di vista degli investimenti, chi sarà il primo a mangiare carne?
Le istituzioni ora guardano con favore le infrastrutture di calcolo (fase di produzione): chip AI, centri dati, raffreddamento a liquido, alimentazione, energia verde.
Si dice che il consumo di token di ByteDance raddoppi ogni tre mesi, e quando i grandi fornitori di cloud nazionali raggiungono un consumo giornaliero di 30-60 trilioni, inizieranno a sentire la mancanza di potenza di calcolo.
Si prevede che nel 2026 la catena di fornitura della potenza di calcolo entrerà in un ciclo di "inflazione dell'intera catena", con la prosperità che si diffonde dai chip all'AIDC, ai servizi cloud e alle attrezzature elettriche.
L'esportazione di token + il noleggio di potenza di calcolo è anche una direzione molto popolare, con evidenti vantaggi nei costi elettrici e algoritmici della Cina.
I rapporti di ricerca riassumono la logica degli aumenti di prezzo come: esplosione della domanda estera → carenza di hardware di stoccaggio e calcolo → colli di bottiglia energetici/infrastrutturali → rivalutazione dei costi dell'intera catena.
Le priorità sono grosso modo suddivise per fasi:
Breve termine: stoccaggio, memoria video (massima elasticità nella disuguaglianza tra domanda e offerta)
Medio termine: chip di calcolo & server
Lungo termine: attrezzature elettriche, energia verde + principali attori con capacità di realizzazione e esportazione
In sintesi: l'economia dei token consiste nel trasformare l'elettricità del mondo fisico in intelligenza del mondo digitale, e poi vendere come un prodotto industriale.
Questa non è una speculazione, è una vera e propria rivoluzione industriale 2.0 — dalla formazione di grandi modelli, ci si sposta completamente verso l'inferenza su larga scala e l'era degli agenti.
Ragazzi, i token sono esplosi, siete pronti?
Si tratta di continuare a guardare lo spettacolo o di posizionarsi nel settore della fabbrica di token relativa a potenza di calcolo, elettricità, algoritmi e concetti di esportazione?
Benvenuti a discutere le vostre opinioni nei commenti ~

