ZeroSearch è il nuovo framework open-source che simula la ricerca e migliora le prestazioni degli LLM, senza dipendere da Google o Bing
Una nuova strada per addestrare i modelli linguistici
I grandi modelli linguistici (LLM), come quelli usati in ChatGPT o Claude, spesso si affidano a motori di ricerca esterni per migliorare le risposte. Ma c’è un problema: queste ricerche sono costose (per via delle API) e poco affidabili, perché i contenuti trovati possono essere incoerenti o rumorosi.
La soluzione proposta da Alibaba si chiama ZeroSearch, ed è un framework open-source che permette agli LLM di “cercare” senza collegarsi a motori di ricerca reali. Come? Usando un modello di simulazione che imita la qualità (buona o cattiva) dei risultati ottenuti da una vera ricerca online.
Come funziona ZeroSearch?
ZeroSearch funziona in tre fasi principali:
- Addestramento supervisionato leggero: si addestra il modello a simulare una ricerca, producendo sia documenti utili che inutili.
- Apprendimento progressivo: durante l’allenamento, il modello riceve risultati via via peggiori, imparando così a ragionare meglio anche in presenza di informazioni confuse.
- Ricompensa basata sulla precisione: il modello viene premiato se fornisce risposte corrette, non per come le presenta.
In pratica, il modello impara a ragionare senza cercare davvero, risparmiando tempo, risorse e denaro.

I risultati? Sorprendenti
Secondo i test del team Alibaba:
- Un modello da 7 miliardi di parametri addestrato con ZeroSearch ha prestazioni simili a quelle ottenute usando veri motori di ricerca.
- Un modello da 14 miliardi supera addirittura i risultati ottenuti con Google o Bing.
- Il sistema funziona bene su modelli base, versioni instruction-tuned e con vari algoritmi di reinforcement learning.
ZeroSearch non è solo un’alternativa economica, ma una nuova frontiera per rendere l’intelligenza artificiale più autonoma.
Leggi anche MPC: il Model Context Protocol e il futuro dell’interoperabilità tra modelli AI
Perché è importante
Con ZeroSearch, Alibaba punta a rendere il training dei modelli AI:
- Più sostenibile (nessun uso di API esterne)
- Più stabile (nessun contenuto esterno non controllato)
- Più scalabile (meno vincoli tecnici)
È una novità rilevante per chi sviluppa AI, ma anche per chi cerca strumenti più efficienti e indipendenti.
ZeroSearch può fornire informazioni aggiornate come una data o un prezzo?
No. ZeroSearch non è collegato a Internet e non può fornire informazioni aggiornate in tempo reale. Il suo scopo è un altro: insegnare ai modelli linguistici a ragionare meglio anche quando i dati a disposizione non sono perfetti, simulando una ricerca online.
Per conoscere la data di oggi, il meteo, o il prezzo attuale di un prodotto, serve comunque un motore di ricerca reale o un’integrazione esterna.