Alibaba presenta ZeroSearch: addestrare modelli AI senza usare motori di ricerca

ZeroSearch è il nuovo framework open-source che simula la ricerca e migliora le prestazioni degli LLM, senza dipendere da Google o Bing

Una nuova strada per addestrare i modelli linguistici

I grandi modelli linguistici (LLM), come quelli usati in ChatGPT o Claude, spesso si affidano a motori di ricerca esterni per migliorare le risposte. Ma c’è un problema: queste ricerche sono costose (per via delle API) e poco affidabili, perché i contenuti trovati possono essere incoerenti o rumorosi.

La soluzione proposta da Alibaba si chiama ZeroSearch, ed è un framework open-source che permette agli LLM di “cercare” senza collegarsi a motori di ricerca reali. Come? Usando un modello di simulazione che imita la qualità (buona o cattiva) dei risultati ottenuti da una vera ricerca online.

Come funziona ZeroSearch?

ZeroSearch funziona in tre fasi principali:

  1. Addestramento supervisionato leggero: si addestra il modello a simulare una ricerca, producendo sia documenti utili che inutili.
  2. Apprendimento progressivo: durante l’allenamento, il modello riceve risultati via via peggiori, imparando così a ragionare meglio anche in presenza di informazioni confuse.
  3. Ricompensa basata sulla precisione: il modello viene premiato se fornisce risposte corrette, non per come le presenta.

In pratica, il modello impara a ragionare senza cercare davvero, risparmiando tempo, risorse e denaro.

ZeroSearch, funzionamento
Immagine del modello dal paper ufficiale

I risultati? Sorprendenti

Secondo i test del team Alibaba:

  • Un modello da 7 miliardi di parametri addestrato con ZeroSearch ha prestazioni simili a quelle ottenute usando veri motori di ricerca.
  • Un modello da 14 miliardi supera addirittura i risultati ottenuti con Google o Bing.
  • Il sistema funziona bene su modelli base, versioni instruction-tuned e con vari algoritmi di reinforcement learning.

ZeroSearch non è solo un’alternativa economica, ma una nuova frontiera per rendere l’intelligenza artificiale più autonoma.

Leggi anche MPC: il Model Context Protocol e il futuro dell’interoperabilità tra modelli AI

Perché è importante

Con ZeroSearch, Alibaba punta a rendere il training dei modelli AI:

  • Più sostenibile (nessun uso di API esterne)
  • Più stabile (nessun contenuto esterno non controllato)
  • Più scalabile (meno vincoli tecnici)

È una novità rilevante per chi sviluppa AI, ma anche per chi cerca strumenti più efficienti e indipendenti.

ZeroSearch può fornire informazioni aggiornate come una data o un prezzo?

No. ZeroSearch non è collegato a Internet e non può fornire informazioni aggiornate in tempo reale. Il suo scopo è un altro: insegnare ai modelli linguistici a ragionare meglio anche quando i dati a disposizione non sono perfetti, simulando una ricerca online.

Per conoscere la data di oggi, il meteo, o il prezzo attuale di un prodotto, serve comunque un motore di ricerca reale o un’integrazione esterna.