INTELLIGENZE ARTIFICIALI

>

DeepSeek lancia il modello open source che sfida i giganti dell’AI

In un momento cruciale per l’intelligenza artificiale, DeepSeek ha presentato un modello che potrebbe cambiare le carte in tavola. Il nuovo DeepSeek-V3 non è solo l’ennesimo modello AI: i test dimostrano che può competere direttamente con pesi massimi come GPT-4 e Claude 3.5, ma con un vantaggio fondamentale – è completamente open source.

La svolta che democratizza l’AI avanzata

Mentre i giganti del settore mantengono i loro modelli sotto chiave, DeepSeek ha scelto una strada diversa. Il loro nuovo modello, che incorpora 671 miliardi di parametri, è stato progettato pensando alla comunità degli sviluppatori. “Vogliamo che l’AI avanzata sia accessibile a tutti”, sembrano dire con questa mossa.

I numeri sono impressionanti: su test standardizzati come MMLU, DeepSeek-V3 ha raggiunto l’88,5% di accuratezza, praticamente alla pari con Claude 3.5 (88,3%) e GPT-4 (87,2%). Ma non è solo questione di punteggi – il modello brilla particolarmente in aree critiche come il ragionamento matematico e la programmazione.

DeepSeek modello open source
Le performance di DeepSeek comparate con i modelli più avanzati – Immagine GitHub

Dietro le quinte dell’innovazione

La vera innovazione di DeepSeek sta nell’efficienza. Il team ha ripensato completamente l’architettura del modello, utilizzando una tecnica chiamata Mixture-of-Experts (MoE) che attiva selettivamente solo 37 miliardi di parametri per ogni elaborazione. È come avere un’orchestra dove non tutti gli strumenti suonano contemporaneamente, ma si alternano creando la performance perfetta.

Il risultato? Un modello che richiede meno risorse per funzionare e può essere utilizzato su hardware più accessibile. L’intero processo di training ha richiesto solo 2,8 milioni di ore GPU – un’efficienza sorprendente per un modello di queste dimensioni.

Accessibilità prima di tutto

A differenza dei modelli proprietari, DeepSeek-V3 offre diverse opzioni di utilizzo:

  • Una piattaforma web per uso immediato
  • API compatibili con gli standard di settore
  • La possibilità di eseguirlo localmente sui propri server

Gli sviluppatori possono scegliere tra vari framework ottimizzati come SGLang, LMDeploy o TensorRT-LLM, adattando il modello alle proprie esigenze specifiche.

Possibili effetti sul mondo dell’AI

Questa mossa di DeepSeek potrebbe innescare un effetto domino nel settore. Con un modello open source che compete alla pari con le alternative proprietarie, potremmo assistere a:

  • Una maggiore democratizzazione delle tecnologie AI avanzate
  • Nuove opportunità per startup e ricercatori
  • Un’accelerazione nell’innovazione grazie alla collaborazione della comunità

Leggi anche Harvard rilascia dataset AI con 1 milione di libri

DeepSeek modello open source, nuovo capitolo nell’AI

Il lancio di DeepSeek-V3 segna un momento significativo nella storia dell’intelligenza artificiale. Non è solo una questione di prestazioni tecniche – è un cambio di paradigma che dimostra come l’eccellenza tecnologica possa coesistere con l’apertura e l’accessibilità.

Per gli sviluppatori, le aziende e i ricercatori che hanno atteso un’alternativa credibile ai modelli proprietari, quel momento è arrivato. DeepSeek-V3 non è solo una promessa di parità con i giganti del settore – è una porta aperta verso un futuro dove l’AI avanzata è davvero alla portata di tutti.