Lo sviluppo più significativo nel campo dell'intelligenza artificiale di inizio anno è stato senza dubbio il rilascio di DeepSeek R1. Un rilascio che ha generato un ampio dibattito e il desidero condividere il mio punto di vista su questa tematica.
Il fatto principale è che DeepSeek ha introdotto un modello open-source in grado di competere con alcuni dei modelli closed-source più avanzati di sei mesi fa. Già questo è notevole, ma ciò che colpisce maggiormente è che i suoi costi di inferenza sono significativamente più bassi—solo 1/10 o 1/20 rispetto ai suoi concorrenti closed-source. Tutto il resto rimane pura speculazione.
Inoltre, R1 presenta limitazioni significative. È fortemente censurato su questioni riguardanti la Cina e ha prestazioni scarse con i contenuti di notizie. Inoltre, ci sono forti evidenze che suggeriscono che sia stato almeno parzialmente distillato dai modelli GPT-4o e o1 di OpenAI. La censura è stata rimossa, ad esempio, dal gruppo Azure AI, che ora offre R1 in un ambiente sicuro su Azure AI Foundry.
Al di là di questi fatti, molto rimane incerto. I dettagli relativi ai dati di training e al processo di addestramento non sono noti, lasciando spazio a speculazioni e preoccupazioni geopolitiche.
Considerata la posta in gioco a livello geopolitico, raccomando fortemente di testare R1 in un ambiente controllato come Azure AI Foundry, piuttosto che utilizzare servizi basati in Cina. Il predominio nell'AI è sempre più centrale per l'equilibrio di potere globale tra gli Stati Uniti, i loro alleati e la Cina, e questa competizione definirà i prossimi decenni.
Prima di approfondire ulteriormente, consiglio vivamente di leggere il punto di vista di Dario Amodei su questo tema: https://darioamodei.com/on-deepseek-and-export-controls.
DeepSeek R1 è un modello di intelligenza artificiale incentrato sul ragionamento, progettato per eseguire processi di pensiero complessi prima di generare risposte. Questo lo differenzia dai modelli ottimizzati per risposte rapide. I suoi principali aspetti tecnici includono:
Per maggiori dettagli: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf
DeepSeek R1 sfida le pratiche convenzionali nell'addestramento dell'AI. OpenAI e altre aziende occidentali si sono affidate a grandi dataset annotati manualmente e a reinforcement learning supervisionato per migliorare il ragionamento. DeepSeek, invece, ha adottato un approccio radicalmente diverso:
Il rilascio di DeepSeek R1 segnala l'aggressiva strategia della Cina per dominare l'AI, nonostante le sanzioni USA sui chip ad alte prestazioni. Mentre OpenAI e altre aziende occidentali stanno limitando l'accesso ai loro modelli, aziende cinesi come DeepSeek e Alibaba Qwen stanno rilasciando modelli open-weight che stanno rapidamente guadagnando terreno.
DeepSeek R1 non è solo un'innovazione tecnologica, ma un punto di tensione geopolitico. Dopo il suo rilascio, sono emerse diverse controversie:
Il rilascio di DeepSeek R1 segna un cambiamento critico nello sviluppo dell'AI e negli equilibri di potere globali:
DeepSeek R1 rappresenta una pietra miliare nello sviluppo dell'AI, sconvolgendo sia il panorama tecnologico che quello geopolitico. Mentre le sue innovazioni tecniche sono impressionanti, le questioni etiche e di sicurezza che solleva restano irrisolte. Con l'intelligenza artificiale destinata a plasmare il futuro, la battaglia per il controllo del suo sviluppo e della sua distribuzione è appena iniziata.