Impresoft Blog

Ultime tendenze e sfide nell'ecosistema delle Intelligenze Artificiali - gennaio 2025

Scritto da Impresoft | Feb 20, 2025 1:13:40 PM

DeepSeek R1: un salto tecnologico o un punto di tensione geopolitico?

Lo sviluppo più significativo nel campo dell'intelligenza artificiale di inizio anno è stato senza dubbio il rilascio di DeepSeek R1. Un rilascio che ha generato un ampio dibattito e il desidero condividere il mio punto di vista su questa tematica.

Il fatto principale è che DeepSeek ha introdotto un modello open-source in grado di competere con alcuni dei modelli closed-source più avanzati di sei mesi fa. Già questo è notevole, ma ciò che colpisce maggiormente è che i suoi costi di inferenza sono significativamente più bassi—solo 1/10 o 1/20 rispetto ai suoi concorrenti closed-source. Tutto il resto rimane pura speculazione.

Inoltre, R1 presenta limitazioni significative. È fortemente censurato su questioni riguardanti la Cina e ha prestazioni scarse con i contenuti di notizie. Inoltre, ci sono forti evidenze che suggeriscono che sia stato almeno parzialmente distillato dai modelli GPT-4o e o1 di OpenAI. La censura è stata rimossa, ad esempio, dal gruppo Azure AI, che ora offre R1 in un ambiente sicuro su Azure AI Foundry.

Al di là di questi fatti, molto rimane incerto. I dettagli relativi ai dati di training e al processo di addestramento non sono noti, lasciando spazio a speculazioni e preoccupazioni geopolitiche.

Considerata la posta in gioco a livello geopolitico, raccomando fortemente di testare R1 in un ambiente controllato come Azure AI Foundry, piuttosto che utilizzare servizi basati in Cina. Il predominio nell'AI è sempre più centrale per l'equilibrio di potere globale tra gli Stati Uniti, i loro alleati e la Cina, e questa competizione definirà i prossimi decenni.

Prima di approfondire ulteriormente, consiglio vivamente di leggere il punto di vista di Dario Amodei su questo tema: https://darioamodei.com/on-deepseek-and-export-controls.

La Tecnologia Dietro DeepSeek R1

DeepSeek R1 è un modello di intelligenza artificiale incentrato sul ragionamento, progettato per eseguire processi di pensiero complessi prima di generare risposte. Questo lo differenzia dai modelli ottimizzati per risposte rapide. I suoi principali aspetti tecnici includono:

  • Parametri: 671 miliardi di parametri totali, con 37 miliardi attivi in ogni momento.
  • Context Length: 128K token, che consente capacità di ragionamento estese.
  • Efficienza dei Costi: Prezzi di $0.14/M token in input (cache hit) e $2.19/M token in output, significativamente più economico rispetto a OpenAI o1 ($15/M input, $60/M output).
  • Open Source & Licensing: rilasciato sotto licenza MIT, che consente un ampio utilizzo commerciale e personale, incluso il fine-tuning del modello.

Per maggiori dettagli: https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

L'Innovazione nel Processo di Addestramento

DeepSeek R1 sfida le pratiche convenzionali nell'addestramento dell'AI. OpenAI e altre aziende occidentali si sono affidate a grandi dataset annotati manualmente e a reinforcement learning supervisionato per migliorare il ragionamento. DeepSeek, invece, ha adottato un approccio radicalmente diverso:

  1. Apprendimento Autonomo con Reinforcement Learning: invece di alimentarlo con grandi volumi di dati curati, R1 ha appreso per tentativi ed errori, simile a come AlphaGo ha imparato a giocare a Go giocando contro se stesso.
  2. Group Relative Policy Optimization (GRPO): l'addestramento ha utilizzato strategie di reinforcement learning che premiano accuratezza e ragionamento strutturato, migliorando la capacità di risolvere problemi dal 15,6% all'86,7%.
  3. Fine-Tuning con Dati Sintetici: Il modello è stato perfezionato iterativamente utilizzando 600.000 esempi di ragionamento, mescolati con 200.000 casi non di ragionamento, seguiti da reinforcement learning per garantire coerenza e affidabilità.

Implicazioni Competitive e Strategiche

Il rilascio di DeepSeek R1 segnala l'aggressiva strategia della Cina per dominare l'AI, nonostante le sanzioni USA sui chip ad alte prestazioni. Mentre OpenAI e altre aziende occidentali stanno limitando l'accesso ai loro modelli, aziende cinesi come DeepSeek e Alibaba Qwen stanno rilasciando modelli open-weight che stanno rapidamente guadagnando terreno.

  • Vantaggio economico: R1 è 20 volte più economico rispetto a OpenAI o1, rendendolo un'alternativa attraente per aziende e sviluppatori.
  • Parità prestazionale: ibenchmark suggeriscono che R1 sia competitivo con i modelli occidentali nei compiti di ragionamento.
  • Minaccia per OpenAI: Se l'approccio self-training basato su reinforcement learning si dimostrasse efficace, OpenAI potrebbe perdere il suo vantaggio competitivo segreto, ridefinendo il paradigma della ricerca sull'AI.

Conseguenze Geopolitiche ed Etiche

DeepSeek R1 non è solo un'innovazione tecnologica, ma un punto di tensione geopolitico. Dopo il suo rilascio, sono emerse diverse controversie:

  1. Accusa di Distillazione da OpenAI: secondo alcuni report, DeepSeek R1 potrebbe essere stato addestrato su modelli OpenAI, violando i termini d'uso e sollevando questioni etiche.
  2. Scrutinio della Sicurezza Nazionale USA: il National Security Council sta valutando i rischi di R1; la US Navy ne ha già vietato l'uso per motivi di "sicurezza ed etica".
  3. GDPR & Privacy: l'Italia ha presentato un esposto per possibili violazioni del GDPR, portando al blocco nazionale di R1.
  4. Censura e Bias: come molti modelli AI cinesi, DeepSeek R1 è fortemente censurato su temi legati alla Cina, sollevando dubbi sulla sua imparzialità nella diffusione delle informazioni.

Perché è Importante

Il rilascio di DeepSeek R1 segna un cambiamento critico nello sviluppo dell'AI e negli equilibri di potere globali:

  • Disrupting i Costi: modelli open-source ad alte prestazioni minacciano il dominio dei modelli closed-source costosi.
  • Innovazioni nell'addestramento: se i modelli basati su reinforcement learning si dimostreranno efficaci, l'intero approccio all'addestramento dell'AI potrebbe cambiare.
  • L'AI come arma geopolitica: la competizione tra USA e Cina sta trasformando la tecnologia in un campo di battaglia per la supremazia.
  • Rischi etici e di sicurezza: l'uso dell'AI solleva preoccupazioni crescenti su origine dei dati, sicurezza e governance.

Conclusione

DeepSeek R1 rappresenta una pietra miliare nello sviluppo dell'AI, sconvolgendo sia il panorama tecnologico che quello geopolitico. Mentre le sue innovazioni tecniche sono impressionanti, le questioni etiche e di sicurezza che solleva restano irrisolte. Con l'intelligenza artificiale destinata a plasmare il futuro, la battaglia per il controllo del suo sviluppo e della sua distribuzione è appena iniziata.