Qwen, come è fatto e come funziona il modello Ai di Alibaba rivale di Deepseek
Dopo la “bomba” di Deepseek il gigante rivale Alibaba rilascia Qwen 2.5-Max che si presenta come una versione più potente.
2' min read
2' min read
Ci sarebbe anche Qwen. Possiamo definirla la risposta di Alibaba a Deepseek o il segnale di un’invasione imminente di modelli di intelligenza artificiale generativa made in China, ma in realtà non è così. Come avevamo scritto qui su Hugging Face, la piattaforma open-source di LLM (modelli linguistici di grandi dimensioni) più popolare al mondo, dove è possibile trovare strumenti e risorse per lavorare con l’AI generativa e la computer vision, il modello Qwen 2.5 ha raggiunto 94 milioni di download, di cui la metà nell’ultimo mese. In pratica, è il modello open-source più popolare al mondo, superando Llama 3.1 di Meta.Nei giorni scorsi dopo la “bomba” di Deepseek Alibaba ha rilasciato Qwen 2.5-Max che si presenta come la versione più aggiornata e potente. Stando agli indicatori di prestazione pubblicati dal colosso cinese sarebbe superiore a DeepSeek V3 ma anche a Gpt-o4 e Claude 3.5 Sonnet.
Come è fatto e come funziona?
Se leggiamo il loro sito intuiamo che la partita la giocano sul rivale domestico (DeepSeek) e sugli altri modelli open source. Su questo mercato c’ è anche Meta e Ibm. «Qwen2.5-Max - scrivono - supera DeepSeek V3 in benchmark quali Arena-Hard, LiveBench, LiveCodeBench e GPQA-Diamond. Quando confrontiamo i modelli base, non siamo in grado di accedere ai modelli proprietari come GPT-4o e Claude-3.5-Sonnet. Pertanto, valutiamo Qwen2.5-Max rispetto a DeepSeek V3, un modello MoE open-weight leader, Llama-3.1-405B, il modello denso open-weight più grande, e Qwen2.5-72B, che è anche tra i migliori modelli densi open-weight».
Privacy e sicurezza.
C’è il solito buco nero sul fronte della privacy e della sicurezza, come DeepSeek. Nel senso che i nostri dati vengono custoditi su server cinese a cui può avere accesso il Governo. Il Garante italiano ha aperto una indagine sulla scia di quanto fatto con ChatGpt. Per ora il primo effetto sensibile è la cancellazione dell’app dagli store italiani degli smartphone.
Le differenza con Deepseek
Il modello di Alibaba si presenta da un punto di vista delle funzioni come chatgpt. Da una primissima prova sembra multimodale, cioè legge e interpreta anche immagini ed è in grado di generare video. Sembra anche più morbido quando gli chiedi informazioni sulla Cina. Nel senso che ha i blocchi che abbiamo visto su DeepSeek. Poi è disponibile online. Per accedere deve prima registrare un account Alibaba Cloud e attivare il servizio Alibaba Cloud Model Studio, quindi navigare verso la console e creare una chiave API.



