AMD a dat o lovitură cu Ryzen AI Max+ 395: primul mini PC care bate cloud-ul la procesare AI locală

CEO AMD, Lisa Su, a prezentat oficial AMD Ryzen AI Halo Mini PC, un mini PC de mărimea unei cărți care integreaza AMD Ryzen™ AI Max+ 395 de pe care a rulat live un model de 235 de miliarde de parametri. Fără centru de date. Fără cloud. Fără să plătești chirie la Nvidia sau vreun abonament lunar în cloud care să îți rupă buzunarele și nici să nu dai spargere în cont când plătești factura la curent.

Protagonistul acestei peformante este Ryzen AI Max+ 395 (Strix Halo)

Primul ciplet x86 care unește CPU și GPU (laptop/desktop) cu 128 GB de memorie unificată,ceea ce înseamnă că folosind teghnologia ROCm 7 în Linux, GPU-ul poate să traga pentru rularea de AI local până la ~110 GB din cutia aia de chibrituri. Ca să se inteleagă mai bine si sa punem lucrurile în context, nVidia vinde la bani multi placi video RTX 5090 cu doar 32 GB, respectiv 4090 cu doar 24 GB. Adică au facut cumva îți dă de peste trei ori mai multă memorie accesibilă pentru modele mari, într-o carcasa care încape pe un colt de birou. Și nu e doar in teorie, deoarece in teste reale de performanță in timp real, gen DeepSeek R1, model care nu încape în VRAM-ul unui card Nvidia, jucaria aia a bătut cu peste trei ori performanta unei placi grafice RTX 5080, care costa in jurul a 1700$, doar placa video, pretul pentru rivalul NVIDIA DGX Spark prezentat recent, pornind de pe la ~5000 USD.

Pret unui kit AMD?

Un GMKtec EVO-X2 cu 128 GB ca cel prezentat de AMD se învârte intre 1.800 – 2.500 de dolari – 3200USD (la precomanda), în funcție de oferte si implementarea partenerilor. Kitul oficial AMD e mai scump, dar si varianta oficială e deja accesibilă pentru oricine chiar ia dezvoltarea inteligentei artificiale la nivel loca in modul serios.

Pentru mine, care tot experimentez cu chestii locale de o vreme, asta schimbă complet calculele

În loc să arunci sute de dolari pe lună pe Claude, ChatGPT Pro, Cursor sau ce mai e la modă, poți rula modele puternice local, cu Ollama, LM Studio sau ce-ți convine ție pe jucaria asta mica, care se dovedeste a fi si foarte accesibila comparativ cu oferta concurentei, respectiv mai ieftin decat pretul cu care cumperi o placa video RTX 5090 si te alegi cu confidențialitate totală. Fără limite de tokeni. Fără să-ți taie accesul exact când ai nevoie la 3 dimineața pentru un proiect care nu suferă amânare, așa cum s’a întâmplat de curând cu modele Antropic.

Nu zic că abonamentele o să dispară mâine. Nici vorbă

Dar pentru multe cazuri de utilizare – RAG cu documente private, prototipuri rapide, agenți locali care nu trebuie să vorbească cu serverele altora – opțiunea asta devine extrem de atrăgătoare. E genul ala de chestie care face trecerea de la „îmi place AI-ul dar sunt dependent de cloud” la „ok, acum chiar controlez eu treaba”.

Și da, simt un pic de satisfacție

Când văd că open source-ul și hardware-ul accesibil încep să muște serios din monopolul Big Tech. Asadar, dacă te interesează IA locală și nu vrei să fii la mila abonamentelor, merită să urmărești mișcarea asta. Strix Halo nu e doar un anunț de produs – e un semnal că lucrurile se democratizează mai repede decât credeam.

Citeste si ...

Descoperă mai multe la IceWorld|DeuteriumCore

Abonează-te ca să primești ultimele articole prin email.