Gigabyte AI Top Atom (Nvidia DGX Spark) review: compact AI-workstation met bijzonderheden
Eindelijk is de lang verwachte mini-pc met AI-chip van Nvidia en 128 GB RAM verkrijgbaar. We testen de versie van Gigabyte om de bijzonderheden van dat systeem te verkennen.
Een mini-pc voor lokale AI
Het is geen typische mini-pc, maar ook geen standaard Linux-workstation en geen AI-server – maar het combineert eigenschappen van alle drie. We hebben het over de Nvidia DGX Spark, die Nvidia-baas Jensen Huang al in januari 2025 aankondigde.
De apparaten zijn sinds half oktober 2025 op de markt gekomen – niet alleen van Nvidia zelf, maar in een iets aangepaste (ontwerp)vorm ook van Asus, Dell, HP, Lenovo en Gigabyte. We nemen een exemplaar van de Gigabyte AI Top Atom onder de loep en leggen uit voor welke toepassingen de investering van rond de 4300 euro de moeite waard is.
De DGX Spark heeft twee belangrijke bijzondere eigenschappen: ten eerste de GB10-combiprocessor met ingebouwde Nvidia-gpu als CUDA-compatibele AI-accelerator en ten tweede een ruime hoeveelheid bijzonder snel RAM.
Er is 128 GB LPDDR5X RAM beschikbaar, dat gegevens levert met een snelheid tot 273 GB/s. Dat betekent dat relatief grote AI-taalmodellen (LLM’s) lokaal kunnen draaien. De 200 Gbit/s Connect X-7 netwerkadapter van Nvidia’s Mellanox-divisie is ook aantrekkelijk voor sommige toepassingen.
Voor de rest gebruikt de DGX Spark in de vorm van deze Gigabyte AI Top Atom componenten die ook in andere mini-pc’s te vinden zijn zoals Wi-Fi 7, een 10 Gbit/s ethernetpoort en vier USB-C-aansluitingen. Eén daarvan is voor de voeding – Gigabyte levert een bijpassende 240W-voeding mee.

Dat nominale vermogen geeft al een indicatie van de orde van grootte van de AI-prestaties van de DGX Spark. Hoewel het gpu-gedeelte van de GB10-combochip 6144 shaderunits of CUDA-cores heeft net als de gpu van de Nvidia GeForce RTX 5070 gamingkaart, zijn ze anders opgebouwd, namelijk geoptimaliseerd voor AI-algoritmes.
De GB10-gpu heeft bijvoorbeeld twee keer zoveel Tensor-cores als de 5070 (384 in plaats van 192), maar minder Render Output Units (48 in plaats van 80 ROP’s).
Dat heeft verder weinig nut als het AI-model niet in het RAM past. De GB10 GPU gebruikt acht keer de RAM-capaciteit van een RTX 5070 (128 GB in plaats van 16 GB). Het GDDR7-RAM van de 5070 is echter bijna 2,5 keer sneller dan de LPDDR5X chips van de GB10 (672 in plaats van 273 GB/s).
En terwijl de 5070 een thermisch ontwerpvermogen (TDP) heeft van 250 watt, heeft de GB10 een vermogen van slechts 140 watt. Dat komt omdat de GB10 niet bedoeld is om AI-topprestaties te leveren, maar om in een mini-pc te passen.
Concurrenten
Sommigen zullen verrast zijn door een RAM-snelheid van 273 GB/s. Biedt Apple dat ook niet? Dat klopt: de Mac mini met M4 Pro kan dat ook. En net als bij de GB10 delen de cpu en gpu-kernen – de eerste ook ARM-compatibel – het snelle RAM: Unified Memory Architecture (UMA). De Mac mini is echter verkrijgbaar met maximaal 64 GB RAM en kost dan zo’n 2450 euro.

Er is ook een GB10-concurrent met x86-technologie, namelijk de mobiele AMD-processor Ryzen AI Max+ 395 oftewel Strix Halo. Die zit in enkele laptops en mini-pc’s, die ook verkrijgbaar zijn met tot 128 GB LPDDR5X-RAM. Dat laatste werkt wel iets langzamer dan in een DGX Spark. HP installeert de Ryzen AI Max+ 395 in het compacte Z2 Mini G1a-workstation, dat met 128 GB RAM verkrijgbaar is vanaf ongeveer 3100 euro. De Framework Desktop is ruim 300 euro goedkoper en ook andere fabrikanten leveren vergelijkbare mini-pc’s en laptops met Strix Halo.
Bij Apple is 128 GB UMA RAM aanzienlijk duurder. De Mac Studio met M4 Max met zoveel geheugen kost 4710 euro. Je kunt zelfs 512 GB RAM krijgen voor 11.670 euro, maar alleen met de oudere M3 Ultra. Een Apple-computer en een Strix Halo-machine kunnen de Nvidia CUDA-programmeerinterface echter niet gebruiken.
Uitrusting
Op het eerste gezicht lijken de kenmerken van de Gigabyte AI Top Atom op die van veel andere mini-pc’s. Maar er zijn belangrijke verschillen. De vier USB-C-aansluitingen op de DGX Spark bieden maximaal USB 3.2 Gen 2×2 – ook in de Gigabyte-versie.
Geen USB4, geen Thunderbolt en geen beeldsignalen. De eerste aansluiting wordt bovendien bezet door de meegeleverde 240W-voeding – overigens een van de relatief zeldzame voedingen met USB Power Delivery Extended Power Range (USB-PD EPR).
Omdat de DGX Spark geen USB-A-aansluitingen heeft, heb je adapters, een dock of Bluetooth nodig om een toetsenbord en muis aan te sluiten. De DGX Spark stuurt daarnaast maar één beeldscherm aan, namelijk via hdmi. Een 4K-beeldscherm (3840 × 2160) met 60 Hz en een full-hd-scherm werkten bij de test zonder problemen. Er zijn echter meldingen dat ultrawide beeldschermen soms problemen kunnen veroorzaken.
Kortom: Nvidia ziet de DGX Spark niet als een grafisch workstation, maar als een pure AI-machine die veel gebruikers op afstand zullen bedienen via ssh.
De zeer snelle Wi-Fi 7-adapter van Nvidia’s samenwerkingspartner Mediatek zal dan ook waarschijnlijk het grootste deel van de tijd inactief zijn. Belangrijker is de 10Gbit/s-ethernetchip van Realtek, die de verwachte snelheden levert.
Bijzonder is de ConnectX 7-chip, die twee QFSP-poorten levert met een nominale 200 Gbps. ‘Nominaal’ omdat ze volgens de ServeTheHome-website elk net iets minder dan 100 Gbit/s leveren omdat ze blijkbaar via PCIe 5.0 x4 zijn verbonden.
We hebben de 200Gbit/s-poorten niet kunnen testen omdat die vooral bedoeld zijn voor het snel koppelen van een tweede DGX Spark. ait noemt Nvidia stacking en maakt het mogelijk om nog grotere AI-modellen lokaal te laten draaien.
Software
Nvidia noemt de Linux-distributie die op de DGX Spark is voorgeïnstalleerd DGX OS 7. Nvidia gebruikt de ARM-versie van het anderhalf jaar oude Ubuntu 24.04.03 LTS (Noble Numbat, AArch64) met alle benodigde drivers, een selectie apps en een aangepast grafisch bureaublad.
Het DGX Dashboard is vooraf geïnstalleerd en kan worden bediend via de browser. Het toont wat statusinformatie, links naar documentatie en het Nvidia-supportforum en maakt het makkelijker om aan de slag te gaan met programmeren met JupyterLab.

Nvidia raadt zelfs het DGX dashboard aan (onder Settings) voor het installeren van updates in plaats van de gebruikelijke manier via de commandline en apt update. De test bracht een paar kinderziektes aan het licht, maar op het Nvidia-supportforum (zie de link op het einde) proberen specialisten snel hulp te bieden.
Nvidia wil het duidelijk makkelijker maken voor met name AI-programmeurs om met de DGX Spark aan de slag te gaan. Op build.nvidia.com/spark staan recepten (playbooks) voor voorbeelden. Die hebben instructies voor het installeren van de LLM-uitvoeromgeving ollama, het downloaden en starten van het GPT-OSS 120B-model om te programmeren met AI-hulp via Vibe Coding in Visual Studio Code.
De DGX Spark start op met UEFI-firmware en Secure Boot. Het opstartproces duurt relatief lang met 36 seconden. Het idle energieverbruik van 42 watt geeft ook aan dat de firmware en sommige energiebesparende functies nog wat finetunen kunnen gebruiken.
Processorvergelijking
Mediatek heeft de 20 ARM-processorkernen in de GB10 ingekocht bij ARM. De Cortex-X925 en Cortex-A725 zitten ook in sommige smartphoneprocessors zoals de Mediatek Dimensity 9400, maar de GB10 heeft een bijzonder hoog aantal van die kernen en die klokken ook vrij hoog met maximaal 4 GHz.
Bij Geekbench 6.5.0 komt het cpu-gedeelte van de GB10 ongeveer overeen met de eerder genoemde AMD Ryzen AI Max 395+ of een Intel Core Ultra 9 285. Een Apple M4 is singlethreading (een enkele kern) ongeveer 25 procent sneller en multithreading iets langzamer.
De Apple M5 is bij multithreading daarentegen gelijkwaardig en singlethreading meer dan 40 procent sneller. Maar die is nog niet verkrijgbaar met 128 GB RAM.
De 3D renderingbenchmark Cinebench draait niet onder Linux. Bij Blender 4.0 met de testscène Classroom liggen de 20 ARM-kernen van de DGX Spark ver achter bij de huidige desktopprocessors van AMD en Intel. Zelfs de Intel Core Ultra 5 225H mobiele processor in de Asus NUC 15 Pro mini-pc draait 15 procent sneller.
AI-koning
Maar een DGX Spark wordt uiteindelijk gekocht voor zijn voor CUDA geschikte gpu, die door (bijna) 128 GB aan gegevens kan ploegen. We hebben de taalmodellen (LLM’s) GPT-OSS.120b en de kleinere Qwen3-4b-2507 geïnstalleerd onder LM Studio 0.3.31.
De Gigabyte AI Top Atom leverde 45 tokens per seconde (tokens/s) voor GPT-OSS.120b en 70 tokens/s voor Qwen3-4b-2507. Nvidia geeft 22 procent hogere waarden op voor GPT-OSS.120b, maar gebruikt andere instellingen voor de lengte van de invoer- en uitvoerreeks voor de meting en gebruikt de llama.cpp-bibliotheek rechtstreeks, dus zonder LM Studio.
Volgens Nvidia levert de DGX Spark ook relatief snelle reacties voor LLM’s, oftewel het heeft een korte Time To First Token (TTFT).
Met de huidige softwareversie is de DGX Spark echter nog geen allround zorgeloos pakket voor AI-ontwikkelaars. LM Studio kon wel zonder problemen worden geïnstalleerd als een ARM64 AppImage, maar het laden van het 63 GB OpenAI-model GPT-OSS.120b duurde anderhalve minuut (96 seconden) en het bureaublad bleef daarbij steeds een paar seconden hangen.
Dergelijke haperingen waren er niet met de eerder genoemde Framework Desktop met AMD Strix Halo, waarop Fedora Workstation 43 draaide. Tot onze verbazing verwerkte de ongeveer 1500 euro goedkopere concurrent met langzamer RAM een LLM ook iets sneller. Met GPT-OSS.120b leverde hij ongeveer elf procent meer doorvoer met 50 tokens/s, met Qwen3-4b-2507 was dat 70 tokens/s (minus 3 procent).

De Nvidia-machine presteert beduidend beter met de populaire beeld-, geluids- en videosoftware ComfyUI, omdat het Nvidia-exclusieve CUDA nog steeds de de-facto standaard is. Niet alleen is het installeren eenvoudiger (met AMD worstelden we met incompatibele ROCm-versies), maar de prestaties zijn ook hoger.
De Nvidia-box genereerde een afbeelding met het flux1- dev-fp8 model (workflow via de voorgeïnstalleerde template, 1024 × 1024 pixels) in 38 seconden, terwijl de AMD-computer minstens 89 seconden nodig had. Een GeForce RTX 4090 leverde de afbeelding echter al na 20 seconden.
Als je het grote geheugen dus niet nodig hebt, ben je beter af met een conventionele grafische kaart. De overgrote meerderheid van de ComfyUI-modellen zijn ontworpen voor gpu’s met 24 of zelfs maar 16 GB.
Toen het aankwam op gpu-rendering met Blender 4.0, struikelden we over een paar hindernissen. Blender 4.0 kan de gpu in principe gebruiken voor rendering, maar niet makkelijk met de huidige CUDA-driver onder Ubuntu 24.04.03 in de AArch64-versie. Dan hadden we Blender zelf moeten compileren vanaf de broncode, wat we te bewerkelijk vonden.
Gravitymark gaf een ruwe classificatie voor 3D-games, puur als vergelijking. De GB10-gpu haalt ongeveer de helft van de prestaties van een GeForce RTX 5070.
Bij onze tests verbruikte de DGX Spark maximaal iets minder dan 216 watt, inclusief de verliezen van de voeding. Terwijl de twee interne radiale ventilatoren in de ruststand fluisterstil blijven, zwengelen ze daarna aan tot een irritant luide 2,2 sone.
Conclusie
De DGX Spark, hier in de Gigabyte AI Top Atom-versie, is niet ontworpen voor maximale AI-prestaties. Het is een spannende doos voor AI-ontwikkelaars die willen programmeren voor Nvidia-versnellers. Beheerders kunnen ook leren hoe ze AI-modellen kunnen laten draaien met geoptimaliseerde Nvidia-tools in lokaal bedrijf.
De prijs van de DGX Spark wordt in perspectief geplaatst als je kijkt naar concurrenten die ook 128 GB RAM hebben. Bij Apple betaal je aanzienlijk meer en een HP Z2 Mini G1A kost 1000 euro minder, maar biedt geen supersnel Ethernet om twee apparaten met elkaar te verbinden.
Bovendien is CUDA alleen beschikbaar bij Nvidia. Nvidia moet nog werken aan de software voor de DGX Spark, maar het supportforum geeft antwoord op veel vragen.
| Eigenschap | Specificatie |
|---|---|
| Type | Compact AI-workstation met Linux |
| Aanbieder | Gigabyte |
| Processor | Nvidia/Mediatek GB10 (10× ARM Cortex-A925, max. 3,9 GHz, 10× ARM Cortex-A725) |
| GPU | Nvidia Blackwell, 48 Compute Units (6144 CUDA-cores) |
| RAM | 128 GB LPDDR5X-8533 (vastgesoldeerd) |
| SSD | 4 TB (M.2 2242, PCIe 5.0 x4, Samsung PM9E1/MZVLC4T0HBL1-00B07, verwisselbaar) |
| Wifi-adapter | Wi-Fi 7 / Bluetooth 5.4: Mediatek MT7925, 2,4 / 5 / 6 GHz, 2×2 (AzureWave AW-EM637) |
| Ethernet | 10 Gbit/s (RJ-45), Realtek RTL8127 (PCIe) |
| Ethernet (high-speed) | 2× 200 Gbit/s (QSFP), Nvidia Mellanox ConnectX-7 (2× PCIe 5.0 x4) |
| Aansluitingen achter | 1× HDMI, 4× USB-C 20 Gbit/s (USB 3.2 Gen 2×2), 1× RJ-45 (10GbE), 2× QSFP (200GbE) |
| Aansluitingen opzij | 1× Kensington-lock |
| Ventilatoren | 2× radiaalfans |
| Afmetingen | 15,1 × 5,1 × 18,5 cm (met USB-C-stroomkabel) |
| Gewicht | 1,22 kg |
| Bijgeleverd | USB-C-netvoeding Delta ADP-240KB BA (USB-PD EPR, 240 watt) |
| Besturingssysteem | Ubuntu 24.04.3 LTS (Noble Numbat, AArch64) |
| Energieverbruik (soft-off / idle) | 1,3 / 42 W |
| Energieverbruik (max. cpu / gpu) | 132 / 216 W |
| Bootduur | 36 s |
| Geluidsniveau (idle / gpu-belasting) | <0,1 / 2,2 sone |
| SSD-prestaties schrijven / lezen | 8,2 / 11,9 GB/s |
| SSD-prestaties IOPS (schrijven / lezen) | 386.000 / 556.000 IOPS |
| Geekbench 6.5.0 Preview (single / multi) | 3029 / 18.739 punten |
| GravityMark (Vulkan, 4K, 200k asteroïden) | 16.067 punten, 96,2 fps |
| Blender 4.0 Classroom (CPU) | 438 seconden |
| LLM-prestaties (GPT-OSS:120b / Qwen3-4b-2507) | 45 / 72 token/s |
| Prijs | € 4.300 |
Jan-Keno Janssen, Christof Windeck en Marco den Teuling
Praat mee