Logo

Watt Matters in AI: wat doet hardware voor energie-efficiëntie?

In aanloop naar de “Watt Matters in AI” conferentie: de huidige situatie, de maatschappelijke behoeften en de wetenschappelijke vooruitgang.

Published on April 12, 2025

Watt Matters in AI

Medeoprichter van Media52 en hoogleraar Journalistiek, bouwt aan IO+, events en Laio, met focus op commerciële kansen—en blijft schrijven voor IO+.

Onderzoekers pakken AI-gerelateerde uitdagingen op het gebied van energie-efficiëntie technologisch op twee fronten aan: door hardware-innovaties (het maken van energiezuinige, op het brein geïnspireerde computerapparaten en versnellers) en software-innovaties (het ontwikkelen van algoritmen en technieken om de rekenkosten van AI-modellen te verlagen). Daarnaast wordt volop gekeken naar gedragsverandering (denk aan ethische kaders, bedrijfsverantwoordelijkheid, betrokkenheid van gebruikers, beleidsontwikkeling en publieke bewustwording). Veel van deze vorderingen zijn gepubliceerd in toonaangevende tijdschriften en conferenties en zijn beschikbaar als open-access artikelen.

In dit artikel gaat het om de kansen aan de hardware-kant. We geven een overzicht van recent open-access onderzoek (2024-2025) dat zich richt op strategieën om de energie-efficiëntie van AI-hardware te verbeteren.

Watt Matters in AI banner

Watt doet ertoe in AI

Watt Matters in AI is een initiatief van Mission 10-X, in samenwerking met de Rijksuniversiteit Groningen, Universiteit Twente, Technische Universiteit Eindhoven, Radboud Universiteit en Convention Bureau Brainport Eindhoven. IO+ is verantwoordelijk voor marketing, communicatie en de organisatie van de conferentie.

Meer informatie op de website van de conferentie.

Neuromorfisch en op het brein geïnspireerd computergebruik

Een veelbelovende richting is geïnspireerd op de energie-efficiëntie van het menselijk brein, wat leidt tot neuromorphic computing. Neuromorfe systemen maken gebruik van spiking neuronen of analoge geheugenelementen om hersenprocessen na te bootsen, waardoor mogelijk grote efficiëntiewinst kan worden behaald ten opzichte van conventionele digitale chips. In een recent Nature Communications artikel (2024) werd een neuromorf hardwareplatform gedemonstreerd dat 2D materiaal tunnel FET's (veldeffect transistors) gebruikt om leaky-integrate-and-fire neuronen te implementeren. Door gebruik te maken van een nieuwe 2D-halfgeleider bereikte deze neuromorfe schakeling een twee orden van grootte hogere energie-efficiëntie in vergelijking met een standaard 7nm CMOS basislijn. Dit resultaat effent de weg naar “brain-like energy-efficient computing” met behulp van niet-traditionele apparaattechnologieën.

Een andere doorbraak in neuromorfische hardware maakte gebruik van memristors (resistieve geheugenapparaten) als kunstmatige synapsen. Weilenmann et al. (2024) bouwden een systeem met een enkele memristor per synaps dat meerdere synaptische functies kan emuleren (plasticiteit op lange en korte termijn, meta-leren) binnen één apparaat. Met behulp van deze multifunctionele memristors in een diep neuraal netwerk demonstreerden ze het spelen van Atari Pong met veel minder energie. Het energieverbruik van het memristieve netwerk was ongeveer 100× lager dan een soortgelijke GPU-gebaseerde implementatie. Dit toont aan dat neuromorfe hardware met hersenachtige synaptische dynamiek het energieverbruik voor AI-taken drastisch kan verlagen, “waardoor de toepasbaarheid van neuromorfe computers wordt verbreed” en de energiekosten van AI worden verlaagd.

AI energy hungry

Watt Matters in AI: op zoek naar energie-efficiënte AI

In aanloop naar de “Watt Matters in AI” conferentie: de huidige situatie, de maatschappelijke behoeften en de wetenschappelijke vooruitgang.

Onderzoekers verbeteren de neuromorfische efficiëntie ook door innovaties in het circuitontwerp. Een artikel van het npj Unconventional Computing 2024 introduceerde bijvoorbeeld adiabatische spiking neuron circuits die energie terugwinnen en hergebruiken. Door CMOS neuronen in een adiabatisch regime te laten werken (langzaam opladen/ontladen om dissipatie te minimaliseren), bereikte het ontwerp >90% energieterugwinningsefficiëntie en een 9× reductie in energie per spikingoperatie vergeleken met niet-adiabatische circuits. Deze adiabatische neuromorfische benadering laat zien hoe het combineren van op de hersenen geïnspireerde modellen met energiezuinige circuittechnieken ultra-efficiënt computergebruik oplevert.

Analoog en fotonisch computergebruik (op fysica gebaseerde AI)

Onderzoekers gaan verder dan digitale elektronica en kijken ook naar analoge, optische en andere op fysica gebaseerde computers om AI-modellen met veel minder energieverbruik te bouwen. Fotonische computers, die gebruik maken van licht in plaats van elektrische signalen, kunnen massaal parallelle bewerkingen uitvoeren met minimaal weerstandsverlies, wat enorme snelheids- en energievoordelen belooft. Dong et al. toonden in 2024 in Nature aan dat het gebruik van gedeeltelijk coherent licht (van goedkope LED's in plaats van lasers) in een optisch neuraal netwerk de verwerkingscapaciteit van computers kan verhogen zonder aan nauwkeurigheid in te boeten. Dit daagt de conventionele wijsheid uit dat lasers (zeer coherent maar energieverslindend) nodig zijn. Door “minder rigoureuze” lichtbronnen te gebruiken, maakten ze fotonische tensorkernen met hoge verwerkingscapaciteit mogelijk met eenvoudigere koeling en besturing, wat wijst op praktischere en energiezuinigere optische AI-hardware. Het gedemonstreerde systeem voerde inferentietaken uit (zoals het classificeren van handgeschreven cijfers en medische loopgegevens) met >90% nauwkeurigheid, door gebruik te maken van on-chip fotonische geheugens en modulatoren. Dit is een belangrijke stap in de richting van optische AI-processors die elektronica zouden kunnen overtreffen in snelheid en efficiëntie.

innovationorigins_an_AI_chip_that_however_powerful_keeps_its_en_3a2cdcc5-f26d-4977-a0f9-065eb6144fed.png

Deze chip verlaagt het AI-energieverbruik met 1000 keer

Een team van Amerikaanse onderzoekers heeft een chip ontwikkeld die het energieverbruik van AI drastisch kan verlagen.

Andere op fysica gebaseerde computerbenaderingen zijn onder andere Ising-machines en analoge circuits die optimalisatieproblemen oplossen of neurale netwerken berekenen in gespecialiseerde hardware. Onderzoekers hebben bijvoorbeeld oscillatorgebaseerde Ising-oplossers gebouwd met VO₂-apparaten die werken met een vermogen van een microwatt. Deze maken gebruik van fysische dynamica om oplossingen te vinden met minimale energie. Meer in het algemeen voeren analoge compute-in-memory (CIM) architecturen matrixbewerkingen direct uit in geheugenarrays (vaak met behulp van resistief geheugen of condensatoren), waardoor energie-intensieve gegevensverplaatsingen worden geëlimineerd. Een opmerkelijke vooruitgang eind 2024 was IBM's demonstratie van een 64-core analoog-digitaal hybride CIM-chip die bijna 40× hogere energie-efficiëntie bereikte bij neurale netwerkinferentietaken. Door analoge matrix-vermenigvuldigingseenheden (efficiënt maar gevoelig voor ruis) te combineren met digitale logica voor precisie, draaide de hybride “AnDi” architectuur een volledig YOLO-netwerk voor objectdetectie in hardware - de eerste keer dat een analoog CIM-systeem zo'n complexe taak aanpakte. Het resultaat was een energiereductie van 39,2× in vergelijking met conventionele digitale FP32-berekening, met slechts een minimaal verlies aan nauwkeurigheid, dankzij de slimme integratie van analoge berekeningen voor parallelle bewerkingen en digitale berekeningen voor de besturing. Dit werk (gepubliceerd in Nature Electronics, 2025) onderstreept het potentieel van mixed-signal AI-versnellers om het stroomverbruik te verminderen terwijl ze echte AI-werklasten dramatisch aankunnen.

Techxplore.com

Techxplore.com

Techxplore.com

Figuur: Een hybride analoog-digitaal compute-in-memory systeem (“AnDi”) voor neurale netwerkinferentie. De analoge memristor-arrays voeren energiezuinige matrixvermenigvuldigingen uit, terwijl digitale processors zorgen voor zeer nauwkeurige besturing. Deze dual-domain architectuur bereikte een 39× betere energie-efficiëntie voor YOLO-objectdetectie in vergelijking met een puur digitale aanpak.

Energiezuinige AI-versnellers en in-memory computing

Parallel aan neuromorfische en analoge paradigma's worden meer conventionele digitale versnellers geoptimaliseerd voor energie-efficiëntie. Technieken zoals verwerking in het geheugen (om kostbare gegevensoverdrachten te beperken), aangepaste datapadontwerpen en werking op laagspanning kunnen aanzienlijke energiebesparingen opleveren. Veel van deze versnellers putten inspiratie uit hersenachtige sparsity of event-driven processing, ook al zijn ze digitaal geïmplementeerd. Eén recent ontwerp gebruikte bijvoorbeeld een digitaal geheugen bij benadering in combinatie met CMOS-schakelingen om een sensorisch neuron-geïnspireerd systeem te implementeren voor op spikes gebaseerde signaalverwerking op het lichaam, wat energie-efficiënte bewaking mogelijk maakt (bijvoorbeeld een op spikes gebaseerde draagbare sensor).

606032b-AI-viruses.jpg

Kunstmatige intelligentie maakt 160.000 nieuwe virussoorten zichtbaar

De ontdekking van meer dan 160.000 nieuwe RNA-virussoorten wordt toegeschreven aan een samenwerking onder leiding van Alibaba Cloud, Sun Yat-sen University en The University of Sydney.

Een andere trend is computing near-memory: het integreren van AI-kernen met geheugenarrays (bijv. SRAM, ReRAM) om het verplaatsen van gegevens te minimaliseren. Recentelijk hebben prototypes van in-memory NN-versnellers veelbelovende resultaten laten zien. Wang et al. (Tsinghua Univ.) bouwden een op memristors gebaseerde CIM-module die, geëvalueerd op diepe netwerken, hoge precisie (2,7× beter dan eerdere analoge systemen) en enorme efficiëntiewinst opleverde. Dergelijke versnellers maken vaak gebruik van benaderende rekenprincipes op circuitniveau - bijvoorbeeld door gebruik te maken van rekenen met lagere precisie of analoge accumulatie - om energie te besparen.

Het afgelopen jaar zijn er meerdere real-chip demonstraties geweest van AI-versnellers met een laag stroomverbruik, van gespecialiseerde neuromorfische chips (event-driven spiking processors) tot hybride analoog-digitale NPU's (Neural Processing Units). Deze vooruitgang in hardware brengt ons dichter bij AI-platforms die grote prestatie-per-watt verbeteringen kunnen leveren, waardoor AI kan worden ingezet in omgevingen met een beperkt vermogen, zoals randapparaten en batterijgevoede systemen.

Watt Matters in AI

Watt Matters in AI is een conferentie die zich richt op het verkennen van het potentieel van AI met aanzienlijk verbeterde energie-efficiëntie. In de aanloop naar de conferentie publiceert IO+ een reeks artikelen die de huidige situatie en mogelijke oplossingen beschrijven. Tickets voor de conferentie zijn te vinden op wattmattersinai.eu.

View Watt Matters in AI Series

Disclaimer: Bij het vinden en analyseren van relevante studies voor dit artikel is gebruik gemaakt van kunstmatige intelligentie.