Het Europese SustainML-project was bedoeld om een innovatief ontwikkelingskader te ontwikkelen dat AI-ontwerpers kan helpen het stroomverbruik van hun toepassingen te verminderen. De enorme omvang van datasets en het aantal berekeningen dat nodig is om Machine Learning-algoritmen te trainen, resulteert in een enorme cloudserver-workload met een aanzienlijke ecologische voetafdruk. Het Europese SustainML-project was bedoeld om een innovatief ontwikkelingskader te bedenken dat AI-ontwerpers kan helpen het stroomverbruik van hun applicaties te verminderen, zegt het Franse onderzoeksinstituut Inria in een persbericht.
Volgens een studie gepubliceerd in het tijdschrift Nature stoot een alledaags trainingsmodel dat in 2019 werd gebruikt voor natuurlijke taalverwerking 300.000 kg CO2 uit, het equivalent van 125 retourvluchten tussen New York en Peking. Vijf jaar later omarmen alle sectoren van de samenleving nu gretig diepe neurale netwerken, en naarmate kunstmatige intelligentie tot ongekende proporties groeit, neemt ook de tol op de planeet toe. In het licht hiervan is het belangrijkste doel van het Europese project SustainML om een raamwerk te creëren dat het voor AI-ontwerpers gemakkelijker maakt om rekening te houden met het energieverbruik van hun Machine Learning-applicaties terwijl ze deze ontwikkelen. Janin Koch, wetenschapper van het Ex-Situ-projectteam van het Inria Saclay Centre, gaat meer specifiek in op hoe Human-Computer Interaction (HCI) kan worden ingezet om AI-ontwerpers te helpen bij het nemen van meer duurzame beslissingen gedurende de gehele ML-levenscyclus en om het bewustzijn van de kosten-baten afweging achter elk van deze keuzes te vergroten. Het project is gestart in oktober 2022 en omvat onder meer Inria.
Kwantificering van de CO2-impact achter machine learning-modellen
Het project omvat verschillende onderzoeksgebieden. Een hoeksteenaspect is de kwantificering van de milieu-impact van algoritmen en, meer precies, van de gevolgen van elke beslissing die gedurende de ML-levenscyclus wordt genomen. Als u er bijvoorbeeld voor kiest om een ML-model te trainen in een cloud faciliteit die afhankelijk is van niet-fossiele hernieuwbare waterkracht, in tegenstelling tot een datacenter dat wordt aangedreven door een kolencentrale, zal dit duidelijk een groot verschil maken in de hoeveelheid koolstof die wordt uitgestoten. Dat is echter niet het einde van het verhaal. “Het is een veel breder probleem dan alleen het uitkiezen van een schone cloud”, aldus Janin Koch. Het is eigenlijk een kwestie van heroverwegen wat we echt nodig hebben. “De trend in de AI-gemeenschap is om te zeggen: hoe meer data, hoe complexer het model, hoe beter de uiteindelijke resultaten. "Wat tot op zekere hoogte niet geheel ongegrond is, zeker als het om complexe problemen gaat. Veel applicaties vereisen echter niet noodzakelijkerwijs dit niveau van nauwkeurigheid of dit gegevensvolume." Dus voordat we zelfs maar aan een AI-project beginnen, moeten wetenschappers zich afvragen: 'Wat heb ik echt nodig?' Zijn er duurzamere alternatieven die minder gegevens nodig hebben of minder looptijd vereisen? Kan ik, in plaats van grote hoeveelheden gegevens te verzamelen, niet gewoon bestaande datasets hergebruiken/hergebruiken die beschikbaar zijn? Moet ik een model helemaal opnieuw maken en trainen, of kan ik een model hergebruiken dat al beschikbaar is in coderepository's? Is het echt nodig om mijn model lange tijd te laten draaien? “Uiteindelijk gaat het niet alleen om het verbeteren van een algoritme, maar ook om het verbeteren van de gehele levenscyclus van de applicatie.”
Mensgericht interactief raamwerk
Naast het vergroten van het bewustzijn over afwegingen op het gebied van duurzaamheid, wil het project een interactieve tool creëren om ontwikkelaars te helpen duurzamere beslissingen te nemen in elke fase van het ontwikkelingsproces. En hier komt de bijdrage van Koch om de hoek kijken. “Mijn onderzoeksgebied is mens-computer interactie. Ik ben geïnteresseerd in hoe mensen en systemen kunnen samenwerken om nieuwe ideeën te verkennen. HCI omvat zowel hoe gebruikers hun doelen aan een systeem kenbaar maken, als hoe systemen suggesties doen en deze iteratief uitleggen.”
“In de context van dit project betekent dit: wat weten ontwikkelaars voordat ze aan een project beginnen en hoe kunnen ze het algemene doel van een systeem omschrijven? " Dit kan soms nogal vaag zijn. Daarom bekijken we hoe systemen kunnen helpen bij het bepalen wat er nodig is om een bepaald doel te bereiken en welke benaderingen hiervoor geschikt zijn.“ Om zo'n tool te laten werken, moet het de gebruiker kunnen uitleggen hoe een beslissing tot stand komt, hoe een conclusie wordt getrokken, hoe een beperking wordt afgedwongen. “Dit proces is eigenlijk best uitdagend." Als een algoritme beweert dat een bepaalde beslissing 80% beter is, wat betekent dat dan voor de gebruiker? Zo begrijpen mensen de dingen niet". In plaats daarvan stelt ze voor om uitleg binnen de doelstellingen van het project en het proces van de gebruiker in een context te plaatsen, om deze uitleg meer betekenis te geven.
Het SustainML-project zal naar verwachting een aanzienlijke impact hebben op de zogenaamde "democratisering van groene AI", waardoor niet alleen techreuzen, maar ook kmo's, particuliere enthousiastelingen, ngo's en individuele innovators AI op een duurzamere manier kunnen ontwikkelen.
Dit artikel verscheen eerder in Innovation Origins.