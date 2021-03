Na acht jaar trouwe dienst komt op 1 juli een einde aan het werkzame leven van Cartesius, de nationale supercomputer voor wetenschappelijk onderzoek. De verouderde computer wordt opgevolgd door Snellius, genoemd naar de Leidse hoogleraar en wiskundige (1580-1626). De geheel nieuwe supercomputer, van zo’n twintig miljoen euro, wordt tien keer sneller dan zijn voorganger. Daarmee moeten Nederlandse wetenschappers in ieder geval de komende vijf jaar vooruit kunnen.

Doorrekenen van klimaatmodellen, weersverwachtingen, simulaties van het vouwen van eiwitten, onderzoek naar patronen in grote hoeveelheden tekst, naar genetica of machine learning om Covid-19 te diagnosticeren op basis van röntgenfoto’s. Zomaar wat voorbeelden van de circa tweehonderd Nederlandse onderzoeken die jaarlijks een beroep doen op de immense rekenkracht van de nationale supercomputer van SURF, de gezamenlijke IT-organisatie van onderwijs- en onderzoeksinstellingen.

Cartesius was eigenlijk al lang aan vervanging toe, zegt Walter Lioen, manager Research Services bij SURF. „Je moet een supercomputer vergelijken met een heel zware desktopcomputer. Je kan zo nu en dan een onderdeel vervangen, maar als je van de laatste generatie processors en videokaarten gebruik wil maken, zul je op een gegeven moment echt het moederbord moeten vervangen. Eigenlijk is dan alleen de behuizing nog bruikbaar. Na vijf jaar is zo’n machine technologisch verouderd en achterhaald.” De oudste processoren in Cartesius stammen uit 2013. En de wet van Moore dicteert dat de technologische vooruitgang oudere techniek in rap tempo overbodig maakt. „Voor dezelfde investering koop je nu veel meer rekenkracht”, zegt Lioen.

Intel-oprichter Moore voorspelde in 1965 dat de hoeveelheid transistors op een chip iedere twee jaar zal verdubbelen. De rekenkracht groeit daardoor ook. „Als je kijkt naar de ontwikkelingen van supercomputers in Nederland is die groei wel aan het afvlakken, maar we volgen de wet nog grotendeels. Dit is de zevende generatie supercomputer in Nederland. Zet je die rekenkracht in een grafiek, dan zie je daar echt die verdubbelingen in”, vertelt Lioen in het kantoor van SURF op het Amsterdam Science Park. De Amsterdam Data Tower torent boven de rest van de gebouwen uit. Dat commerciële datacentrum huist Cartesius en straks ook Snellius. „Een datacentrum in een datacentrum.”

Lioen (61) heeft het grootste deel van zijn werkende leven op of rond supercomputers doorgebracht. In de jaren tachtig eerst als gebruiker toen hij werkte als wetenschappelijk programmeur bij het Centrum Wiskunde & Informatica (CWI) in Amsterdam. Later ging hij bij SARA werken, de Stichting Academisch Rekencentrum Amsterdam, waar de eerste ‘supers’ ondergebracht werden. „Voor mijn gevoel ging ik terug naar mijn roots.”In 2013 werd de stichting onderdeel van SURF.

De eerste supercomputer in 1984 was niet meer dan dat: één heel snelle en grote computer. Namen hadden de computers toen nog niet, vertelt Lioen. Hij werd genoemd bij zijn merknaam, de Cyber 205. „Hij was tien tot honderd keer sneller dan het grootste mainframe dat je destijds kon kopen. Je kon er ongelofelijk veel meer rekenwerk op doen, niet alleen sneller maar ook met meer geheugen. Berekeningen konden groter worden en nauwkeuriger.”

Netwerk van vele machines

Tegenwoordig is een supercomputer een netwerk van vele machines, die allemaal nauw samenwerken. „Het zijn in feite allemaal onafhankelijke computers, één grote cluster van rekeneenheden. Met als verschil dat er geen normaal internet of ethernetnetwerk tussen zit, maar een speciaal netwerk dat vele malen sneller is.”

Dat cluster vreet allerlei wetenschappelijke problemen. Via de NWO kunnen onderzoekers ‘rekentijd’ aanvragen, uitgedrukt in ‘core-uren’ – hoeveel uren de processoren naar verwachting moeten draaien om het probleem te kraken. Zo’n duizend onderzoekers hebben op die manier toegang tot Cartesius. Vanwege de grote capaciteit van de supercomputer worden onderzoeken dikwijls naast elkaar uitgevoerd. Hoewel sommige onderzoekers makkelijk alle rekenkracht kunnen benutten, staat de supercomputer de gehele Nederlandse wetenschap ten dienste, zegt Lioen. Eén onderzoek mag niet meer dan 10 procent van de jaarcapaciteit in beslag nemen. De agendaplanning is complex. „Sommige onderzoekers gebruiken misschien een kwart van het systeem, soms tien of soms één node, maar draaien dan verschillende simulaties tegelijkertijd.” Het doel van de planning is de rekenopgaven zo bij elkaar te zoeken dat de capaciteit optimaal benut wordt. De gemiddelde bezetting van Cartesius is volgens Lioen zo’n 80 procent.

Je ontploft in feite in de hoeveelheid rekenwerk. Dat past niet in één computer Walter Lioen manager SURF

Onderzoekers rekenen via de supercomputer vaak aan ingewikkelde modellen, met veel verschillende variabelen. Lioen geeft het voorbeeld van een weersvoorspelling. Dat is in de basis een simpel systeem dat met een handvol variabelen als luchtdruk, temperatuur, windrichting en windsnelheid iets probeert te zeggen over het weer over enkele dagen. „Dat model wordt dan beschreven door een serie wiskundige vergelijkingen. Die kan je dan proberen op te lossen met pen en papier, zoals je op de middelbare school leerde. Maar deze vergelijkingen zijn zo ingewikkeld dat je daar geen analytische oplossing meer voor kan gaan berekenen. Je kan die oplossing alleen maar benaderen op de computer.”

In de praktijk werken weersimulaties namelijk niet met een handvol parameters. „Je hebt het zo over tweehonderd verschillende variabelen. Over hoe het aardoppervlakt eruit ziet, welke dag- en nachtritmes er zijn… zee, water, ijs… Chemische reacties die in de atmosfeer plaatsvinden. Wolken, regen – verzin het allemaal maar. Het gaat zelfs tot en met het zoutgehalte van het zeewater aan toe. Dan krijg je een veel complexer stelsel van vergelijkingen. Je ontploft in feite in de hoeveelheid rekenwerk. Dat past niet in het geheugen van één computer.”

Opgeknipt en verdeeld

En dus wordt het rekenwerk opgeknipt en verdeeld over de verschillende computers in het cluster. „Je rekent op een deel van je data en communiceert de resultaten met andere computers in het netwerk; daarna kunnen alle computers verder rekenen. Daarom is dat speciale interne netwerk zo van belang om de vertraging zo klein mogelijk te houden. Vaak zie je daar een soort cadans ontstaan van rekenen en communiceren en rekenen en communiceren.”

Onderzoekers willen altijd meer rekenkracht. „Dat is eigenlijk de enige beperkende factor. Er kunnen altijd meer variabelen in een model, of je kan de nauwkeurigheid vergroten. Vroeger maakte je een weersvoorspelling voor blokken van dertig kilometer. Nu maak je misschien blokken van anderhalve kilometer.” Door supercomputers kunnen klimatologen betrouwbare uitspraken doen over het klimaat ver in de toekomst. „Je kan het zien als een weersvoorspelling, maar dan geen dertig dagen vooruit maar honderd jaar. Daarvoor wordt onze supercomputer onder andere gebruikt.”

Op 1 juli moet de nieuwe supercomputer operationeel zijn en wordt Cartesius ontmanteld. Als Snellius helemaal af is, zal zijn rekenkracht tien keer hoger liggen dan die van zijn voorganger. De vervanging is geen kwestie van kasten (‘racks’) met computers omwisselen in het datacentrum. Een zo’n rack weegt 1.400 kilo en vraagt tussen de 40 tot 80 kilowatt aan stroom. „Het zijn letterlijk zware jongens. En ze zijn ook watergekoeld.” De supercomputer genereert zoveel warmte dat luchtkoeling niet voldoende is, zegt Lioen. „Als je dat zou proberen zouden die cpu’s ongeveer smelten.” Snellius zal naar verwachting anderhalve megawatt vereisen.

Optellen, aftrekken, delen

Ook deze supercomputer zal op termijn weer vervangen moeten worden. De financiering – subsidies van het ministerie van Onderwijs, Cultuur en Wetenschap en bijdragen van de gebruikers – voor de volgende supercomputer is vorig jaar al geregeld, zegt Lioen. Tot die tijd zal Snellius nog twee keer een upgrade krijgen. Halverwege volgend jaar komt er een significante uitbreiding van de rekenkracht met de volgende generatie chips van AMD die nu nog niet op de markt zijn. Een jaar later kan SURF kiezen om extra videokaarten aan het systeem toe te voegen, meer opslagruimte, of nog meer normale processoren. „Afhankelijk van die keuze zullen we uiteindelijk eindigen op 13,6 of 21,5 petaflops.” Flops staat voor floating point operations per second, zoals een getal optellen, aftrekken, delen en vermenigvuldigen. Eén petaflops is een biljard berekeningen. Cartesius heeft een snelheid van 1,8 petaflops.

De nationale supercomputer is straks state-of-the-art en maakt gebruik van de laatste chips en technologie. De lijst van de snelste 500 supercomputer zal Snellius naar verwachting wel halen, maar waar hij zal eindigen is nog niet bekend. Cartesius stond in juni 2019 voor het laatst in de top-500. Uiteindelijk is het ook een kwestie van hoe diep de financiers in de buidel willen tasten, zegt Lioen. Een supercomputercluster is makkelijk uit te breiden met nog meer rekeneenheden. De Japanse supercomputer Fugaku voert sinds november de lijst aan met een rekenkracht van bijna 442 petaflops. Men schat het prijskaartje op een slordige 800 miljoen euro.

De opkomst van supercomputers in de cloud – rekenen op computers in datacentra van Google, Microsoft of bijvoorbeeld Amazon – zal de nationale supercomputer op korte termijn nog niet overbodig maken. Rekentijd huren is nog erg duur en zolang Snellius goed bezet blijft, is het goedkoper om zelf te investeren, becijferde Lioen. „Voor grootschalige berekeningen zul je ook terabytes aan data moeten transporteren naar zo’n cloudprovider en de resultaten op moeten halen. Dan betaal je niet alleen voor de rekentijd maar ook voor het datatransport.” Bij gebruik van Snellius zijn die gegevens direct voorhanden op speciale dataopslagsystemen. Transport is via het netwerk van SURF ook razendsnel. „Dat is een onderscheidend iets. Maar voor hetzelfde geld is het straks wel efficiënter om supercomputing in de cloud te doen. Ik durf nooit verder te kijken dan een jaar of vijf.”