Chaos in datacenters na slordige updates van Intel

Cybersecurity

Intel slaat de plank mis met de reparatie van onveilige processoren. Clouddiensten worstelen daarom met de upgrades van hun servers.

De ernstige ontwerpfouten die ontdekt zijn in processors van Intel worden zo slordig gerepareerd dat klanten wordt afgeraden updates te installeren. Foto Aaron M. Sprecher/Bloomberg

Normaal gesproken is het devies bij veiligheidsproblemen: zo snel mogelijk updaten. Maar de ernstige ontwerpfouten die ontdekt zijn in processors van onder meer Intel worden te slordig gerepareerd. Zo slordig, dat Intel zijn klanten voorlopig afraadt om updates te installeren. Het zou kunnen leiden tot uitvallende systemen en onvoorspelbaar gedrag van de computer, maakte de chipmaker deze week bekend. Een update van de update is wel in de maak, belooft de fabrikant.

Desondanks zei de fabrikant donderdag bij de presentatie van de jaarcijfers in 2018 een recordomzet te verwachten van 65 miljard dollar. In 2017 steeg de omzet al naar 62,8 miljard dollar. Door een eenmalige last van 5,4 miljard dollar te nemen vanwege de belastingmaatregelen van president Trump daalde de nettowinst naar 9,6 miljard dollar.

Begin deze maand kwam aan het licht dat vrijwel alle Intel-processoren van de afgelopen decennia te hacken zijn. De kwetsbaarheden – ze zijn Spectre en Meltdown gedoopt – zitten ook in chips van andere fabrikanten. Maar voor datacenters zijn vooral Intels processoren van belang, omdat die in bijna elke server te vinden zijn.

Datacenters bieden onderdak aan de servers van providers, dienstverleners die op hun beurt voor zakelijke klanten software, computerkracht en opslagruimte op afstand regelen. Deze providers zijn de belangrijkste afnemers van servers met snelle processoren – vrijwel allemaal Intel.

Verlies aan rekenkracht

De kwetsbaarheden betreffen een trucje waarmee data extra snel in het tijdelijke geheugen in de kern van de chip worden opgeslagen. Dat geheugen blijkt echter niet goed beveiligd. Door het trucje uit te schakelen (dat is de enige mogelijke reparatie), verliest de processor aan rekenkracht. Voor gemiddelde gebruikers levert dat weinig overlast op, maar in de cloud ligt de lat hoger. Providers moeten meer machines inschakelen of de digitale werklast anders verdelen.

Er blijken grote fouten te zitten in de chips van bijna alle pc’s en smartphones. Zeven vragen over ‘Spectre’ en ‘Meltdown’.

Grote publieke cloudleveranciers als Amazon, Microsoft en Google (waar je rekenkracht per minuut kunt ‘huren’) konden hun maatregelen al nemen voordat het nieuws over Spectre en Meltdown openbaar werd. Maar kleinere of lokale hosting- en cloudproviders, ook in Nederlandse datacenters, moeten zich nu nog aanpassen. Hetzelfde geldt voor bedrijven die hun eigen servers draaien, bijvoorbeeld met Microsoft-software.

Al roemde Intel-topman Brian Krzanich onlangs de gemeenschappelijke aanpak van dit ernstig veiligheidsprobleem, de update verloopt verre van vlekkeloos. ‘Patches’ – letterlijk pleisters – zitten elkaar in de weg en laten systemen ongewenst herstarten en fabrikanten publiceren updates te vroeg.

Dell en HP, de grootste serverfabrikanten, verwijzen naar Intel. „Niemand heeft overzicht”, zo vat Simon Besteman, directeur van ISPconnect, de branchevereniging van hosting- en cloudproviders, de kritiek samen.

Technisch directeur Stefan Ideler van hosting provider i3D.net uit Rotterdam noemt de situatie „verre van ideaal”. En, zegt hij: „Dit is niet de eerste chaotische update die we meemaken.” Wel zijn volgens Ideler de problemen minder acuut dan in 2014, toen een softwarefout, ‘Heartbleed’, het veilige verkeer naar websites bedreigde. „Dat was meteen code rood.”

Bij i3D worden de servers waarop veeleisende toepassingen draaien – met name online schietspellen voor PlayStation of Xbox – nog niet geüpgraded. De reden: online gaming vergt veel rekenkracht en de update vertraagt de processor. „Deze toepassingen draaien op aparte computers die niet gedeeld worden met anderen. Ze zijn niet kwetsbaar voor de geheugenlekken”, aldus Ideler.

Servers waarop verschillende virtuele systemen draaien, typisch voor een clouddienst, of die websites hosten, moeten wel zo snel mogelijk gerepareerd worden. Zelfs al zorgt dat voor een terugval in prestaties.

Een schadevergoeding, daarover wil Ideler nog niet over nadenken. „Ik denk dat de imagoschade al genoeg doet. Wij zullen in de toekomst zeker ook kijken naar systemen met andere processoren dan die van Intel.”

Normaal gesproken gaan processoren in een datacentra drie tot vijf jaar mee, daarna moeten ze vervangen worden. Het sommetje is simpel: als de processors 10 of 20 procent minder presteren, moeten de cloud providers 10 of 20 procent meer servers kopen. In de VS zijn de eerste claims tegen Intel al ingediend. In Nederland willen cloud providers eerst de problemen oplossen en dan in de kleine lettertjes van de contracten duiken, zegt Simon Besteman van ISPConnect.

KPN is een van de grotere aanbieders van clouddiensten in Nederland en bevestigt de terugval in rekenkracht waar die de hele industrie treft. Jaya Baloo, hoofd informatiebeveiliging: „Het updaten is complex omdat de patch per systeem anders uit kan pakken. Dat kan weer andere problemen veroorzaken.” Volgens haar is de huidige situatie te danken aan de beperkte aansprakelijkheid van hardware- en softwareleveranciers. Ze zijn niet verantwoordelijk voor een foutloos product. „Chipbouwers letten vooral op functionaliteit en snelheid, veiligheid is helaas vaak ondergeschikt.”

Baloo vindt het een gemiste kans dat NIS, een nieuw Europees plan om cybersecurity te verbeteren, nog geen aansprakelijkheid legt bij de leveranciers van hardware en software. „Het is toch raar dat we hier met een relatief klein team ethische hackers bij KPN nog fouten halen uit producten van ’s werelds grootste fabrikanten? Dat moeten ze zelf testen.”

    • Marc Hijink