Campus

Het dilemma van de supercomputer

Het college van bestuur startte begin deze maand besprekingen met Cray Research over de aanschaf van een massaal parallelle supercomputer. De aankoop zou in overeenstemming zijn met landelijke HPCN-plannen en een redelijke kans maken op medefinanciering door NWO.

Of met de ‘gebruiksvriendelijke’ Cray T3 ook de Delftse expertise op het gebied van parallel rekenen zal groeien, hangt vooral af van het gebruik van de apparatuur. Intussen beschikt de faculteit TWI al enige tijd over een MPP (massively parallel processing) machine en dreigt daarbij opgebouwde ervaring onbenut te blijven.

Woordvoerders van Cray zijn nog steeds uiterst terughoudend over de ‘mogelijke aankoop van een MPP-systeem door de Delftse universiteit.’ C. Stork van de Rijswijkse vestiging van het bedrijf kan wel onthullen dat de TU geïnteresseerd is in ‘de opvolger van de T3D’, het huidige topmodel, dat in zijn grootste configuratie een pieksnelheid van 300 Gigaflops haalt (zie ‘Teratechnologie’). Het jongste broertje van de T3D moet ruwweg drieënhalf keer zo snel worden.

De intentieverklaring die het cvb deze maand naar Cray stuurde vermeldt als noodzakelijke voorwaarden voor een overeenkomst het beschikbaar stellen van 1,5 miljoen gulden door zowel de universiteitsraad als NWO-NCF (de stichting Nationale Computerfaciliteiten is onderdeel van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek).

Volgens drs. J. de Kleuver, secretaris van de NWO-NCF-dwarsverbandcommissie Massaal Parallel Rekenen (MPR), gonst het al maanden van de geruchten over de supercomputerplannen van de TU, maar heeft de commissie nog geen verzoek om een bijdrage ontvangen. De Kleuver wil daarom niets zeggen over de kans die een Delftse aanvraag zou maken. Van de vier miljoen gulden die NWO en NCF voor HPCN-hardware kunnen uitdelen, resteert nog twee miljoen. Eerder dit jaar subsidieerde de commissie aankopen van de universiteiten van Groningen en Amsterdam.
Ervaring

NWO wil graag dat een aantal Nederlandse universiteiten met een traditie in grootschalig rekenen experimenteert met verschillende parallelle supers. In dat streven zou een T3 in Delft goed passen, denkt prof.dr. L.O. Hertzberger, hoogleraar bij de vakgroep Computersystemen van de Universiteit van Amsterdam en lid van de MPR-commissie.

Wel vraagt Hertzberger zich af of de Delftse plannen voldoende aandacht geven aan de opbouw van ‘parallelle’ ervaring. De keuze voor de T3 suggereert dat de computer vooral als ingenieursinstrument zal worden ingezet, en niet noodzakelijk als studie-object.

Werken met een parallelle rekenmachine is niet eenvoudig, maar de megacalculator van Cray komt programmeurs een beetje tegemoet. Doordat het lijkt alsof het geheugen ongedeeld is -de T3 werkt met virtual shared memory – zijn programma’s voor traditionele computers makkelijker om te zetten naar de super. In Crays jongste rekenmonster zouden de Delftse onderzoekers niet alleen over buitengewoon krachtig gereedschap beschikken, ze zouden er ook direct mee aan de slag kunnen.

Dat is voordelig voor lokale power users, maar leidt niet per se tot grotere kennis van MPP-technologie. De samenstelling van de HPCN-kerngroep – vertegenwoordigers van de harde rekenaars onder de vakgroepen – ondersteunt Hertzbergers verwachting dat de Delftse supercomputer in de eerste plaats als rekenhulp zal worden benut. ,,De T3 maakt misschien lui”, waarschuwt de supercomputerprof.

Hertzberger: ,,Die engineering-toepassingen zijn niet zo lastig. Een veel grotere uitdaging is bijvoorbeeld parallelle verwerking van databases. Voor zulke nieuwe toepassingen is veel kennis van zaken nodig.”

,,Uiteindelijk moet je toch naar nieuwe algoritmen toe”, meent Hertzberger, ,,Je moet parallel leren denken.” Dat ligt ook besloten in de doelstellingen van het Delftse High Performance Computing & Networking-initiatief. Volgens het in 1994 verschenen rapport ‘Technisch HPCN-centrum Delft’ heeft de TU Delft ‘een belangrijke rol te vervullen in de adaptatie van de HPCN-technologie voor (commerciële) toepassingen.’ De grootste uitdaging daarbij is het leren werken met parallelle apparatuur. Maakt de TU zich met de comfortabele Cray niet te gemakkelijk van haar voornemens af?

,,Om een top-universiteit te zijn, is het nu eenmaal nodig dat een aantal groepen over dit soort apparatuur beschikt”, vindt rector magnificus prof.ir. K.F. Wakker, lid van de HPCN-kerngroep. ,,Op het moment dat de faciliteit er is, zullen er vanzelf andere groepen bij betrokken raken.”

Een gebruikersraad zal beoordelen welk onderzoek voor de super in aanmerking komt. De aankoop is niet in eerste instantie bedoeld als centrale rekenfaciliteit, aldus Wakker.
Operationeel

Terwijl het college van bestuur met Cray Research onderhandelt over de aanschaf van een T3, doet Technische Wiskunde en Informatica al enige tijd ervaring op met een massaal parallelle machine. High Performance Computing-experts van de vakgroep Technische Informatica waren nauwelijks betrokken bij de voorbereidingen van de HPCN-kerngroep.

,,Ja, hij is helemaal operationeel”, bevestigt prof.dr.ir. E.J.H. Kerckhoffs, van de groep Kennisgestuurde systemen, boven het geluid van een batterij ventilators op de blauwzwarte kast. Begin juli werd een nCube-supercomputer met 64 processors in gebruik genomen. Diverse leerstoelen bij Informatica maken deel uit van een onderzoeksconsortium dat werkt aan het gebruik van grote databases op massaal parallelle systemen. De groep, geleid door de ING-bank, ontvangt subsidie van de landelijke initiatiefgroep HPCN, die net als NWO met ministerieel geld geavanceerde computerprojecten financiert.

Toen het rekencentrum de plaatselijke belangstelling voor een HPCN-centrum inventariseerde, stond er bij Informatica al een kleiner model nCube. In een vroeg stadium waren de informatici dan ook aanwezig bij de besprekingen, ,,maar op een gegevenmoment hield dat op”, vertelt Kerckhoffs. ,,Van het rekencentrum hoorden we opeens niets meer. Ik weet niet waarom.”

Kerckhoffs constateert dat de HPCN-kerngroep, die het college van bestuur adviseert, erg eenzijdig is samengesteld. ,,De groep bestaat uit puur numerieke gebruikers. Ontwikkelaars komen er niet aan te pas.”

Heeft het Delftse eilandenrijk straks twee HPCN-centra? ,,Daar lijkt het wel helaas wel op”, verzucht Kerckhoffs. ,,Het gaat me niet zozeer om de hardware, maar om hoe zoiets tot stand komt. Dat een stuk aanwezige expertise links is blijven liggen.”

Het is niet te laat om de kerngroep uit te breiden met mensen die uit de parallelle hoek komen, vindt hij. ,,De in Delft aanwezige kennis en hardware kunnen in één HPCN-infrastructuur worden ondergebracht.” Kerckhoffs’ groep wacht de ontwikkelingen echter niet af. Ook de nCube is beschikbaar voor onderzoekers die ervaring willen opdoen met parallel rekenen.

Teratechnologie voor grote uitdagingen


Figuur 1 TWI’s nCube is al beschikbaar

In de technische wetenschappen wordt een aantal zogenoemde grand challenges onderkend. Voor deze problemen bestaat in principe een oplossingsstrategie, die voor adequate uitvoering echter een forse verbetering van de huidige computercapaciteit vergt. Visualisatie van klimaatverandering, hersenactiviteit en vloeistofturbulentie, zoeken en interpreteren van data in omvangrijke gegevensbanken, ontwerp van complexe geneesmiddelen en modellering van halfgeleiders – bij allerlei onderzoek is er een toenemende behoefte aan superkrachtige computers.

De heilige graal van High Performance Computing & Networking is samen te vatten in drie T’s: een verwerkingssnelheid van een Teraflops – tien tot de twaalfde floating point operations per seconde, geheugens van een of meer Terabytes, en datacommunicatiesnelheden in de orde van een Terabit/seconde. Deze kentallen zijn een factor tien tot duizend groter dan die van hedendaagse supers.

De laatste jaren heeft het geloof postgevat dat alleen parallelle computers in aanmerking komen voor de Teraflops-trofee. In een Massively Parallel Processing-machine werken vele processors samen aan hetzelfde karwei. De techniek maakt een duidelijke opgang in het grote rekenwerk. Vorig jaar stond in de Gordon Bell-lijst van ’s werelds snelste computers voor het eerst een massaal parallelle computer bovenaan. De opvolger van Crays T3D moet, in zijn grootste uitvoering, door de Teraflops-barrière kunnen breken.

Parallel rekenen gaat echter gepaard met nieuwe vormen van hoofdpijn. Het aanpassen van bestaande software en ontwerpmethoden aan de complexe architectuur is moeilijk; bovendien leent niet elk probleem zich even goed voor de parallelle aanpak. Volmaakt parallelliseerbare algoritmen kunnen elke beschikbare processor benutten, maar een machine met veel processors is onhandelbaar voor de ‘gewone’gebruiker. MPP-computers zijn daarom vaak een compromis tussen snelheid en gebruiksgemak.

Cray Research en nCube behoren tot de weinige bedrijven die in staat zijn om een min of meer algemeen inzetbare MPP-computer te maken. Beide fabrikanten maken ‘schaalbare’ supers – de koper kan het systeem uitbreiden als zijn capaciteitsbehoefte en z’n greep op het parallellisme groeien.

Van groot belang daarbij is dat de communicatiepaden tussen het toenemend aantal processors niet verstopt raakt. De namen T3 – 3-dimensionale torus – en nCube verwijzen naar alternatieve communicatiestructuren, die beide enorme hoeveelheden dataverkeer tussen een ontzagwekkend aantal chips mogelijk maken. Crays grootste T3 telt 2048 verwerkingseenheden, de nCube bij TWI kan tot 8192 processors bevatten. (G.J.t.D.)

Ger-Jan te Dorsthorst

Het college van bestuur startte begin deze maand besprekingen met Cray Research over de aanschaf van een massaal parallelle supercomputer. De aankoop zou in overeenstemming zijn met landelijke HPCN-plannen en een redelijke kans maken op medefinanciering door NWO. Of met de ‘gebruiksvriendelijke’ Cray T3 ook de Delftse expertise op het gebied van parallel rekenen zal groeien, hangt vooral af van het gebruik van de apparatuur. Intussen beschikt de faculteit TWI al enige tijd over een MPP (massively parallel processing) machine en dreigt daarbij opgebouwde ervaring onbenut te blijven.

Woordvoerders van Cray zijn nog steeds uiterst terughoudend over de ‘mogelijke aankoop van een MPP-systeem door de Delftse universiteit.’ C. Stork van de Rijswijkse vestiging van het bedrijf kan wel onthullen dat de TU geïnteresseerd is in ‘de opvolger van de T3D’, het huidige topmodel, dat in zijn grootste configuratie een pieksnelheid van 300 Gigaflops haalt (zie ‘Teratechnologie’). Het jongste broertje van de T3D moet ruwweg drieënhalf keer zo snel worden.

De intentieverklaring die het cvb deze maand naar Cray stuurde vermeldt als noodzakelijke voorwaarden voor een overeenkomst het beschikbaar stellen van 1,5 miljoen gulden door zowel de universiteitsraad als NWO-NCF (de stichting Nationale Computerfaciliteiten is onderdeel van de Nederlandse Organisatie voor Wetenschappelijk Onderzoek).

Volgens drs. J. de Kleuver, secretaris van de NWO-NCF-dwarsverbandcommissie Massaal Parallel Rekenen (MPR), gonst het al maanden van de geruchten over de supercomputerplannen van de TU, maar heeft de commissie nog geen verzoek om een bijdrage ontvangen. De Kleuver wil daarom niets zeggen over de kans die een Delftse aanvraag zou maken. Van de vier miljoen gulden die NWO en NCF voor HPCN-hardware kunnen uitdelen, resteert nog twee miljoen. Eerder dit jaar subsidieerde de commissie aankopen van de universiteiten van Groningen en Amsterdam.
Ervaring

NWO wil graag dat een aantal Nederlandse universiteiten met een traditie in grootschalig rekenen experimenteert met verschillende parallelle supers. In dat streven zou een T3 in Delft goed passen, denkt prof.dr. L.O. Hertzberger, hoogleraar bij de vakgroep Computersystemen van de Universiteit van Amsterdam en lid van de MPR-commissie.

Wel vraagt Hertzberger zich af of de Delftse plannen voldoende aandacht geven aan de opbouw van ‘parallelle’ ervaring. De keuze voor de T3 suggereert dat de computer vooral als ingenieursinstrument zal worden ingezet, en niet noodzakelijk als studie-object.

Werken met een parallelle rekenmachine is niet eenvoudig, maar de megacalculator van Cray komt programmeurs een beetje tegemoet. Doordat het lijkt alsof het geheugen ongedeeld is -de T3 werkt met virtual shared memory – zijn programma’s voor traditionele computers makkelijker om te zetten naar de super. In Crays jongste rekenmonster zouden de Delftse onderzoekers niet alleen over buitengewoon krachtig gereedschap beschikken, ze zouden er ook direct mee aan de slag kunnen.

Dat is voordelig voor lokale power users, maar leidt niet per se tot grotere kennis van MPP-technologie. De samenstelling van de HPCN-kerngroep – vertegenwoordigers van de harde rekenaars onder de vakgroepen – ondersteunt Hertzbergers verwachting dat de Delftse supercomputer in de eerste plaats als rekenhulp zal worden benut. ,,De T3 maakt misschien lui”, waarschuwt de supercomputerprof.

Hertzberger: ,,Die engineering-toepassingen zijn niet zo lastig. Een veel grotere uitdaging is bijvoorbeeld parallelle verwerking van databases. Voor zulke nieuwe toepassingen is veel kennis van zaken nodig.”

,,Uiteindelijk moet je toch naar nieuwe algoritmen toe”, meent Hertzberger, ,,Je moet parallel leren denken.” Dat ligt ook besloten in de doelstellingen van het Delftse High Performance Computing & Networking-initiatief. Volgens het in 1994 verschenen rapport ‘Technisch HPCN-centrum Delft’ heeft de TU Delft ‘een belangrijke rol te vervullen in de adaptatie van de HPCN-technologie voor (commerciële) toepassingen.’ De grootste uitdaging daarbij is het leren werken met parallelle apparatuur. Maakt de TU zich met de comfortabele Cray niet te gemakkelijk van haar voornemens af?

,,Om een top-universiteit te zijn, is het nu eenmaal nodig dat een aantal groepen over dit soort apparatuur beschikt”, vindt rector magnificus prof.ir. K.F. Wakker, lid van de HPCN-kerngroep. ,,Op het moment dat de faciliteit er is, zullen er vanzelf andere groepen bij betrokken raken.”

Een gebruikersraad zal beoordelen welk onderzoek voor de super in aanmerking komt. De aankoop is niet in eerste instantie bedoeld als centrale rekenfaciliteit, aldus Wakker.
Operationeel

Terwijl het college van bestuur met Cray Research onderhandelt over de aanschaf van een T3, doet Technische Wiskunde en Informatica al enige tijd ervaring op met een massaal parallelle machine. High Performance Computing-experts van de vakgroep Technische Informatica waren nauwelijks betrokken bij de voorbereidingen van de HPCN-kerngroep.

,,Ja, hij is helemaal operationeel”, bevestigt prof.dr.ir. E.J.H. Kerckhoffs, van de groep Kennisgestuurde systemen, boven het geluid van een batterij ventilators op de blauwzwarte kast. Begin juli werd een nCube-supercomputer met 64 processors in gebruik genomen. Diverse leerstoelen bij Informatica maken deel uit van een onderzoeksconsortium dat werkt aan het gebruik van grote databases op massaal parallelle systemen. De groep, geleid door de ING-bank, ontvangt subsidie van de landelijke initiatiefgroep HPCN, die net als NWO met ministerieel geld geavanceerde computerprojecten financiert.

Toen het rekencentrum de plaatselijke belangstelling voor een HPCN-centrum inventariseerde, stond er bij Informatica al een kleiner model nCube. In een vroeg stadium waren de informatici dan ook aanwezig bij de besprekingen, ,,maar op een gegevenmoment hield dat op”, vertelt Kerckhoffs. ,,Van het rekencentrum hoorden we opeens niets meer. Ik weet niet waarom.”

Kerckhoffs constateert dat de HPCN-kerngroep, die het college van bestuur adviseert, erg eenzijdig is samengesteld. ,,De groep bestaat uit puur numerieke gebruikers. Ontwikkelaars komen er niet aan te pas.”

Heeft het Delftse eilandenrijk straks twee HPCN-centra? ,,Daar lijkt het wel helaas wel op”, verzucht Kerckhoffs. ,,Het gaat me niet zozeer om de hardware, maar om hoe zoiets tot stand komt. Dat een stuk aanwezige expertise links is blijven liggen.”

Het is niet te laat om de kerngroep uit te breiden met mensen die uit de parallelle hoek komen, vindt hij. ,,De in Delft aanwezige kennis en hardware kunnen in één HPCN-infrastructuur worden ondergebracht.” Kerckhoffs’ groep wacht de ontwikkelingen echter niet af. Ook de nCube is beschikbaar voor onderzoekers die ervaring willen opdoen met parallel rekenen.

Teratechnologie voor grote uitdagingen


Figuur 1 TWI’s nCube is al beschikbaar

In de technische wetenschappen wordt een aantal zogenoemde grand challenges onderkend. Voor deze problemen bestaat in principe een oplossingsstrategie, die voor adequate uitvoering echter een forse verbetering van de huidige computercapaciteit vergt. Visualisatie van klimaatverandering, hersenactiviteit en vloeistofturbulentie, zoeken en interpreteren van data in omvangrijke gegevensbanken, ontwerp van complexe geneesmiddelen en modellering van halfgeleiders – bij allerlei onderzoek is er een toenemende behoefte aan superkrachtige computers.

De heilige graal van High Performance Computing & Networking is samen te vatten in drie T’s: een verwerkingssnelheid van een Teraflops – tien tot de twaalfde floating point operations per seconde, geheugens van een of meer Terabytes, en datacommunicatiesnelheden in de orde van een Terabit/seconde. Deze kentallen zijn een factor tien tot duizend groter dan die van hedendaagse supers.

De laatste jaren heeft het geloof postgevat dat alleen parallelle computers in aanmerking komen voor de Teraflops-trofee. In een Massively Parallel Processing-machine werken vele processors samen aan hetzelfde karwei. De techniek maakt een duidelijke opgang in het grote rekenwerk. Vorig jaar stond in de Gordon Bell-lijst van ’s werelds snelste computers voor het eerst een massaal parallelle computer bovenaan. De opvolger van Crays T3D moet, in zijn grootste uitvoering, door de Teraflops-barrière kunnen breken.

Parallel rekenen gaat echter gepaard met nieuwe vormen van hoofdpijn. Het aanpassen van bestaande software en ontwerpmethoden aan de complexe architectuur is moeilijk; bovendien leent niet elk probleem zich even goed voor de parallelle aanpak. Volmaakt parallelliseerbare algoritmen kunnen elke beschikbare processor benutten, maar een machine met veel processors is onhandelbaar voor de ‘gewone’gebruiker. MPP-computers zijn daarom vaak een compromis tussen snelheid en gebruiksgemak.

Cray Research en nCube behoren tot de weinige bedrijven die in staat zijn om een min of meer algemeen inzetbare MPP-computer te maken. Beide fabrikanten maken ‘schaalbare’ supers – de koper kan het systeem uitbreiden als zijn capaciteitsbehoefte en z’n greep op het parallellisme groeien.

Van groot belang daarbij is dat de communicatiepaden tussen het toenemend aantal processors niet verstopt raakt. De namen T3 – 3-dimensionale torus – en nCube verwijzen naar alternatieve communicatiestructuren, die beide enorme hoeveelheden dataverkeer tussen een ontzagwekkend aantal chips mogelijk maken. Crays grootste T3 telt 2048 verwerkingseenheden, de nCube bij TWI kan tot 8192 processors bevatten. (G.J.t.D.)

Ger-Jan te Dorsthorst

Redacteur Redactie

Heb je een vraag of opmerking over dit artikel?

delta@tudelft.nl

Comments are closed.