maandag 26 januari 2009

Hoe werkt wetenschap? (5) Van ruw idee naar onderzoeksvraag

De vorige keer had ik het over hoe een van mijn onderzoeken begon, met een idee van de professor voor een "market basket analysis", en besprak ik de winkelmandjesanalyse. Is het mogelijk om een molecuul net zo te analyseren als een winkelmandje van de Albert Heijn?

Het probleem is dat een molecuul één eenheid is, en niet zoiets als een verzameling losse, onafhankelijke onderdelen (zoals haring en pindakaas). De enige manier waarop een winkelmandjesanalyse zou kunnen werken is dus een molecuul op te splitsen in onderdelen.

De meest logische manier om een molecuul op te splitsen is in atomen: water geeft dan twee waterstofatomen en een zuurstofatoom, suiker zes koolstofatomen, twaalf waterstofatomen, en zes zuurstofatomen, hoewel winkelmandjesanalyse dubbele boodschappen/atomen niet telt, dus water → H O, suiker –> C H O. Maar als je naar de gemiddelde chemische database kijkt, zitten in (bijna) alle moleculen koolstofatomen en waterstofatomen, en vaak ook stikstofatomen en zuurstofatomen. Voor de eerste tien stoffen van de Merck database zou dat zijn: C H O, C H N O, C H N O, C H O, C H O, C H O, C H O, C H N O, C H N O S, C H N O S. Kortom: bijna altijd CHO, vaak N, soms S. Kortom, heel saaie winkelmandjes, het analyseren daarvan zou weinig kennis opleveren.

Een andere methode die informatici soms gebruiken is alle mogelijke stukken van een molecuul op te sommen. Als je de waterstofatomen buiten beschouwing laat, krijg je dus één mogelijke structuur bij methaan (C), twee bij ethaan (C en CC), drie bij propaan (C, CC, CCC), wat allemaal nog te doen is. Maar als je naar een “normaal” molecuul als suiker kijkt (sucrose, afbeelding) zijn er een heleboel mogelijkheden.

Er zijn twee fragmenten van 1 atoom, C en O. Twee van twee atomen (CO en CC... geen OO, zoals je misschien begrijpt na mijn stuk over Marilyn Monroe en het toilet). Dat valt nog mee. Met drie atomen: CCC, CCO en COC. Bij vier atomen begint het al veel te worden: CCCC, CCCO, CCOC, en dan de T-vormige stukken CC(C)O en OC(C)O. Met vijf atomen CCCCC, CCCCO, CCCOC, CCOCC, CCOCO, COCOC, OCOCO, en dan de T-stukken: CCC(C)O, COC(C)O, het kruisvormige stuk CC(O)(C)O, de ring -CCCCO-...

Hoe groter het stuk, hoe meer mogelijkheden er zijn, en je gelooft me misschien als ik zeg dat als je alle mogelijkheden van een molecuul als sucrose opsomt, er honderden of zelfs duizenden fragmenten uit één molecuul kunnen ontstaan. Het boodschappenmandje is overvol, de computer maakt overuren, de chemici die alles proberen te controleren raken overspannen... kortom, alle fragmenten opsommen kan, maar is ook niet ideaal.

Ik heb dus aan mijn professor voorgesteld om moleculen eenvoudiger in stukken te knippen: grotere stukken dan atomen, maar niet alle mogelijke deelstructuren; namelijk... wat zou er gebeuren als je moleculen scheidt bij de verbindingen tussen ringen en de rest van het molecuul? Bij sucrose zou je dan het volgende krijgen (afbeelding 2)




Dat ziet er al een stuk eenvoudiger uit, hè? Slechts vijf boodschappen in het mandje. De professoren gingen accoord met mijn redenering, en ik kwam na de fasen van idee en idee verfijnen aan bij de derde fase van het onderzoek: het idee gaan uitwerken. Wordt vervolgd...

Geen opmerkingen:

Een reactie posten