zaterdag 24 januari 2009

Hoe werkt wetenschap? (4) Een onderzoek - het idee

Eergisteren had ik het over de algemene principes van wetenschappelijk onderzoek. Net als in het dagelijks leven is het doel van wetenschappelijk onderzoek vragen te beantwoorden. Alleen wordt wetenschappelijk onderzoek doorgaans erg nauwkeurig uitgevoerd om er zeker te zijn dat de vraag ook echt wordt beantwoord.

Wat ik niet vertelde, is hoe je het idee voor het onderzoek krijgt, en hoe je het gaat uitvoeren.

Alweer een hele tijd geleden praatte ik met een van de professoren die mijn promotieonderzoek begeleiden/in de gaten houden, professor Kok. Professor Kok is professor in de informatica, en hij is gespecialiseerd in dataminen. Dataminen is een techniek om regels of patronen in grote hoeveelheden data (bijvoorbeeld computerdatabases) te ontdekken. Een voorbeeld is dat onderzoekers met datamining ontdekten dat als iemand in Amerika ter dood was veroordeeld, de kans dat hij (geen zij, vrouwen worden bijna nooit geëxecuteerd) ook daadwerkelijk werd geëxecuteerd inplaats van levenslang te krijgen niet afhing van de ernst van de misdaad, maar van zijn opleidingsniveau; als je alleen maar lagere school had werd je veel vaker geëxecuteerd, als je universiteit had bleef je leven (wie zei dat school nutteloos is?). Je zou kunnen zeggen dat datamining 'datamining' heet omdat je uit een berg data probeert een paar goudklompjes van kennis te halen.

Nu had professor Kok een tijd daarvoor voor een supermarkt een "market basket analysis" gedaan (of waarschijnlijker: laten doen door een promovendus, want de meeste professoren hebben geen tijd om zelf onderzoek te doen). Nu klinkt "market basket analysis" veel indrukwekkender dan "winkelmandjesanalyse", maar het is gewoon... wel... een winkelmandjesanalyse. Je bekijkt wat klanten van een supermarkt in hun mandje hebben, en dan kun je bijvoorbeeld zien of mensen die bier kopen vaak chips kopen, of juist broccoli. Als bierliefhebbers vaker chips kopen, kun je een extra stapel chips naast de kratten bier zetten, zodat de bierliefhebbers niet vergeten chips mee te nemen als ze naar de kassa gaan. Als bierliefhebbers vaker broccoli kopen, leg je juist de broccoli naast het bier.

Supermarkten als Albert Heijn vinden het natuurlijk razend interessant om te zien of er bepaalde typen klanten zijn die ze kunnen overhalen nog meer te kopen met speciale bonusaanbiedingen of strategisch geherschikte schappen. Maar professor Kok dacht dat de techniek veel meer mogelijkheden had.

Hij vroeg dus aan mij: "Zou je market basket analysis kunnen uitvoeren op moleculen?"

Dit is overigens een van de technieken die in de wetenschap veel wordt gebruikt (en vooral in de informatica): ik heb techniek X die ik gebruik in veld A- zou ik X ook kunnen toepassen in veld P? Bijvoorbeeld: Plakband werkt goed voor het repareren van boeken die kapot dreigen te gaan. Zou plakband ook werken om het fileprobleem op te lossen?

Plakband gebruiken om het fileprobleem op te lossen lijkt me nogal lastig. De X voor A-> X voor P techniek geeft dan ook een heleboel onzinnige suggesties. De letterlijke suggestie van professor Kok zou ik nooit onzinnig noemen (professor Kok was mijn baas), maar was zeker niet gemakkelijk. Terwijl supermandjes meerdere artikelen bevatten, is elk molecuul één eenheid dat zeker niet uit losse onafhankelijke stukken bestaat; er zijn geen nette mandjes met verschillende moleculen. Het idee moest dus aangepast/aangescherpt worden voordat ik er iets mee kon gaan doen...

(wordt vervolgd)

Geen opmerkingen:

Een reactie posten