Het cliché wil dat kinderen geen spuitjes spruitjes [met dank aan een oplettende lezer!] lusten. Bij ons zit het anders: ons zoontje eet juist graag spruitjes, net als zijn papa. Ik ben thuis de enige die bij de geur van spruiten alleen al op de vlucht slaat. Natuurlijk word ik hier wel eens mee geplaagd, maar dat vind ik onterecht. En de wetenschap steunt me daarin: ik ben gewoon erfelijk belast!
Stelling van de dag:
Het is helemaal niet stoer om te zeggen dat je spruitjes lust. Sommige mensen proeven niet hoe bitter die zijn: ze missen daartoe de werkzame variant van een bepaald gen (TAS2R38-gen).
Waarom ik op een zondagavond over spruitjes en genetische aanleg voor het proeven van bitter begin? Welnu, in de Nationale WetenschapsQuiz 2014 zat er een vraag hierover en dat in combinatie met kansrekening (zie vraag 11). Ha, spruitjes in een saus van kansrekening, dat is dan weer wel spek naar mijn bek! :-)
Uiteraard blogde ik hier al eerder over, maar het verhaal kreeg een staartje in de commentaren. Voor wie het gemist heeft: iemand betwijfelde of de modeloplossing van NWO wel juist was, maar ik kon hem overtuigen. Ook Mark Peeters – Vlaanderens zelfverklaarde nieuwe Copernicus – dacht aanvankelijk dat er iets mis was met de modeloplossing, maar gaf uiteindelijk zijn fout toe.
Nu is hij echter van mening dat weinig mensen de uitleg die tot de juiste oplossing leidt écht begrepen hebben. Daarom daagt hij de lezers van zijn blog uit om (nogmaals) uit te leggen waarom zijn initiële redenering (die tot een fout resultaat leidt bij de originele opgave) niet werkt.
Hij stelt de volgende variant van de opgave voor (hier uitgeschreven om misverstanden te vermijden):
Een stel heeft twee kinderen. Moeder vindt spruitjes niet bitter, vader wel. Het proeven van bitter is een dominante eigenschap van één gen. De werkzame en de niet-werkzame versie van dit gen komen even vaak voor. Wat is de kans dat beide kinderen de spruitjes wel bitter vinden smaken?
(Voor de volledigheid: in de originele opgave werd er gevraagd naar de kans dat beide kinderen de spruitjes niet bitter vinden smaken. Marks initiële idee was 1/3 x 1/3 = 1/9, terwijl de juiste oplossing 1/6 was.)
Marks initiële redenering levert als antwoord op bovenstaande variant 2/3 x 2/3 = 4/9 op.
Hij vraagt wie met hem wil wedden voor 100€. Nu, wedden doe ik niet, uit principe, maar ik wil wel met alle plezier een poging doen om uit te leggen waarom het antwoord op deze variant van de opgave niet 2/3 x 2/3 is.
In deel 1 zal ik uitleggen hoe de berekening dan wel verloopt (of althans één manier geven om het uit te leggen) en in deel 2 zal ik verduidelijken wat er mis gaat bij “als voor één kind de kans 2/3 is, dan is voor twee kinderen de kans 2/3 x 2/3”.
~
Deel 1 – Waarom de oplossing 1/2 is
Kansrekening is in de eerste plaats een kwestie van bijhouden welke bronnen van onzekerheid er zijn en pas in de tweede plaats daar de kansen bij berekenen (onder andere door gebruik te maken van de somregel en de productregel). De verschillende bronnen van onzekerheid en de daarbij horende kansen in dit vraagstuk heb ik hieronder aangeduid door verschillende kleuren te gebruiken.
(a) De genen van de moeder: geen bron van onzekerheid
Bitter kunnen proeven is een dominante eigenschap van één gen. Moeder proeft geen bitter. Dat wil zeggen dat moeder twee niet-werkzame versies heeft van dit gen. Er is dus geen enkele onzekerheid over welk gen zij zal doorgeven: een niet-werkzame versie. Met andere woorden: de relevante kansen zijn 1 en hoeven in de verdere berekening niet expliciet naar voren te komen. (Ja zou alles expliciet met één kunnen vermenigvuldigen, maar dat maakt voor het resultaat uiteraard niet uit.)
Er is wel nog onzekerheid over of haar kinderen al dan niet bitter zullen kunnen proeven. Ze kunnen namelijk een werkzaam gen krijgen van de vader en één werkzaam gen volstaat om bitter te proeven (omdat dit dominant is).
(b) De genen van de vader: wel bron van onzekerheid
Van de vader weten we dat hij wel bitter proeft. Dat betekent dat hij minstens één werkzaam gen heeft, maar het is niet zeker of hij er één of twee heeft. Dit is een eerste bron van onzekerheid. Vanaf dit punt heeft het zin om aan kansrekening te doen: er is iets dat onzeker is, maar we hebben wel genoeg informatie om kansen te koppelen aan de verschillende mogelijkheden.
In feite zijn er wat de genen van de vader betreft drie mogelijkheden: ofwel is zijn eerste en zijn tweede gen werkzaam, ofwel is zijn enkel zijn eerste gen werkzaam, ofwel is enkel zijn tweede gen werkzaam. Deze drie mogelijkheden hebben gelijke kansen omdat volgens de opgave de werkzame en de niet-werkzame versie van dit gen even vaak voorkomen. Er is dus 1/3 kans dat de vader twee werkzame genen heeft en 2/3 kans dat de vader precies één werkzaam gen heeft.
(c) Het gen dat de vader doorgeeft aan de kinderen: in sommige gevallen bron van onzekerheid
Als we nu iets willen weten over de genen van de kinderen van deze vader dan komt er een tweede bron van onzekerheid bij, namelijk welk van beide genen de vader doorgeeft.
Rekening houdend met beide bronnen van onzekerheid, kan de kans dat een eerste kind bitter zal proeven als volgt berekend worden:
Er is 1/3 kans dat de vader twee werkzame genen heeft, in dat geval (x) maakt het niet uit welk hij doorgeeft: het eerste kind zal met 100% kans (of kans 1) een werkzaam gen krijgen en dus bitter proeven. [In dit geval is er slechts één bron van onzekerheid: of de vader inderdaad twee dominante genen heeft.]
Daarnaast (+) is er 2/3 kans dat de vader precies één werkzaam gen heeft, in dat geval (x) is er 50% kans (of kans 1/2) dat hij precies dit gen doorgeeft aan zijn eerste kind en dat het dus bitter zal proeven. [In dit geval zijn er twee bronnen van onzekerheid: of de vader inderdaad slechts één werkzaam gen heeft én welk van beide genen hij doorgeeft.]
Dit geeft als kans:
1/3 x 1 + 2/3 x 1/2 = 2/3.
Nu berekenen we de kans bij twee kinderen dat ze beiden bitter zullen proeven:
Er is 1/3 kans dat de vader twee werkzame genen heeft, in dat geval (x) maakt het niet uit welk hij doorgeeft: beide kinderen zullen met 100% kans (of kans 1) een werkzaam gen krijgen en dus beide bitter proeven.
Daarnaast (+) is er 2/3 kans dat de vader één werkzaam gen heeft, in dat geval (x) is er 50% kans (of kans 1/2) dat hij precies dit gen doorgeeft aan zijn eerste kind en dat het dus bitter zal proeven en in dat laatste geval (x) is er nog eens 50% kans (of kans 1/2) dat ook het tweede kind bitter zal proeven.
1/3 x 1 x 1 + 2/3 x 1/2 x 1/2 = 1/2.
~
Deel 2 – Waarom het antwoord niet 2/3 x 2/3 is
De productregel voor kansen geldt enkel voor onafhankelijke gebeurtenissen (zoals twee keer gooien met een munt). De reden waarom het antwoord niet 2/3 x 2/3 is, zoals Mark probeert aan te tonen, is dat de genetische eigenschappen van twee kinderen van dezelfde vader -uiteraard!- niet volledig onafhankelijk van elkaar zijn.
Zoals ik in deel 1 heb uitgelegd, zijn er hier twee bronnen van onzekerheid in het spel: welke combinatie van genen de vader heeft en welk van beide genen hij doorgeeft. Als het dezelfde vader is voor beide kinderen, mogen we de eerste bron van onzekerheid maar één keer meetellen, terwijl er wel voor elk kind apart wel opnieuw een gen wordt geselecteerd (zoals bij onafhankelijke muntworpen).
Extra toelichting bij deel 2
Merk ook op: als het om twee verschillende vaders ging (onafhankelijk geselecteerd, niet bijvoorbeeld twee eeneiige tweelingbroers) die beiden wel bitter proeven, dan zou het antwoord wél 2/3 x 2/3 zijn.
Of stel dat we weten dat de kinderen een ééneiige tweeling vormen, dan krijgen beiden hetzelfde gen van hun vader: dit is dus niet meer onafhankelijk voor elk kind. De kans dat beide bitter proeven is dan 1/3 x 1 x 1 + 2/3 x 1/2 x 1 = 2/3 (net als bij één kind).
O ja, ik heb het woord “voorwaardelijke kans” niet expliciet gebruikt in de uitleg hierboven, maar impliciet zit dat er zeker in: waar ik schrijf “in dat geval” is de kans die daarna komt een voorwaardelijke kans. Je weet niet welke genen de vader heeft, maar aan elke mogelijkheid kan je kansen koppelen en bovendien kan je, als je tijdelijk één mogelijkheid aanneemt, bepalen wat de kans is om een werkzaam gen door te geven onder de voorwaarde van die aanname. De factoren in het paars zijn dus voorwaardelijke kansen. (Je kan dit ook in een diagram weergeven; dan krijg je een soort vertakkende boomstructuur.)
~
Moraal
[important]Het komt er bij kansrekening op neer niet alleen te cijferen, maar in het oog te houden wat deze kansen betekenen, want daarvan hangt af wanneer ze opgeteld of vermenigvuldigd mogen worden.[/important]
Ik heb zeer lang gewacht om zelf te reageren om zo veel mogelijk mensen de kans te geven om te zien of ze echt zeker waren… Wat vind je van deze uitleg?
Bij de vorming van een kind (ivm met het al dan niet “smaken v/d bitterheid van spruitjes”) wordt er één gen v/d (twee genen v/d) vader én één gen v/d (twee genen v/d) moeder genomen om terug “twee genen aan het kind te geven”…
Stel dat de moeder de (aa)-combinatie heeft en de vader heeft 1/3-kans voor de AA-combinatie én 1/3-kans voor de Aa-combinatie én 1/3-kans voor een aA-combinatie…
Wat is dan de kans op een aa-kind, een aA-kind, een Aa-kind en AA-kind?
De laatste twee keuzes (Aa en AA) zijn totaal onmogelijk, omdat de moeder, die het eerste gen geeft alleen maar een “a” kan geven…
De vader heeft “4 kansen op 6”(=2/3) om een “A” door te geven…om een (aA)-kind te vormen
De vader heeft “2 kansen op 6”(=1/3) om een “a” door te geven en (aa)-kind te vormen…
(controle : 0 + 0 + 1/3 + 2/3 = 1)
Als er twee kinderen zijn, wat is dan de kans dat de volgende combinaties zich voordoen…
(aa)-(aa), (aa)-(aA), (aA)- (aa)
(aA) (aA)
Bij de eerste drie combinaties komt er steeds een (aa)-kind voor en dat veroorzaakt een “voorwaardelijke kans” voor het “andere kind“. Immers een (aa)-kind kan alleen maar gevormd zijn door een vader die een “(aA) of (Aa)”-combinatie heeft, want de (AA)-combinatie kan natuurlijk geen “a” doorgeven…
Vervolgens is de kans dat de vader (met Aa of aA) het “a”-gen doorgeeft “2 kansen op 4” (=½) om een (aa)-kind te vormen..
Evenzo is de kans dat de vader (met Aa of aA) het “A”-gen doorgeeft opnieuw “2 kansen op 4”(=½) om een (aA)-kind te vormen…
(controle : ½ + ½ = 1)
De eerste drie combinaties (aa)-(aa), (aa)-(aA) en (aA)-(aa) hebben daardoor alle drie diezelfde kans 1/3(voor het aa-kind) x ½(voor het andere kind) = 1/6
Als het gaat over de (aA)-(aA)-combinatie, dan is er GEEN (rechtstreekse) VOORWAARDELIJKE KANS, omdat met geen enkele van de drie combinaties v/d vader (AA, Aa of aA) kan uitsluiten, omdat deze alle drie combinaties een “A” kunnen doorgeven aan het kind…
Om die reden dacht ik “weeral” verkeerdelijk dat de kansen “onafhankelijk” waren, waardoor ik het voorstel deed van 2/3 x 2/3 = 4/9… (zoals ik ook las bij een reactie bij SYLVIA..
http://www.sylviawenmackers.be/blog/2014/12/nationale-wetenschapsquiz-2014/#comment-834
)
Dit is echter zeer nadrukkelijk niet de juiste oplossing omdat 1/6 + 1/6 + 1/6 + 4/9 niet gelijk is aan “1”…
Bij de optie van “½” klopt het dus wel…en DAT IS DE ENIGE JUISTE oplossing…
1/6 + 1/6 + 1/6 + ½ = 1
m.a.w. ik zal dus “200 euro” betalen
http://markpeeters.skynetblogs.be/archive/2015/01/31/weddenschap-wordt-afgesloten-ik-geef-25-euro-aan-8375890.html
Beste Mark,
Bedankt voor je reactie.
Je uitleg lijkt me goed. Ik geloof niet zo in het idee van één beste uitleg: wat de beste uitleg is voor iemand hangt ervan af welke voorkennis die persoon al heeft. Dit schreef ik trouwens al eerder in een reactie op jouw blog. (Waarbij ik per ongeluk je naam verkeerd schreef, waarvoor mijn excuses.)
Alleen is de laatste controlestap wat vreemd. Als je namelijk per abuis met onafhankelijke gebeurtenissen werkt, dan zijn de kansen:
– beide kinderen vinden spruitjes niet bitter: 1/3 * 1/3 = 1/9
– het eerste kind vindt spruitjes niet bitter, het tweede wel: 1/3 * 2/3 = 2/9
– het eerste kind vindt spruitjes wel bitter, het tweede niet: 2/3 * 1/3 = 2/9
– beide kinderen vinden spruitjes wel bitter: 2/3 * 2/3 = 4/9
1/9 + 2/9 + 2/9 + 4/9 = 1.
Als je per ongeluk op het verkeerde spoor geraakt (en iedereen kan zich al eens vergissen), dan is het dus helaas niet mogelijk dit met deze eenvoudige controle te ontdekken. (Al is de controle op zich uiteraard wel nuttig, om eventuele andere fouten op te sporen.)
Anderzijds is het ook niet zo vreemd dat de controle klopt: puur wiskundig is er namelijk niets fout aan de berekening. Alleen is dit type berekening (met onafhankelijke gebeurtenissen) niet van toepassing op dit vraagstuk (waarbij de kinderen dezelfde vader hebben). Het is een correcte oplossing, maar dan wel één die hoort bij een ánder vraagstuk. :-)
Daarom vond ik het in mijn uitleg belangrijk om óók te laten zien wanneer de berekening met onafhankelijke gebeurtenissen wél relevant is (namelijk bij twee ongerelateerde vaders).