Avainsana-arkisto: alleelifrekvenssi

Mendelin lait ja niiden seuraukset populaatiotasolla

Tervehdys jälleen lukijat!

Viimekirjoituksessa oli muutamia kohtia joissa oikaisin muutaman mutkan suoraksi. Tällainen toiminta on kuitenkin paheksuttavaa, joten lienee syytä korjata näitä puutteita.

Muistamme koulusta munkki Mendelin ja hänen kokeensa kasvihybrideillä (Versuche über Pflanzen-Hybriden). Mendelin tulosten merkitystä ei ymmärretty hänen elinaikanaan, mutta ne löydettiin myöhemmin uudelleen.

Kerrataan lyhyesti muistin virkistykseksi mitä Mendelin lait oikein sanovatkaan. Oletamme, että tarkastelemme diplodia eliötä joka lisääntyy suvullisesti. Sanottakoon vielä muutama sana perinnöllisyyden fysikaalisesta perustasta. Tumallisilla otuksilla perimä koostuu usein useasta lineaarisesta DNA-molekyylista. Näitä nimitetään kromosomeiksi. Diploideilla otuksilla on perimässään kaksi kopiota jokaisesta kromosomista, yksi kopio kummaltakin vanhemmalta. Nimitämme näitä vastinkromosomeiksi. Esim. ihmisellä on yhteensä 46 kromosomia, joista 23 olemme perineet isältämme ja 23 äidiltämme. Niinpä kuten aiemmin jo mainittu meillä on kaksi kopiota jokaisesta lokuksesta (jätämme poikkeukset huomiotta).

Ensimmäinen laki – Laki segregaatiosta

Mendelin ensimmäinen laki sanoo että kun yksilö tuottaa sukusoluja jokainen sukusolu saa yhden kopion kustakin lokuksesta (tai alleelista jos niin haluamme)

Toinen laki – Laki riippumattomuudesta

Toinen Mendelin laki sanoo, että alleelit jakautuvat sukusoluihin toisistaan riippumatta. Eli eri lokusten alleelit valikoituvat sukusoluihin itsenäisesti. Esimerkiksi, jos olemme perineet vanhemmalta A 23 kromosomia ja vanhemmalta B 23 kromosomia (ja kuvitellaan, että voimme seurata niitä), omat jälkeläisemme perivät meiltä 23 kromosomia jotka ovat sekoitus A:n ja B:n alkuperäisistä kromosomeista. Toiseen lakiin on olemassa useita tärkeitä poikkeuksia, mutta se jääköön toiseen kertaan.

Mendelin lakien fysikaalinen perusta on kromosomien käyttäytyminen niissä solunjakautumisissa jotka tuottavat sukusoluja. Vastinkromosomit nimittäin asettuvat jakotason eri puolille satunnaisesti. Tätäkin lienee syytä vielä tarkentaa tulevissa kirjoituksissa.

Oheisessa kuvassa on esimerkki risteytyksestä jossa oletan, että tarkasteltavassa lokuksessa on kaksi alleelia, jotka ovat A ja a.

mendel

Kun genotyypit A ja a risteytettiin keskenään syntyy genotyyppejä AA, Aa ja aa suhteessa 1 : 2 : 1. Itse koen helpommaksi ajatella asiaa todennäköisyyksien kannalta. Kun Aa genottyyppi tuottaa sukusoluja, Mendelin lakien perusteella sukusolu saa alleelin A todennäköisyydella \frac{1}{2} ja alleelin a todennäköisyydella \frac{1}{2}. Niinpä tässä tapauksessa jälkeläisen genotyyppi on AA jos se on perinyt alleelin A molemmilta vanhemmiltaan eli \mathrm{P}(\mathrm{AA}) = \frac{1}{2} * \frac{1}{2} = \frac{1}{4}. Vastaavasti genottyyppi on Aa jos jälkeläinen perii toiselta vanhemmalta alleelin A ja toiselta alleelin a. Tämä voi tapahtua kahdella eri tavalla joten \mathrm{P}(\mathrm{Aa}) = \frac{1}{2} * \frac{1}{2} + \frac{1}{2} * \frac{1}{2} = \frac{1}{2}. Genotyypin aa todennäköisyys lasketaan samoin kuin AA genotyypin.

Tällä kromosomien käyttäytymisellä on useita tärkeitä seurauksia. Se mahdollistaa todennäköisyyslaskennan käytön genetiikassa sekä monia geneettisen analyysin menetelmiä. Sukusolujen taulukointia tai todennäköisyyslaskentaa käyttämällä saamme vanhempien tuottamat jälkeläiset selville millaisessa risteytyksessä tahansa. Mutta mitä tapahtuukaan alleelifrekvensseille populaatiotasolla, kun jokaisessa sukupolvessa lukemattomat yksilöt risteytyvät keskenään ja tuottavat jälkeläisiä?

Oletetaan, että meillä on suuri joukko yksilöitä ja tarkastelleen edellään samaa lokusta, jossa on kaksi alleelia: A ja a. Merkitään A alleelin alleelifrekvenssiä f(\mathrm{A}) = p ja a:n vastaavasti f(\mathrm{a}) = q. Alleelifrekvenssit voidaan laskea myös genotyyppifrekvensseistä: f(\mathrm{AA}) + \frac{1}{2}f(\mathrm{Aa}) = f(\mathrm{A}) = p ja f(\mathrm{aa}) +\frac{1}{2}f(\mathrm{Aa}) = f(\mathrm{a}) = q. Alleelifrekvenssien summa on p + q = 1. Nämä ovat siis alleelifrekvenssit nykyisessä sukupolvessa. Nyt kysymme, mitkä ovat alleelifrekvenssit seuraavassa sukupolvessa? Oletan tässä, että tutkimme otuksia, joiden sukupolvet eivät ole päällekkäiset (esim. yksivuotiset kasvit). Tämä tekee esimerkistä yksinkertaisemman, mutta ei ole välttämätön oletus. Oletetaan lisäksi, että yksilöiden tuottamat sukusolut yhdistyvät satunnaisesti.

Taulukoidaan alleelien mahdolliset tavat yhdistyä kuten edellä. Nyt kuitenkin käytämme alleelifrekvensseja painokertoimina kertomaan kuinka paljon jokaista genotyyppiä on seuraavassa sukupolvessa.

 HardyWeinberg

Taulukosta näemme, että seuraavan sukupolven genotyyppifrekvenssit ovat: f(\mathrm{AA}) = p^2, f(\mathrm{Aa}) = pq + pq = 2pq ja f(\mathrm{aa}) = q^2. Alleelifrekvenssit seuraavassa sukupolvessa ovat siis f_{t+1}(\mathrm{A}) = p^2 + \frac{1}{2}2pq = p^2 + pq = p^2 + p(1-p) = p ja vastaavasti f_{t+1}(\mathrm{a}) = q^2 + pq = q. Käytimme hyväksi edellä kuvattua alleelifrekvenssien laskutapaa genotyyppifrekvensseistä, sekä tietoa q = 1-p. Huomaamme, että alleelifrekvenssit eivät muuttuneet lainkaan vaan pysyivät samoina! Pelkkä lisääntyminen ei siis muuta alleelifrekvenssejä.

Tätä kutsutaan Hardy-Weinberg laiksi. Jos yksilöt pariutuvat satunnaisesti voimme laskea genotyyppifrekvenssit kun alleelifrekvenssit tunnetaan. Oikeastaan tämä pätee vain jos alleelifrekvenssejä muuttavat voimat eivät vaikuta populaatiossa. Tärkein näistä on luonnonvalinta, muita ovat mutaatiot ja satunnaisajautuminen. Tarkkaan ottaen olemme olettaneet, että tarkasteltava populaatiomme on äärettömän suuri, koska kaikissa rajallisissa populaatioissa alleelien satunnaisotanta seuraavaan sukupolveen muuttaa niiden frekvenssejä aina jonkin verran. Tosin isoissa populaatiossa tämä vaikutus on häviävän pieni. Satunnaisajautuminen onkin merkittävä evolutiivinen voima lähinnä vain erittäin pienissä populaatioissa. Vaikka se onkin tärkeä aihe joillakin populaatiogenetiikan osa-alueilla, tässä blogissa olemme kiinnostuneet evoluutiosta emmekä aio tuhtala aikaamme sen kovin syvälliseen pohtimiseen. Voidaan hyvin kysyä ovatko Hardy-Weinberg yhtälöt kovinkaan tärkeitä, jos monikaan luonnollinen populaatio ei täytä niiden oletuksia? Tässä huolimatta tutkittaessa oikeita populaatioita on todettu, että monet lokukset itseasiassa ovat Hardy-Weinberg tasapainossa. Lisäksi yhtälöt antavat mainion lähtökohdan mutkikkaampien ilmiöiden tarkasteluun.

On myös hyvä huomata pari seikkaa, jotka seuraavat Hardy-Weinberg yhtälöistä. Olen joskus törmännyt kirjoitteluun (netistä löytyy kaikenlaista), jossa on surkuteltu nykyajan surkeaa tilaa ja modernin lääketieteen aiheuttamaa ihmiskunnan geneettistä rappeutumista. Nykyaikaisen lääketieteen ansiostahan moni jos jonkinlaista geneettistä mutaatiota kantava henkilö jää henkiin vaikka vanhoina huonoina aikoja olisi käynyt kalpaten. Vaikka kyseessä on lähinnä angtisten lukiolaisteinien kirjoittelu, johon ei sinänsä tarvitse kiinnittää sen kummempaa huomiota, niin korjaan silti mahdolliset väärinkäsitykset. Edellä kuvatun perusteella voimme todeta, että alleelifrekvenssit pysyvät samoina, jos luonnonvalinta ei niihin vaikuta. Tietysti alleelifrekvenssit voivat muuttua satunnaisotannan seurauksena, mutta isoissa populaatiossa tämä prosessi on niin hidas, että sillä ei juuri ole ihmisen aikaskaalassa merkitystä. Ainoastaan alleelit jotka lisäävät kelpoisuutta voivat luonnonvalinnan vaikutuksesta yleistyä merkittävästi. Niinpä ihmiskunnan geenipoolin tilasta ei tarvitse olla erityisen huolestunut.

On kuitenkin totta, että haitalliset mutaatiot kyllä aiheuttavat populaatioille kelpoisuutta laskevan geneettisen taakan, mutta tämä on kuitenkin eri asia ja lienee oman kirjoituksen aiheensa joskus tulevaisuudessa.

Sillävälin syytä huoleen ei kuitenkaan ole. Otetaan siis rennosti!

Peruskäsitteistä II

Tervehdys jälleen rakkaat lukijat!

Monet teistä ovat odottaneet uutta blogipäivitystä malttamattomina. Aurinkokaan ei ole paistanut niin kirkkaasti ja leipäkään ei ole maistunut leivältä blogipäivityksien puutteessa. Pahoittelen, että en ehtinyt päivittää viimeviikolla, sillä oli kiireitä itse tutkimuksen parissa.

Evoluution määritelmä

Olette ehtineet varmasti sulatella edellistä kirjoitusta. Opimme viimeksi, mitä alleelit ovat. Seuraavaksi aloitamme varsinaisen evoluutioteorian tarkastelun. Monet lukijat varmaan muistavat koulusta erään evoluution määritelmän: ”Evoluutio on alleelifrekvenssien muutosta populaatiossa.” Alleelifrekvensseillä tarkoitetaan eri alleelien osuuksia populaatiossa. Oletetaan, että populaation koko, N, on 100 yksilöä. Oletetaan vielä, että nämä yksilöt ovat diploideja (kuten esim. ihmiset ja muut eläimet). Tästä seuraa, että kyseisessä populaatiossa on 2N kopiota jokaisesta lokuksesta. Jos populaatiossa on x alleelin A_1 kopiota, alleelin A_1 frekvenssi on silloin

p_{A_1} = \frac{x}{2N}

Evoluutiossa on siis kyse siitä, että p_{A_1} muuttuu sukupolvien myötä. Ei oikeastaan mistään sen mystisemmästä. Huomaa, että p_{A_1} voi saada arvoja vain väliltä [0, 1]. Evoluutio ei kuitenkaan pysähdy jos jokin alleeli yleistyy populaatiossa frekvenssiin 1. Mutaatiot tuottavat uusi alleeleja ja vanhat alleelit korvautuvat uusilla evoluution kuluessa. Luonnonvalinta on tärkein alleelifrekvenssejä muuttava voima. Seuraavaksi selvennämme joitakin käsitteitä, jotka ovat välttämättömiä luonnonvalinnan ymmärtämiseksi.

Genotyyppifrekvenssi

Ennen varsinaista keskustelua kelpoisuudesta, on syytä sanoa muutama sana genotyyppien frekvensseistä. Oletamme tässä, että populaation yksilöt pariutuvat satunnaisesti tarkasteltavien alleelien suhteen. Olkoon populaatiossa on kaksi alleelia, A_1 ja A_2, joiden frekvenssit ovat p_{A_1} ja p_{A_2}. Nyt genotyyppien frekvenssit ovat f(A_1A_1) = p_{A_1}^2 ja f(A_1A_2) = 2p_{A_1}p_{A_2}. Oikeastaan olisin ennen tätä kirjoitusta voinut selittää tarkemmin miksi näin on. Nyt pyydän lukijoilta malttia ja vain ottamaan tämän annettuna. Tulen selittämään tämän tulevassa kirjoituksessa. Nokkelimmat lukijat ehkäpä muistavat koulusta, että tähän liittyy jotenkin Mendel sekä herrat Hardy ja Weinberg.

Kelpoisuuden käsitteestä

Jälleen lukijat varmasti muistavat koulusta jonkinlaisen luonnonvalinnan toiminnan kuvauksen. Jotkut yksilöt saavat enemmän jälkeläisiä kuin toiset ja tämän seurauksena seuraavassa sukupolvessa on suhteessa enemmän näiden yksilöiden jälkeläisiä. Haluamme kuitenkin määritellä luonnonvalinnan tarkemmin. Ensin määrittelemme kelpoisuuden (engl. fitness), evoluutiobiologiassa on joitakin käsitteitä joilla on tutkimuskäytössä tarkat määritelmät, mutta joita valitettavasti pahoinpidellään julmasti kansan keskuudessa. Kelpoisuus on yksi näistä. Kelpoisuus, W, on yksilön jälkeläisten lukumäärä seuraavassa sukupolvessa. Populaatiogenetiikassa käytämme usein genotyypin kelpoisuutta, joka on kaikkien populaation saman genotyypin yksilöiden keskimääräinen kelpoisuus. Eli genotyypin A_1A_2 genotyyppinenkelpoisuus, w_{12}, on kaikkien niiden yksilöiden W:n keskiarvo, joilla on genotyyppi A_1A_2. Usein populaatiogenetiikassa oletamme, että luonnonvalinta kohdistuu yksilötasolla fenotyyppeihin ja nämä fenotyypit määrää yksilön genotyyppi. Niinpä kelpoisuuden määritelmä yksilön ominaisuudeksi ei ole ongelma vaikka sovellamme kelpoisuutta genotyyppeihin.

Voimme mitata genotyyppistäkelpoisuutta joko absoluuttisesti tai suhteellisesti. Absoluuttinenkelpoisuus on odotettu eloonjäävien jälkeläisten määrä jotka tietyn genotyypin yksilö tuottaa. Suhteellinenkelpoisuus on absoluuttinen kelpoisuus skaalattuna jollakin tavalla. Usein esimerkiksi siten, että suurin kelpoisuus saa arvon 1. Suhteellinen kelpoisuus on usein hyödyllinen evoluution mallintamisessa, mutta absoluuttista kelpoisuutta käyttämällä näemme miten kelpoisuuden käsite on kytköksissä ekologiaan.

Tarkastellaan populaation kasvua yhden sukupolven verran. Olkoon populaatiokoko ajassa t, N_t. Oletetaan, että tarkasteltavassa lokuksessa on kaksi alleelia A_1 ja A_2 kuten edellä. Populaatiossa on p^2N_t yksilöä joilla on genotyyppi A_1A_1, 2p(1-p)N_t genotyypin A_1A_2 ja (1-p)^2 genotyypin A_2A_2 yksilöä. Huomaa, että tiputin p_{A_1} termistä alleelia merkitsevän alaindeksin selvyyden vuoksi, lisäksi p_{A_2} = 1 - p_{A_1}. Käyttäen genotyyppien absoluuttisia kelpoisuuksia, populaatiokoko seuraavassa sukupolvessa on

N_{t+1} = p^2N_tw_{11} + 2p(1-p)N_tw_{12} + (1-p)^2N_tw_{22}.

Tämän voimme kirjoittaa muotoon N_{t+1} = \bar{w}N_t, jossa \bar{w} = p^2w_{11} + 2p(1-p)w_{12} + (1-p)^2w_{22}. Termi \bar{w} on populaation keskimääräinen kelpoisuus, koska se on genotyyppien kelpoisuuksien summa painotettuna genotyyppien frekvensseillä. Se myös kertoo populaation kasvun yhden sukupolven yli, jos oletamme, että aika on diskreettimuuttuja. Vaikka tämä yhtälö pätee jos sukupolvet eivät ole päällekkäiset (esim. yksivuotiset kasvit), niin usein haluamme ekologiassa kuitenkin mallintaa aikaa jatkuvana muuttujana. Ekologiassa usein populaation kasvua kuvataan termillä

r = \frac{\mathrm{d}N}{\mathrm{d}t} \frac{1}{N}.

Jos populaation kasvun on hidasta, niin diskreetti- ja jatkuvamalli ovat likimäärin samat, ja näin löydämme yhteyden populaation kelpoisuuden ja ekologiassa käytetyn populaation kasvun kesken. Siis N_{t+1} = N_t\bar{w} \approx N_te^r, joten r \approx \mathrm{ln}(\bar{w}). Ekologiassa käytetty populaation kasvuvauhti on siis populaation keskimääräisen kelpoisuuden luonnollinen logaritmi.

Näin huomaamme, että kelpoisuus siis kytkeytyy ekologiseen teoriaan ja populaation kasvuun. Niinkuin nykyään on tapana sanoa: Fantastista! Kelpoisuudella ei siis ole mitään tekemistä ”vain vahvimmat selviytyvät” tyyppisten sanontojen kanssa. Kyse on siitä miten eri yksilöt vaikuttavat populaation kasvuun. Tietysti yksi osa kelpoisuutta voi olla eloonjääminen, mutta niin ei tarvitse olla.

Kirjallisuutta

Rice, S. H. 2004. Evolutionary Theory: Mathematical and Conceptual Foundations. Sinauer Associates Inc., Sunderland, MA.