Alla ricerca di segni di pressione selettiva in Homo Sapiens Sergio Cocozza Dipartimento di Biologia e Patologia Cellulare e Molecolare Università Federico.

  • Published on
    02-May-2015

  • View
    214

  • Download
    2

Transcript

<ul><li> Slide 1 </li> <li> Alla ricerca di segni di pressione selettiva in Homo Sapiens Sergio Cocozza Dipartimento di Biologia e Patologia Cellulare e Molecolare Universit Federico II Napoli Gruppo Interdipartimentale Bioinformatica e Biologia Computazionale </li> <li> Slide 2 </li> <li> Niente in Biologia di senso se non alla luce dellEvoluzione Theodosius Dobzhansky (1900-1975) </li> <li> Slide 3 </li> <li> Niente in Biologia di senso se non alla luce dellEvoluzione Theodosius Dobzhansky (1900-1975) ed in Medicina </li> <li> Slide 4 </li> <li> Se vuole guarire deve smettere di fumare. Il fumo fa venire il cancro... fa male alla circolazione... ecc ecc Un problema pratico </li> <li> Slide 5 </li> <li> Se vuole guarire deve smettere di fumare. Il fumo fa venire il cancro... fa male alla circolazione... ecc ecc Sciocchezze ! Mio nonno morto a 100 anni fumando sigari toscani ! Un problema pratico </li> <li> Slide 6 </li> <li> gene b gene d ambiente y ambiente x gene a gene c 100 90 80 70 60 50 40 30 20 10 0 100 90 80 70 60 50 40 30 20 10 0 Malattie Multifattoriali </li> <li> Slide 7 </li> <li> gene b gene d ambiente y ambiente x gene a gene c 100 90 80 70 60 50 40 30 20 10 0 100 90 80 70 60 50 40 30 20 10 0 ? </li> <li> Slide 8 </li> <li> Varianti rare e varianti frequenti: chi il colpevole ? </li> <li> Slide 9 </li> <li> Teorie a confronto Alta penetranza (monogenia) Bassa penetranza (poligenia) Bassa penetranza La maggior parte delle mutazioni che causano malattie complesse sono avvenute recentemente, dopo la divergenza delle popolazioni. La conseguenza lattesa di una forte eterogeneit nei geni di suscettibilit per le malattie complesse Common Disease/Rare Allele (CD/RA) Varianti alleliche esistenti prima della dispersione degli umani sulla terra o varianti alleliche sottoposte a pressione selettiva rappresentano una proporzione significativa degli alleli di suscettibilit per le malattie complesse. La conseguenza lattesa di una minore eterogeneit nei geni di suscettibilit per le malattie complesse Common Disease/Common Variant (CD/CV) </li> <li> Slide 10 </li> <li> Pressione selettiva: adattamento e malattia ? Ambiente Genoma ? AdattamentoMalattia </li> <li> Slide 11 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 12 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 13 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 14 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 15 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 16 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 17 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 18 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 19 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 20 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 21 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 22 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 23 </li> <li> Genotipo frugale Accumula peggio i grassi Accumula meglio i grassi </li> <li> Slide 24 </li> <li> Evolution in Health and Medicine Sackler Colloquium PNAS January 26, 2010; 107 </li> <li> Slide 25 </li> <li> Strumenti per lo studio della pressione selettiva Grado di differenziazione genetica delle popolazioni umane (Fst) Omozigosit estesa degli aplotipi (iHS) </li> <li> Slide 26 </li> <li> Normale grado di differenziazione delle popolazioni (deriva genica) </li> <li> Slide 27 </li> <li> Pi alto grado di differenziazione delle popolazioni </li> <li> Slide 28 </li> <li> Pi basso grado di differenziazione delle popolazioni </li> <li> Slide 29 </li> <li> Fst F ST misura le differenze nelle frequenze alleliche tra popolazioni diverse. E' un valore che varia da 0 = nessuna differenza a 1 = massima differenza. E' considerata una delle possibili misure di pressione selettiva </li> <li> Slide 30 </li> <li> iHS Haplotype A Haplotype B Haplotype C Haplotype D Recent Positive Selection </li> <li> Slide 31 </li> <li> iHS Since in neutral models, low frequency alleles are generally younger and are associated with longer haplotypes than higher frequency alleles, we adjust the unstandardized iHS to obtain our final statistic which has mean 0 and variance 1 regardless of allele frequency at the core SNP: The test begins with the EHH (extended haplotype homozygosity) statistic proposed by Sabeti et al.. The EHH measures the decay of identity, as a function of distance, of haplotypes that carry a specified core allele at one end. For each allele, haplotype homozygosity starts at 1, and decays to 0 with increasing distance from the core site in plots of EHH versus distance, the area under the EHH curve will usually be much greater for a selected allele than for a neutral allele. This integrated EHH (iHH) (summed over both directions away from the core SNP) will be denoted iHH A or iHH D, depending on whether it is computed with respect to the ancestral or derived core allele. When the rate of EHH decay is similar on the ancestral and derived alleles, iHH A /iHH D 1, and hence the unstandardized iHS is 0 </li> <li> Slide 32 </li> <li> Scopi del progetto Cercare segni di pressione selettiva nella specie Homo Sapiens e possibili collegamenti con le patologie umane Studio n.1 : Ricerca genome-wide di geni con segni di pressione selettiva e loro caratterizzazione Studio n.2 : Ricerca genome-wide di geni candidati ad essere sotto una specifica pressione selettiva (legata alla latitudine) e loro caratterizzazione </li> <li> Slide 33 </li> <li> Scopi del progetto Cercare segni di pressione selettiva nella specie Homo Sapiens e possibili collegamenti con le patologie umane Studio n.1 : Ricerca genome-wide di geni con segni di pressione selettiva e loro caratterizzazione Studio n.2 : Ricerca genome-wide di geni candidati ad essere sotto una specifica pressione selettiva (legata alla latitudine) e loro caratterizzazione </li> <li> Slide 34 </li> <li> Frequenze alleliche di circa 4,000,000 SNP di circa 500 individui da tre differenti gruppi etnici [HapMap Public Release #27 (merged II+III)] Studio n.1 Data set </li> <li> Slide 35 </li> <li> Metodi Dati addizionali sulle SNP (posizione fisica, associazione SNP- gene furono ottenuti da dbSNP (build 129) I dati di HAPMAP e dbSNP furono fusi in un database locale MySQL attraverso un set di script Perl Furono escluse dall'analisi SNP che fossero risultate non campionate o non polimorfiche in tutte le tre popolazioni. Furono inoltre escluse le SNP con una frequenza dell'allele minore &lt; 5% in tutti le tre popolazioni. Dopo tale selezione il campione conteneva 2.125.440 SNP Il calcolo dell'Fst fu effettuato con uno script utilizzando la formula di Wright (con correzione di Weir per la numerosit) Per assegnare un valore di Fst ad un determinato gene fu usato il massimo valore trovato tra le SNP associate a quel gene </li> <li> Slide 36 </li> <li> Distribuzione dei valori di Fst da noi calcolati lungo i cromosomi </li> <li> Slide 37 </li> <li> Autocorrelazione L'autocorrelazione stata calcolata per ogni cromosoma, per ogni coppia di SNP separate da un fissato numero di SNP intermedie. La linea nera mostra il valore medio (+ 2 SE) delle correlazioni sugli autosomi. La linea rossa mostra le correlazioni delle SNP sul cromosoma X Risultato: Il segnale non distribuito in maniera randomiana. Ljung-Box test p &lt; 10 - 16 </li> <li> Slide 38 </li> <li> Distribuzione Fst tra i cromosomi Risultato I valori di Fst sono distribuiti differentemente tra gli autosomi e gli eterocromosomi (p &lt; 10 -16 ) Per ogni cromosoma mostrato il box-plot dei valori di Fst. Il rettangolo delimitato dal primo e dal terzo quartile e diviso al suo interno dalla mediana. I segmenti (i "baffi") sono delimitati dal minimo e dal massimo dei valori. Gli estremi dell'incisura rappresentano il 95% di intervallo di confidenza della mediana. </li> <li> Slide 39 </li> <li> Commento La differenza tra eterocromosomi e autosomi potrebbe essere dovuta a: Campione effettivo di popolazione pi piccolo ( per X e per Y rispetto agli autosomi) Diversa frequenza di ricombinazione Diversa pressione selettiva tra maschi e femmine </li> <li> Slide 40 </li> <li> Comparazione con altre misure di pressione selettiva: Dn/Ds ratio Esistono altri metodi per studiare la pressione selettiva Alcuni di essi si basano sull'analisi comparativa di differenti specie (misura interspecie) Il metodo Dn/Ds valuta il rapporto tra mutazioni sinonime e non sinonime Un rapporto alto indica selezione positiva </li> <li> Slide 41 </li> <li> Variabilit intraspecie (Fst) vs Variabilit interspecie (Dn/Ds) Risultato I geni con segni di pressione selettiva interspecie (Dn/Ds &gt; 1) mostrano un valori medi di Fst significativamente pi bassi (p &lt; 0.001) I geni sono stati raggruppati in accordo con l'evidenza di selezione positiva nell'analisi di 6 specie di mammifero (Kosiol et al. 2008 Plos Genetics). Le barre verticali rappresentano il 95% di intervallo di confidenza) </li> <li> Slide 42 </li> <li> Gene Set Enrichment Analysis GSEA L'idea chiave di GSEA quella di valutare l'arrichhimento di una lista di geni non attraverso la valutazione di singoli geni outliers ma attraverso quella di set di geni funzionalmente collegati Dal punto di vista statistico GSEA limita i danni della correzione da test multiplo GSEA usata comunemente nell'analisi di array. Per la prima volta ne abbiamo proposto un uso per l'analisi della funzione dei geni in base al loro valore di Fst </li> <li> Slide 43 </li> <li> Pathways (KEGG ) arricchite per geni con valori di Fst statisticamente diversi dalla media Pathways arricchite per geni con alto F ST Axon guidance (FDR</li></ul>

Recommended

View more >