ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

Genealogías locales

leoduk198118 de Enero de 2013

4.416 Palabras (18 Páginas)402 Visitas

Página 1 de 18

Genealogías locales en un modelo lineal mixto para todo el genoma, mapeo de asociación en poblaciones con pedigrí complejos

Goutam Sahana1 *, Thomas Mailund2, Mogens Sando Lund1, Bernt Guldbrandtsen1

1 Departamento de Biología Molecular y Genética de la Facultad de Ciencia y Tecnología, la Universidad de Aarhus, Tjele, Dinamarca, 2 de Bioinformática del Centro de Investigación (BIRC), la Universidad de Aarhus, Aarhus C, Dinamarca

Resumen

Introducción

El estado de la técnica para hacer frente a múltiples niveles de relación entre las muestras en todo el genoma estudios de asociación (GWAS) se unifica el análisis de modelo mixto (MMA). Este enfoque es muy flexible, puede ser aplicado a ambas muestras basadas en la familia y basados en la población, y se puede ampliar para incorporar otros efectos de un modo sencillo y riguroso. A continuación, presentamos un enfoque complementario, llamado "GENMIX (genealogía basada en el modelo mixto) ', que combina las ventajas de dos métodos de gran alcance: la genealogía GWAS basado agrupación haplotipo y MMA.

Sujetos y métodos

Hemos validado con datos de genotipado GENMIX daneses de ganado Jersey y el fenotipo simulado y en comparación con el MMA. Nosotros, los escenarios simulados para tres niveles de heredabilidad (0,21, 0,34 y 0,64), siete niveles de MAF (0,05, 0,10, 0,15, 0,20, 0,25, 0,35 y 0,45) y cinco niveles de efecto QTL (0,1, 0,2, 0,5, 0,7 y 1,0 en la unidad fenotípica desviación estándar). Cada una de estas 105 combinaciones posibles (3 h2 x 7 x 5 MAF efectos) de los escenarios se repitió 25 veces.

Resultados

GENMIX proporciona una mejor clasificación de los marcadores cercanos a la localización del locus causal '. GENMIX superaron a las MMA, cuando el efecto QTL era pequeña y el MAF en el QTL fue baja. En escenarios donde MAF fue alta o el QTL que afecta la característica tuvo un gran efecto tanto GENMIX y MMA realiza de manera similar.

Conclusión

En los estudios de descubrimiento, donde los altos marcadores identificados y posteriormente examinado en los estudios de validación, por lo que esperamos GENMIX para enriquecer los candidatos presentados a los estudios de seguimiento con los verdaderos positivos sobre los falsos positivos más que el MMA lo haría.

Citation: Sahana G, Mailund T, Lund MS, Guldbrandtsen B (2011) Local Genealogies in a Linear Mixed Model for Genome-Wide Association Mapping in Complex Pedigreed Populations. PLoS ONE 6(11): e27061. doi:10.1371/journal.pone.0027061

Editor: Zhongming Zhao, Vanderbilt University Medical Center, United States of America

Received: June 28, 2011; Accepted: October 10, 2011; Published: November 2, 2011

Copyright: © 2011 Sahana et al. This is an open-access article distributed under the terms of the Creative Commons Attribution License, which permits unrestricted use, distribution, and reproduction in any medium, provided the original author and source are credited.

Funding: The work was funded by the Danish Agency for Science, Technology and Innovation, Copenhagen, Denmark, FTP grant no. 09-065751. The genotypes and pedigree information on Danish Jersey population were from the project “Genomic Selection—From Function to Efficient Utilization in Cattle Breeding” (grant no. 3412-08-02253), funded by the Danish Directorate for Food, Fisheries and Agri Business, VikingGenetics, Nordic Genetic Evaluation, and Aarhus University. The funders had no role in study design, data collection and analysis, decision to publish, or preparation of the manuscript.

Competing interests: The authors have declared that no competing interests exist.

* E-mail: Goutam.Sahana@agrsci.dk

Introducción

Aunque la mayoría de los estudios del genoma completo de la asociación se basan en pruebas de un solo marcador, basados en las pruebas de haplotipos que se espera a tener más poder, si se aplica adecuadamente [1] - [2]. Pruebas basadas en la genealogía de haplotipos son potencialmente los más poderosos. Cualquier fenotipo-que afectan el potencial de mutación debe haber ocurrido en un linaje ancestral de una genealogía local, es decir, que debe estar en un borde de un local de gen-árbol. Si las genealogías locales son conocidas, que ofrecen un conjunto óptimo de las hipótesis a probar, mucho menor que si todos los haplotipos en una región se pusieron a prueba.

Sin embargo, la genealogía local de verdad nunca se sabe, sino que debe ser inferida. En general, existe un trade-off en los métodos de inferencia entre la precisión y la eficiencia computacional. El método Blossoc [3] - [5] tiene como objetivo principal la eficiencia computacional. Se analiza bases de datos fácilmente GWAS en horas en un ordenador de sobremesa, pero aún así se infiere genealogías locales lo suficientemente bien para competir fuera de las pruebas de marcadores individuales en la localización y la precisión de la clasificación. Un supuesto subyacente en Blossoc, sin embargo, es que las muestras no están relacionados, que no es siempre el caso en genética humana y generalmente nunca para las poblaciones de ganado.

El estado de la técnica para hacer frente a múltiples niveles de relación entre las muestras es Yu et al. Unificado modelo mixto [6] 's. Este enfoque es muy flexible, puede ser aplicado a ambas muestras basadas en la familia y basados en la población, y se puede ampliar para incorporar otros efectos de un modo sencillo y riguroso.

En este artículo presentamos un nuevo método, GENMIX (genealogía modelo mixto basado en), que combina las genealogías locales, con el modelo mixto unificado. Nosotros lo comparamos con el estado actual de la técnica, el modelo unificado mixto [6], en los datos simulados de ganado y demostrar que GENMIX ofrece una mejor clasificación de los marcadores: en el 90% de las simulaciones, el más alto rango en el marcador GENMIX cae dentro de 1Mbp del verdadero indicador, en comparación con sólo el 76% para el modelo mixto unificado. En los estudios de descubrimiento, donde los altos marcadores identificados y posteriormente examinado en los estudios de validación, por lo que esperamos GENMIX para enriquecer los candidatos presentados a los estudios de seguimiento con los verdaderos positivos sobre los falsos positivos más que el modelo mixto unificado

Métodos

El ADN fue extraído de muestras de semen de toros Jersey daneses para tipificar genéticamente en un proyecto diferente que ha sido reconocido, por lo que no era necesaria la aprobación ética para este estudio.

Pedigree y el marcador de genotipos

Se utilizó la población danesa Jersey para simular los datos. Los genotipos de los marcadores de Bos taurus cromosoma 6 (BTA6) de 1.407 individuos de la muestra del árbol genealógico de ganado lechero Jersey daneses se utilizaron para los análisis. El árbol genealógico se remonta por lo que los registros estaban disponibles (1937) y contenía 8.063 personas. La genotipificación se realizó con el Illumina BeadChip SNP50 bovina (Illumina Inc) en la Universidad de Aarhus, el Centro de Investigación Foulum, Departamento de Genética y Biotecnología y en GenoSkan, el parque de agronegocios, Foulum, Dinamarca. Los marcadores fueron montados de acuerdo a los bovinos genoma de montaje 4.0, Btau_4.0 [7]. Marcadores que faltan y la fase de vinculación se infiere utilizando el software de fastPHASEnd [8]. SNP loci con un alelo menor frecuencia de menos de 5% se omitieron. Después de la edición de datos para el genotipado de la calidad, los SNPs 1695 se utilizaron para el análisis final. La longitud total del cromosoma entre corchetes fue de 122 Mbp. La distancia media entre los SNPs era 71,98 kpb.

Simulación de QTL y fenotipos

Elegimos al azar SNPs 7 de un total de 1.695 SNPs en BTA6 con frecuencias de alelos menores 0.05, 0.10, 0.15, 0.20, 0.25, 0.35 y 0.45 como QTL. Estos SNPs 7 se extendían a través del cromosoma y por lo tanto, representan un amplio espectro de LD regional. Hubo 5 niveles de efectos QTL 0.1, 0.2, 0.5, 0.7, 1.0 en la unidad de desviación estándar fenotípica. Los fenotipos se obtienen como la suma de un efecto QTL simulado, un efecto residual y un poligénica aleatorio residual. Los efectos poligénicos residuales se generaron en dos pasos. En primer lugar, los valores poligénicos para las personas con padre desconocido se tomaron muestras de una distribución normal con media 0 y varianza de 1. Los efectos residuales poligénicos para la siguiente generación se obtuvieron mediante la suma de la mitad de los valores del padre y la madre poligénicos valores residuales y un plazo de toma de muestras mendeliana. La varianza residual se tomaron muestras para lograr los tres niveles de heredabilidad de 0,21, 0,34 y 0,64. Estos tres niveles de heredabilidad fueron elegidos para que coincida con los datos de Yu et al. [6].

Para cada conjunto de datos de un SNP, de los SNPs siete seleccionados sobre la base de MAF, fue considerado como un QTL. El SNP asignado como QTL se retira del marcador establece analizado por lo que el número total de marcadores utilizados para cada análisis fue 1.694. La varianza genética aditiva debido a la QTL se calculó como 2p (1 - p) α2, donde α es el efecto sustitución de alelo del QTL y p es la frecuencia del alelo menor de edad en el lugar. En cada escenario de simulación, α se ajustó sobre la base de las frecuencias de los alelos del SNP en el árbol genealógico para obtener cada uno de los QTL explican una proporción predefinida de la variación fenotípica.

...

Descargar como (para miembros actualizados) txt (27 Kb)
Leer 17 páginas más »
Disponible sólo en Clubensayos.com