Tropsha Las Mejores Prácticas Para Desarrollo De Modelo De QSAR, Validación, Y Explotación
Enviado por CarinBO • 24 de Octubre de 2012 • 9.064 Palabras (37 Páginas) • 861 Visitas
1 Introducción: Principios Básicos y Proceso laboral de QSAR Profético el Modelado del desarrollo Rápido de información y tecnologías de comunicación durante las pocas décadas pasadas dramáticamente han cambiado nuestras capacidades de recogimiento, análisis, almacenaje y diseminación todos los tipos de datos. Este proceso ha tenido una influencia profunda sobre la investigación científica en muchas disciplinas, incluyendo el desarrollo de las generaciones nuevas de medicinas eficaces y selectivas. Bases de datos grandes que contienen millones de compuestos químicos probados en varios ensayes biológicos como PubChem [1] están cada vez más disponibles como colecciones en línea (recientemente repasadas por Oprea y Tropsha; [2] mirar también el comentario reciente por Williams et al. [3]). Para encontrar la nueva medicina conduce, hay una necesidad de los procedimientos eficientes y robustos que pueden ser usados proteger bases de datos químicas y bibliotecas virtuales contra moléculas con actividades sabidas o propiedades. A este final, Relaciones de Actividad de estructura Cuantitativas (QSAR) el modelado proporcionan un medio eficaz tanto para la exploración como para la explotación de la relación entre la estructura química y su acción biológica hacia el desarrollo de candidatos de medicina nuevos. El acercamiento de QSAR generalmente puede ser descrito como un uso de métodos de análisis de datos y estadística al desarrollo de los modelos que con exactitud podrían predecir actividades biológicas o propiedades de compuestos basados en sus estructuras. Cualquier método QSAR generalmente puede ser definido como un uso de métodos matemáticos y estadísticos al problema de encontrar relaciones empíricas (QSAR modelos) de la forma Pi=k ' (D1, D2, …, Dn), donde la Pi es actividades biológicas (u otras propiedades de interés) de moléculas, D1, D2, …, Dn es calculado (o, a veces, experimentalmente medido) propiedades estructurales (descriptores moleculares) de compuestos, y la k ' son unos empíricamente establecieron la transformación matemática que debería ser aplicada a descriptores para calcular los valores de propiedad para todas las moléculas (la Figura 1). El objetivo de modelado de QSAR es de establecer una tendencia en los valores descriptivos, que paralelos la tendencia en la actividad biológica. En la esencia, todos los accesos de QSAR implican, directamente o indirectamente, un principio de semejanza simple, que durante mucho tiempo ha proporcionado una fundación para la química experimental medicinal: esperan compuestos con estructuras similares para tener actividades similares biológicas. La descripción detallada de los principios principales de modelado de QSAR está fuera del alcance de este papel; la descripción de muchos QSAR populares técnicas que modelan incluyendo técnicas estadísticas y datamining así como accesos a cálculos descriptivos podría ser encontrada en muchas revisiones y monografías, p.ej., [4, 5]). Aquí, comentamos los aspectos generales más críticos de desarrollo modelo y, el más pretenciosamente, la validación que es sobre todo importante en el contexto de usar modelos de QSAR para la selección virtual. La mayor parte de nuestra discusión captura tendencias que el autor ha u observado o ha contribuido en los 20 años pasados de investigación activa en el campo. La información adicional importante que concierne ambos errores comunes así como prácticas establecidas en el QSAR que modela el campo puede ser encontrada en otros ensayos críticos sobre el sujeto, p.ej., por Stouch et al. [6] y Dearden et al. [7
Nuestra experiencia en el desarrollo de modelo de QSAR y la validación nos ha conducido a establecer una estrategia [8] compleja que es resumida en la Figura 2. Esto describe QSAR profético el proceso laboral que modela enfocado la entrega modelos validados y en última instancia, los golpes computacionales que en última instancia deberían confirmar la validación experimental. Comenzamos por con cuidado curar estructuras químicas y, de ser posible, asociamos actividades biológicas para preparar el juego de datos para cálculos subsecuentes. Esta publicación de evaluación y dirección de la exactitud de datos correctamente no ha sido dirigida en la literatura y hablamos de algunos aspectos de este componente crítico del proceso laboral debajo. Entonces, una fracción de compuestos (típicamente, el 10-20 %) es seleccionada al azar como un juego de evaluación externo (un pliegue de n más riguroso el protocolo de validación externo puede ser empleado cuando el juego de datos al azar es dividido en la n casi igualan partes y luego la n ' 1 partes sistemáticamente son usadas para el desarrollo modelo y la fracción restante de compuestos es usada para la evaluación modelo). El protocolo de Exclusión de Esfera puesto en práctica en nuestro laboratorio [9, 10] entonces es usado racionalmente dividir el subconjunto restante de compuestos (el juego de modelado) en múltiple educación y los juegos de prueba que son usados para el desarrollo modelo y la validación, respectivamente (accesos alternativos racionales para dividir el juego de modelado sobre la educación diversa y representativa y prueban juegos podría ser inventado también). Empleamos múltiples técnicas QSAR basadas en la exploración combinatoria de todos los pares posibles de juegos descriptivos y varias técnicas de análisis de datos supervisadas (combi-QSAR) y seleccionamos modelos caracterizados por la alta exactitud en la predicción tanto educación como probamos datos de juegos. Los umbrales de aceptabilidad modelos típicamente son caracterizados por el valor aceptable más bajo de la cruz " se marchan un hacia fuera " R2 validado (q2) para el juego de educación y por R2 convencional para el juego de prueba; nuestros valores de falta son 0.6 tanto para q2 como para R2. Todos los modelos validados finalmente son probados en un conjunto que usa el juego de evaluación externo. El paso crítico de la validación externa es el empleo de dominios de aplicabilidad (el ANUNCIO), que es definido únicamente para cada modelo usado en el acuerdo general (el conjunto) la predicción del juego externo. Si la validación externa demuestra el poder significativo profético de los modelos los empleamos para la selección virtual de bases de datos disponibles químicas (p.ej., el ZINC [11]) para identificar compuestos supuestos activos y trabajo con los colaboradores que podrían validar tales golpes experimentalmente.
Alexander Tropsha es la K. H. El Sotavento Distinguió al Profesor y la Silla de la División de Química Medicinal y Productos Naturales en la Escuela Eshelman de Farmacia, la Colina de UNC-CAPILLA. Él recibió el doctorado en el Producto químico Enzymology en 1986 de la Universidad Estatal de Moscú, Rusia. Él inmigró a los Estados
...