Informática biomédica y su impacto en el I+D de medicamentos

Ferran SanzDirector, Programa de Investigación en Informática Biomédica (GRIB)IMIM - Hospital del MarUniversidad Pompeu FabraParque de Investigación Biomédica de Barcelona (PRBB)

La investigación y desarrollo de medicamentos requiere esfuerzos coordinados de múltiples disciplinas. En los procesos actuales de I+D de medicamentos, disciplinas experimentales como la genómica, la proteómica, la química farmacéutica o la farmacología, se combinan con las distintas especialidades médicas y con la epidemiología. Todas estas disciplinas se combinan en proyectos de gran complejidad, coste y duración que permiten avanzar desde el descubrimiento de nuevas dianas terapéuticas hasta la puesta en el mercado de nuevos medicamentos, e incluso más allá si consideramos las investigaciones que se deben llevar a cabo para monitorizar las consecuencias del uso de los medicamentos por parte de la población. A lo largo de dichos proyectos se genera gran cantidad de datos e información que debe ser adecuadamente gestionada y explotada. Por suerte, el gran desarrollo de las tecnologías de la información y de las comunicaciones (TIC) que estamos viviendo permite la gestión de grandes cantidades de datos y la ejecución de análisis computacionales de gran sofisticación.

En cada una de las etapas del I+D de medicamentos han emergido aplicaciones de las TIC que posibilitan la gestión y análisis de la información que se genera. En la Fig. 1 se resume el proceso de I+D de medicamentos y las aplicaciones de las TIC que se usan en cada una de las etapas. Así, el descubrimiento y validación de nuevas dianas terapéuticas requieren una aplicación intensiva de métodos y herramientas bioinformáticas con el fin de gestionar datos genómicos, proteómicos y metabolómicos, incluyendo los que se originan en experimentos de micromatrices (microarrays), y analizarlos con el fin de comprender las funciones biológicas de los genes y proteínas, tanto a nivel individual como en el marco de las redes de relaciones que constituyen la llamada biología de sistemas. Un aspecto importante a considerar en los análisis computacionales de información genómica y proteómica relativa a las dianas de los medicamentos es el de las diferencias que se presentan entre especies (por ejemplo, animal de laboratorio vs. especie humana) y que son responsables de diferencias que luego se presentan entre los estudios preclínicos y los ensayos clínicos. Otro análisis bioinformático relevante en el ámbito genómico es el de la variabilidad interindividual, pues ésta está relacionada con la respuesta diferencial de los pacientes a los tratamientos farmacológicos. Una fuente recomendable de información sobre este tema es la base de datos PharmGKB sobre conocimiento farmacogenético y farmacogenómico (www.pharmgkb.org).2


Fig. 1. Herramientas informáticas y computacionales en el proceso de I+D de medicamentos

Siguiendo con la descripción de las aplicaciones informáticas presentadas en la Fig. 1, a continuación tenemos aquellas otras que ayudan al descubrimiento y optimización de las nuevas estructuras químicas que pueden llegar a constituir un nuevo medicamento. Así, las aplicaciones de cribado virtual (“virtual screening”)3 permiten, a partir de grandes bases de datos de estructuras químicas (“quimiotecas” o chemical libraries), seleccionar aquellos compuestos que presentan una mayor probabilidad de resultar adecuados en su perfil de eficacia terapéutica o seguridad clínica. Dicho cribado se suele llevar a cabo utilizando descriptores moleculares o farmacóforos (distribuciones 3D de características moleculares). La estrategia de cribado a menudo consiste en analizar la similitud entre los perfiles farmacofóricos o de descriptores moleculares de los compuestos de la quimioteca, y los perfiles que corresponden a moléculas previamente estudiadas y que mostraron el perfil farmacológico deseado. Por otra parte, el conocimiento experimental (o la predicción computacional) de la estructura tridimensional de las dianas farmacológicas permite estudiar la interacción entre ellas y sus fármacos o ligandos, ayudando a diseñar nuevas moléculas que presenten el perfil de interacciones deseado (Fig. 2).4,5 Continuando con la descripción de técnicas computacionales que combinan información química y biológica, conviene señalar aquellas que permiten llevar a cabo predicciones de las propiedades ADMET (Adsorción, Distribución, Metabolismo, Excreción y Toxicidad) de los compuestos sometidos a evaluación preclínica. Tanto las predicciones de afinidad por dianas farmacológicas como las predicciones de propiedades ADMET se llevan a cabo a menudo mediante el ajuste de modelos matemáticos QSAR (Quantitative Structure-Activity Relationships) que relacionan descriptores moleculares con propiedades biológicas (Fig. 3).


Fig. 2. Modelo de la interacción de clozapina en el sitio de unión del receptor humano 5-HT2A. 5



Fig. 3. Matriz de datos utilizada para obtener modelos QSAR


Un ejemplo reciente de desarrollo de un modelo predictivo de afinidad de una serie de compuestos por un receptor biológico lo constituye el trabajo realizado sobre una serie de 142 butirofenonas sintetizadas y evaluadas farmacologicamente en la Universidad de Santiago de Compostela.4 El modelo para predecir la afinidad de compuestos de dicha serie por el receptor 5-HT2A humano se desarrolló siguiendo los pasos siguientes:

1) Generación de un modelo tridimensional de la estructura del receptor 5-HT2A humano, mediante técnicas de modelado por homología y usando como patrón otro receptor similar del que se había conseguido determinar su estructura por métodos experimentales (hasta hace poco tiempo el único patrón disponible era la rodopsina bovina, actualmente se dispone también de la estructura del receptor ß2-adrenérgico).

2) Simulación del acoplamiento de un compuesto (ketanserina) parecido a las butirofenonas estudiadas y del que se dispone de datos de mutagénesis dirigida que permiten verificar la validez del modo de unión obtenido (Fig. 4).


Fig. 4. Modelo estructural del receptor 5-HT2A humano con la ketanserina acoplada en su sitio de unión. 4


3) Simulación del acoplamiento de los compuestos de la serie problema en el receptor 5-HT2A, usando el programa GOLD, con el fin de obtener una superposición estructural entre ellos (Fig. 5).


Fig. 5. Superposición bioactiva de las butirofenonas de la Ref. 4


4) Usando dicha superposición, se desarrolló un modelo 3D-QSAR con el programa GRID/GOLPE que resultó de gran poder predictivo (80% de varianza explicada y un error estándar de las predicciones de 0,53 unidades de pKi) (Fig. 6).


Fig. 6. Comparación entre las afinidades (pKi) experimentales y las predichas en el estudio sobre la serie de butirofenonas. 4


Para finalizar con la presentación de las aplicaciones informáticas y computacionales indicadas en el esquema de la Fig. 1, nos centraremos en aquellas que sustentan la investigación clínica de nuevos medicamentos. Así, las técnicas de la biosimulación permiten desarrollar poblaciones virtuales que se usan en la simulación de ensayos clínicos, y de esta forma se puede reducir el número de pacientes que se requiere para los ensayos clínicos reales. Por otra parte, la informática médica juega un papel clave en la estandarización, almacenamiento y explotación de la información que se genera durante los ensayos clínicos y, asimismo, constituye la herramienta imprescindible para acumular y explotar la información necesaria para llevar a cabo estudios de farmacoepidemiologia y farmacovigilancia en relación a los medicamentos disponibles en el mercado. La explotación de grandes bases de datos de historias clínicas convenientemente anonimizadas constituye una estrategia muy potente para la detección de posibles efectos adversos de medicamentos. Esta estrategia se está desarrollando en el proyecto ALERT recientemente financiado por la Comisión Europea (www.ehealthnews.eu/content/view/1032/66).

La predicción computacional de propiedades biológicas de compuestos, a partir de conocimiento previamente acumulado, es un campo relativamente maduro que esta produciendo resultados que se consideran útiles tanto en entornos académicos como industriales. Hay que señalar que entre todos los métodos y programas existentes resultan especialmente fiables aquellos que predicen las afinidades de ligandos por dianas biológicas en el marco de series relativamente congenéricas y usando información estructural. Sin embargo, aunque las dianas estudiadas sean las responsables de los efectos terapéuticos o indeseables de los fármacos, todavía estamos lejos de ser capaces de modelar eficazmente las relaciones existentes entre las interacciones ligando-diana que podemos medir in vivo (o predecir in silico) y las observaciones farmacológicas que se llevan a cabo en experimentos in vivo o en el marco de ensayos clínicos, permitiendo la obtención de buenas predicciones de las segundas a partir de las primeras. Para superar las limitaciones actuales en nuestras capacidades de predecir el comportamiento clínico de los medicamentos a partir de información obtenida a escala molecular y celular, existe un amplio consenso sobre la necesidad de disponer de grandes bases de datos que acumulen información molecular, resultados de experimentos in vitro e in vivo, y observaciones clínicas, así como nuevas estrategias de modelado para explotar dichas bases de datos y avanzar en la predicción de la eficacia y seguridad de los medicamentos a partir de información que se puede generar en fases muy tempranas del I+D farmacéutico (Fig. 7). Se debe cuidar que las citadas bases de datos contengan toda la diversidad estructural y biológica que se requiere para el desarrollo de modelos con alta capacidad predictiva. La generación de estas bases de datos es uno de los objetivos científicos que se proponen en la agenda estratégica de investigación de la Innovative Medicines Initiative (imi.europa.eu), promovida por la Comisión Europea y la Federación Europea de la Industria Farmacéutica (EFPIA).


Fig. 7. Objetivo a medio plazo en la predicción del perfil terapéutico y de efectos secundarios de los medicamentos.

Por otra parte, teniendo en cuenta la dimensión actual de información biomédica acumulada y su crecimiento exponencial (cada año se están incorporando unas 400.000 referencias nuevas a Medline), se están haciendo imprescindibles las técnicas de minería de textos (text mining) que permiten la extracción de conocimiento a partir de literatura biomédica.9,10

En general y como corolario, se puede afirmar que debemos avanzar hacia una mayor integración de información biomédica para obtener una visión más completa de las enfermedades, de su tratamiento farmacológico y de las reacciones adversas a los medicamentos (Fig. 8). La informática biomédica es la disciplina que intenta promover dicha visión integrada de la gestión y explotación de la información biomédica, desarrollando las estrategias, métodos y herramientas adecuadas.11


Fig. 8. Tipos de información biomédica que hay que integrar para potenciar el I+D de medicamentos



Bibliografía

1 Kell DB. Systems biology, metabolic modelling and metabolomics in drug discovery and development. Drug Discov Today 2007; 11: 1085-92.

2 Altman RB. PharmGKB: a logical home for knowledge relating genotype to drug response phenotype. Nat Gen 2007; 39: 426.

3 Eckert H, Bajorath J. Molecular similarity analysis in virtual screening: foundations, limitations and novel approaches. Drug Discov Today 2007; 12: 225-33.

4 Dezi C, Brea J, Alvarado M, Raviña E, Masaguer CF, Loza MI, Sanz F, Pastor M. Multistructure 3D-QSAR Studies on a series of conformationally constrained butyrophenones docked into a new homology model of the 5-HT2A receptor. J Med Chem 2007; 50: 3242-55.

5 Selent J, López L, Sanz F, Pastor M. Multireceptorial binding profile of clozapine and olanzapine. A structural study based on the new β2 adrenergic receptor template. ChemMedChem 2008. In press.

6 Norinder U, Bergström CAS. Prediction of ADMET properties. ChemMedChem 2006; 1: 920-37.

7 Rostami-Hodjegan A, Tucker GT. Simulation and prediction of in vivo drug metabolism in human populations from in vitro data. Nat Rev Drug Disc 2007; 6: 140-8.

8 Pitluk Z, Khalil I. Achieving confidence in mechanism for drug discovery and development. Drug Discov Today 2007; 12: 924-30.

9 Jensen LJ, Saric J, Bork P. Literature mining for the biologist: from information retrieval to biological discovery. Nat Rev Gen 2006; 7: 119-29.

10 Furlong LI, Dach H, Hofmann-Apitius M, Sanz F. OSIRISv1.2: A named entity recognition system for sequence variants of genes in biomedical literature. BMC Bioinformatics 2008; 9: 84.

11 Loging W, Harland L, Williams-Jones B. High-throughput electronic biology: mining information for drug discovery. Nat Rev Drug Disc 2007; 6: 220-30.

____________________________________
Ferran Sanz

Profesor de Bioestadística e Informática Biomédica en la Universidad Pompeu Fabra (UPF) de Barcelona. Director de la Unidad de Investigación en Informática Biomédica (GRIB) del IMIM y de la UPF. Vicerrector de Política Científica de la UPF. Autor de más de unos 100 artículos publicados en revistas incluidas en el Science Citation Index. Director de 17 tesis doctorales. Coordinador de varios proyectos financiados por la Comisión Europea, así como de un estudio por encargo del Parlamento Europeo. Presidente de la Federación Europea para la Química Farmacéutica (EFMC) en el período 2003-2005. Ha estado involucrado en al génesis de la Innovative Medicines Initiative como experto invitado, y actualmente ejerce la coordinación académica de la Plataforma Tecnológica Española Medicamentos Innovadores. Coordinador del nodo de Informática Biomédica del Instituto Nacional de Bioinformática (INB).