El nuevo modelo de IA de OpenAI, Rosalind, podría reducir años en el descubrimiento de fármacos. Probablemente no puedas usarlo

En resumen

  • OpenAI presentó GPT-Rosalind para acelerar los flujos de trabajo de descubrimiento de fármacos.
  • Las referencias muestran ganancias sólidas, pero el impacto en el mundo real sigue siendo limitado.
  • El acceso está estrictamente restringido en medio de crecientes preocupaciones de bioseguridad.

OpenAI acaba de nombrar su primer modelo de IA específico de dominio en honor a Rosalind Franklin, la química británica cuyo trabajo en cristalografía de rayos X ayudó a revelar la doble hélice del ADN, y a quien se le negó el crédito por ello durante su vida. GPT-Rosalind, presentado el jueves, es un modelo de razonamiento diseñado específicamente para biología, descubrimiento de fármacos y medicina traslacional. Es el primero en lo que OpenAI llama una serie de modelos de Ciencias de la Vida, una estrategia directa para un mercado donde muchos laboratorios especializados, desde universidades hasta Google DeepMind, compiten por posicionarse. Lograr que un fármaco pase del descubrimiento del objetivo a la aprobación regulatoria en EE. UU. toma en promedio de 10 a 15 años, según expertos. La mayor parte de ese tiempo no se pierde en momentos de eureka, sino en la rutina: analizar miles de artículos, consultar bases de datos, diseñar reactivos e interpretar resultados ambiguos. Esto es lo que GPT-Rosalind intenta abordar. OpenAI argumenta que el modelo puede comprimir ese trabajo en etapas tempranas. Como dijo la compañía, GPT-Rosalind está diseñado para ayudar a los científicos a “explorar más posibilidades, descubrir conexiones que de otro modo pasarían desapercibidas y llegar a mejores hipótesis más rápido.”

 Las referencias respaldan al menos parte de esa ambición. En BixBench, una referencia construida en torno a tareas reales de bioinformática, GPT-Rosalind registró una tasa de aprobación de 0.751, la puntuación más alta entre los modelos con resultados publicados. En LABBench2, superó a su predecesor GPT-5.4 en seis de once tareas. GPT-Rosalind supera a GPT 5.4 en todos los casos relacionados con ciencias de la vida, pero es un modelo muy específico que tendrá un rendimiento inferior en cualquier otra área.

OpenAI también anunció que Dyno Therapeutics ayudará a probar y evaluar su modelo basado en secuencias de ARN no publicadas para descartar la memorización. Las mejores diez presentaciones de GPT-Rosalind se situaron por encima del percentil 95 de expertos humanos en tareas de predicción de secuencias, y alrededor del percentil 84 en generación. Dicho esto, la propia líder de investigación en ciencias de la vida de OpenAI, Joy Jiao, fue cautelosa respecto a lo que el modelo puede hacer realmente. Ella explicó que la compañía no ve a Rosalind como un modelo capaz de crear nuevos tratamientos de forma autónoma, pero dijo a los periodistas que podría ser de gran ayuda para acelerar la investigación. “Creemos que existe una oportunidad real para ayudar a los investigadores a avanzar más rápido en algunas de las partes más complejas y que requieren más tiempo del proceso científico”, afirmó Jiao en una rueda de prensa, según el LA Times. El ecosistema alrededor del modelo puede ser tan importante como el propio modelo. OpenAI también lanzará un plugin gratuito de investigación en Ciencias de la Vida para Codex, que conecta con más de 50 bases de datos y herramientas científicas: consultas de estructuras de proteínas, búsqueda de secuencias, revisión de literatura, pipelines genómicos. Los usuarios empresariales con acceso a GPT-Rosalind tendrán la capa de razonamiento adicional. Los demás podrán usar el plugin con modelos estándar. OpenAI ha alineado una lista de clientes de farmacéuticas y biotecnológicas para el lanzamiento, incluyendo a Amgen, Moderna y Thermo Fisher Scientific. Por separado, está realizando una colaboración de investigación con el Laboratorio Nacional de Los Álamos en el diseño de proteínas y catalizadores guiados por IA. “El campo de las ciencias de la vida exige precisión en cada paso. Las preguntas son altamente complejas, los datos son muy únicos y las apuestas son increíblemente altas”, dijo Sean Bruich, vicepresidente senior de IA y Datos de Amgen, en el anuncio oficial. El acceso a Rosalind está deliberadamente restringido. El modelo solo está disponible para empresas en EE. UU., protegido tras una revisión de calificación y seguridad. La preocupación no es abstracta: una coalición internacional de más de 100 científicos ya ha pedido controles más estrictos sobre los datos biológicos utilizados para entrenar IA, citando riesgos en el diseño de patógenos. La implementación restringida de OpenAI es una respuesta directa. Durante la vista previa de investigación, el uso no consumirá créditos API existentes. Tampoco es la primera incursión de OpenAI en los flujos de trabajo científicos. El espacio de escritura científica Prism, lanzado en enero, fue un primer paso. GPT-Rosalind es la versión más aguda y especializada, y una señal de que los modelos específicos de dominio se están convirtiendo en una competencia seria. Ningún fármaco descubierto completamente por IA ha pasado aún en fase 3. Ese número sigue siendo cero. Pero si GPT-Rosalind ayuda a un investigador a diseñar un experimento mejor en seis meses en miles de laboratorios, el efecto acumulativo en lo que se descubre y cuándo, podría ser decisivo. Esa es la verdadera tesis aquí, y vale la pena seguirla de cerca.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado