PathMBA Vault

Analytics and data science

La promesa y el desafío del Big Data para la industria farmacéutica

por Ryan Copping, Michael Li

La promesa y el desafío del Big Data para la industria farmacéutica

nov16-29-38003980

La aparición de los macrodatos, así como los avances en los enfoques y la tecnología de la ciencia de datos, están brindando a las compañías farmacéuticas la oportunidad de obtener información novedosa que puede mejorar y acelerar el desarrollo de fármacos. Ayudará cada vez más a las agencias de salud gubernamentales, a los pagadores y a los proveedores a tomar decisiones sobre temas como el descubrimiento de fármacos, el acceso de los pacientes y el marketing. Desde nuestros puntos de vista únicos en Genentech, una empresa biotecnológica líder con una importante práctica en ciencia de datos, y La incubadora de datos, una empresa de educación sobre ciencias de datos que coloca y capacita a científicos de datos, hemos visto cómo la industria farmacéutica ha aprovechado los macrodatos para algunos avances potencialmente revolucionarios y los desafíos a los que se ha enfrentado a lo largo del camino.

Para el sector, el mayor desafío, con diferencia, ha sido el talento: mejorar las habilidades, pasando de las suficientes para analizar cantidades relativamente pequeñas de datos de ensayos clínicos a las necesarias para obtener información a partir de la enorme cantidad de datos del mundo real, incluidos datos no estructurados, como notas, escaneos e imágenes de los médicos e informes de patología. La industria farmacéutica ha registrado una explosión en la cantidad de datos disponibles, más allá de los recopilados en los entornos de ensayos clínicos tradicionales y estrictamente controlados. Sin duda, se ha accedido y analizado a los datos anónimos de las reclamaciones de seguros y a los datos de las historias clínicas electrónicas (EHR) durante muchos años. Pero en el pasado, los datos del EHR solían limitarse a una sola institución de investigación o red de proveedores, y obtener los datos necesarios para ayudar a responder a una pregunta de investigación específica normalmente implicaba un proceso tedioso e ineficiente. Si bien aún queda mucho por hacer para crear métodos estandarizados para compartir y dar sentido a los datos genómicos y del EHR anónimos entre los proveedores, ahora es posible vincular diferentes fuentes de datos, lo que permite abordar cuestiones de investigación complejas.

Centro Insight

Por ejemplo, el análisis de los datos exhaustivos de los pacientes con EHR recopilados en tiempo real durante las visitas al médico o al hospital brinda la oportunidad de entender mejor las enfermedades, los patrones de tratamiento y los resultados clínicos en un entorno real y descontrolado. Estos valiosos conocimientos complementan los obtenidos en los ensayos clínicos y pueden brindar la oportunidad de evaluar un espectro más amplio de pacientes que tradicionalmente se excluyen de los ensayos clínicos (por ejemplo, pacientes de edad avanzada, frágiles o inmóviles, así como personas con indicaciones raras y enfermedades que aún no se han estudiado en los ensayos clínicos). También permite a las empresas evaluar los desafíos del mundo real que no se pueden observar en un ensayo clínico, como el cumplimiento de los medicamentos y la utilización de los recursos de atención médica.

Si bien estos avances generan grandes oportunidades, también plantean desafíos en materia de recursos y desarrollo de capacidades. Una de las más importantes es cómo hacer la transición de la tecnología tradicional y la competencia analítica a herramientas analíticas y metodologías de análisis más potentes y sofisticadas.

Históricamente, la industria farmacéutica ha contratado a programadores de SAS que han realizado análisis bien definidos de los ensayos clínicos de una manera estandarizada y eficiente. Funcionó bien, dado que los ensayos clínicos se diseñaron para responder a las preguntas sobre la eficacia y la seguridad con conjuntos de datos limpios en una estructura estándar del sector en la que faltan pocos valores.

Pero los datos del mundo real vienen en varios formatos diferentes, suelen estar muy desestructurados (contienen datos textuales y otros datos no numéricos) y están plagados de valores faltantes. Son datos desordenados, llenos de inconsistencias, posibles sesgos y ruido. Estos atributos obligan a los científicos de datos a encontrar formas creativas de responder a las preguntas críticas de la investigación para apoyar la investigación y el desarrollo de fármacos y, en última instancia, para proporcionar a los pacientes acceso a las terapias adecuadas.

En consecuencia, existe una creciente necesidad de analistas y científicos de datos que puedan aprovechar al máximo las herramientas y técnicas desarrolladas en Silicon Valley que son capaces de gestionar datos ruidosos y presentar los resultados a las partes interesadas de una manera sencilla y fácil de interpretar. Estos analistas deben ser capaces de hacer frente a la ambigüedad y ser colaborativos, emprendedores y adaptables en sus enfoques. Deben poder postularse «pensamiento de opciones» para saber qué preguntas hacer, qué datos examinar y qué metodologías y tecnologías utilizar para lograr el objetivo. También deben tener un conocimiento profundo del sistema de salud, incluidas sus prácticas estándar, para entender cómo se recopilaron originalmente los datos, qué sesgos pueden existir y cómo se pueden reutilizar para responder a las preguntas de la investigación clínica.

Genentech, propiedad de F. Hoffmann-La Roche, lleva dos años desarrollando esa capacidad. Además de invertir en asociaciones de datos y herramientas de análisis, ha creado una infraestructura de macrodatos, una plataforma que puede analizar miles de millones de registros de pacientes en segundos. Ha estado reclutando y desarrollando agresivamente a personas con las habilidades necesarias, y se ha asociado con universidades y firmas como The Data Incubator para contratar y formar a científicos de datos, y ahora cuenta con un equipo empresarial global de más de 80 personas.

Un ejemplo reciente del tipo de trabajo que lleva a cabo es la creación de una base de datos sobre una cohorte histórica de pacientes del mundo real a los que se les diagnosticó cáncer anteriormente. El equipo analizó sus datos para entender los resultados de los diferentes subtipos de pacientes y regímenes de tratamiento. Esto ayudó a Genentech a aprender cómo las diferentes alteraciones de los biomarcadores y los diferentes patrones de tratamiento afectan a los resultados clínicos en el mundo real. En última instancia, esta información respaldará las decisiones críticas sobre el desarrollo de fármacos. Genentech también utiliza datos del mundo real en otras áreas terapéuticas, como la neurociencia, donde el desarrollo de fármacos es un desafío notoriamente difícil, para entender mejor la variabilidad de los patrones de la enfermedad, las tasas de progresión y las respuestas al tratamiento, y para cuantificar la dinámica de los costes a medida que las enfermedades avanzan.

No será fácil aprender a aprovechar todo el potencial de los datos del mundo real. Pero se puede hacer. El potencial de utilizar esos datos para mejorar el descubrimiento de fármacos y ofrecer los tratamientos correctos a los pacientes correctos en el momento adecuado es enorme.