Aprendizaje automático para avanzar en todos los campos científicos

En los últimos años, ha habido una mejora notable en el tratamiento del cáncer. Los avances científicos han dado lugar a terapias innovadoras, como la terapia biológica, que se basa en la modificación de genes que afectan la respuesta del sistema inmunitario frente a los tumores. Pero incluso en esta área, hay espacio para una mejora significativa. «El aprendizaje automático nos permitirá encontrar docenas, si no cientos, de otros genes de este tipo que actualmente están ocultos», dice el Dr. Ofir Lindenbaum de la Facultad de Ingeniería. “Localizarlos conducirá al desarrollo de medicamentos nuevos, personalizados y mucho más efectivos que los biológicos y, por supuesto, los medicamentos que tenemos hoy”.

Lindenbaum se especializa en aprendizaje automático. “Al comienzo de la investigación, me involucré en el procesamiento de señales y, más tarde, cambié hacia el aprendizaje automático, donde la pregunta que me preocupó durante todo el camino fue cómo extraer de los datos observables la información científica latente que nos interesa”, dijo. dice. “Durante mi doctorado, trabajé en la integración de información de múltiples vistas obtenida simultáneamente de diferentes dispositivos de medición, como audio e imágenes de instrumentos de rayos X y resonancia magnética. Mi objetivo era aprender a utilizar el aprendizaje automático para encontrar una representación fusionada que caracterizara mejor la información latente del sistema de interés”.

Durante su investigación postdoctoral en matemáticas aplicadas en la Universidad de Yale, recuerda: “Me ocupé principalmente de datos biológicos y médicos. Mi trabajo en Yale era principalmente con investigadores de las facultades de medicina y biología, que planteaban una pregunta científica y trataban de resolverla recolectando medidas de alta dimensión, como información genética de células o imágenes médicas”, relata. “Mi trabajo consistía en desarrollar herramientas que ayudaran, a través de la automatización que posibilita el aprendizaje automático, a encontrar patrones y variables que afectan los problemas médicos. Estuve en Yale durante tres años y medio, aunque el último año estuve en Israel, debido al COVID-19, que permitió a personas informáticas como yo trabajar de forma remota”.

Llegó a la Facultad de Ingeniería de BIU en octubre de 2021 y se incorporó al track de Data Science. Estableció su grupo, Machine Learning for Scientific Discovery, que trabaja en el desarrollo de herramientas de aprendizaje automático que ayudarán automáticamente en la investigación de cuestiones científicas. “Mi grupo es muy diverso”, dice. “Todos estamos involucrados en el desarrollo de herramientas que ayudarán con problemas científicos prácticos, pero en diferentes áreas. Mi laboratorio está investigando problemas relacionados con la psicología, la biología y la neurociencia. Una colaboración con el Dr. Vadim Axelrod del Centro Multidisciplinario de Investigación del Cerebro Gonda se dedica a predecir la conciencia de las personas en un estado vegetativo utilizando mediciones llamadas fMRI. Otro proyecto cooperativo, con la Prof. Sharon Ganot de la Facultad de Ingeniería, se ocupa del procesamiento de señales. Un tercer estudio de investigación, con el Dr. Yonatan Ganot del Departamento de Geografía, se enfoca en predecir inundaciones urbanas”.

Al mismo tiempo, el Dr. Lindenbaum ha abierto un nuevo curso de maestría que trata sobre el aprendizaje no supervisado. “El aprendizaje no supervisado es un aprendizaje que no requiere etiquetado humano. En el aprendizaje automático, gran parte de la investigación se basa en ejemplos etiquetados, es decir, aquellos que requieren etiquetado humano para permitir el entrenamiento de modelos de aprendizaje automático. Por ejemplo, imágenes que sabemos que tienen las características faciales de una persona, o clips de audio, en los que alguien dice una determinada palabra”, explica. “Por el contrario, los modelos que no requieren etiquetado buscan patrones dentro de las bases de datos que a veces incluso una persona no puede. Por ejemplo, una búsqueda de genes que afecten a un determinado problema médico en una tabla con cientos de miles de genes. Es difícil para los humanos encontrar patrones en dichos datos, especialmente cuando la tabla no está organizada. Otro ejemplo de este esfuerzo cooperativo se puede encontrar en un estudio que estoy realizando en colaboración con el Dr. Yonatan Ganot que trata sobre la predicción de inundaciones. Nuestro objetivo en este proyecto es dar una alerta en tiempo real a los residentes, en Tel Aviv o en otras ciudades de Gush Dan, por ejemplo, para evitar inundaciones de vehículos o sótanos donde residen personas. En este proyecto, medimos datos del servicio meteorológico y los adjuntamos a los informes de los residentes para dar un pronóstico a tiempo. Esta es la fase de construcción del modelo y se basa en ejemplos etiquetados. Pero en tiempo real, nos gustaría basarnos en ejemplos sin etiquetar, que pueden predecir la inundación incluso antes del informe”.

El Dr. Lindenbaum trabaja con estudiantes de posgrado en varios proyectos de aprendizaje automático en su laboratorio. “Mi sueño es poder desarrollar herramientas que puedan ser utilizadas en cualquier campo científico: que los biólogos, médicos y geofísicos, por ejemplo, utilicen las herramientas que desarrollamos y que les ayuden a hacer nuevos descubrimientos, que no pueden hacerse con las herramientas que tienen hoy. Me veo lidiando con esto en el futuro, cambiando la forma en que trabajan los científicos, mejorando y haciendo avanzar la ciencia, y permitiéndole hacer nuevos descubrimientos”.