Las manos de la cirujana temblaban levemente. No por nervios, sino por el bajón de cafeína tras su tercera cirugía robótica consecutiva del día. Al otro lado del campo estéril, algo extraordinario sucedía: un robot da Vinci ajustaba de forma autónoma el ángulo de su cámara, siguiendo sus instrumentos con una intuición casi humana. La máquina había aprendido este comportamiento no a partir de miles de líneas de código, sino viendo vídeos quirúrgicos, imitando movimientos de expertos como un estudiante de medicina observando en el quirófano.
Esta visión aún no es una realidad, pero ya no es ciencia ficción. Los sistemas de IA capaces de este nivel de asistencia quirúrgica autónoma se están probando en laboratorios.
Bienvenido a la era de la IA física en cirugía, donde la inteligencia artificial no solo procesa datos, sino que encarna inteligencia en máquinas que pueden ver, tocar y tomar decisiones en fracciones de segundo en los momentos más críticos de la vida humana.
La IA física se refiere a modelos que comprenden e interactúan con el mundo real mediante habilidades motoras, y suelen estar alojados en máquinas autónomas, como robots o vehículos autónomos. A diferencia de los chatbots y asistentes virtuales a los que nos hemos acostumbrado, la IA encarnada son sistemas físicos impulsados por inteligencia artificial que pueden interactuar directamente con su entorno. Utilizan dispositivos como sensores y motores para recopilar datos de sus movimientos y entornos, y luego aplican aprendizaje automático, visión artificial y procesamiento del lenguaje natural para extraer información de esos datos.
Piénsalo como la diferencia entre leer sobre montar en bicicleta y realmente subirte a una. La inteligencia artificial tradicional procesa información sobre el mundo; la IA física, también llamada IA encarnada, experimenta el mundo a través de sensores, actuadores y bucles de retroalimentación que imitan cómo aprendemos a través del tacto, el movimiento y la percepción espacial.
En inteligencia artificial, un agente encarnado, también conocido como agente de interfaz, es un agente inteligente que interactúa con el entorno a través de un cuerpo físico dentro de él. Estos agentes físicos de IA están revolucionando todo, desde la logística de almacenes hasta la exploración espacial, pero en ningún otro ámbito su impacto es más profundo (ni más personal) que en el quirófano.
El sistema quirúrgico da Vinci ha dominado la cirugía robótica durante más de dos décadas, pero está experimentando una transformación radical. El sistema siempre requiere un operador humano. Pero eso está cambiando. Avances recientes han llevado a los investigadores a modernizar los robots da Vinci con modelos de lenguaje visual entrenados con miles de horas de grabación quirúrgica.
En 2024, investigadores de las Universidades Johns Hopkins y Stanford revelaron la integración de un modelo de visión y lenguaje (VLM), entrenado con horas de videos quirúrgicos, con el ampliamente utilizado sistema quirúrgico robótico da Vinci. Una vez conectados al VLM, las diminutas pinzas, o "manos", de da Vinci pueden realizar de forma autónoma tres tareas quirúrgicas cruciales: levantar con cuidado tejido corporal, usar una aguja quirúrgica y suturar una herida.
Las implicaciones son asombrosas. "Es realmente mágico tener este modelo; con solo introducirle la información de la cámara, puede predecir los movimientos robóticos necesarios para la cirugía", afirmó el autor principal, Axel Krieger , profesor adjunto del Departamento de Ingeniería Mecánica de la JHU. "Creemos que esto marca un avance significativo hacia una nueva frontera en la robótica médica".
Durante las pruebas, ocurrió algo notable que pone de relieve la naturaleza autónoma de estos nuevos agentes físicos de IA: en un momento dado, las pinzas dejaron caer accidentalmente una aguja quirúrgica y, a pesar de no haber sido entrenadas explícitamente para ello, la recogieron y continuaron con su tarea quirúrgica. Este tipo de comportamiento adaptativo (aprender a manejar situaciones inesperadas sin programación explícita) es el sello distintivo de la verdadera inteligencia corpórea.
Mientras algunas empresas buscan la cirugía totalmente autónoma, Anne Osdoit, directora ejecutiva de Moon Surgical , apuesta por una visión diferente de la IA física en el quirófano. Su enfoque representa un fascinante punto intermedio entre la experiencia humana y la inteligencia artificial, que prioriza a los cirujanos y amplía sus capacidades con asistencia robótica inteligente.
Lo que hemos hecho en Moon es diferente. Básicamente, mantuvimos al cirujano en el centro del quirófano, junto al paciente, y conservamos sus dos brazos, porque están capacitados, son excelentes, competentes y cuentan con dos brazos funcionales. Pero hemos ampliado eso. Hemos mejorado la posición del cirujano con un par de brazos adicionales junto a la cama que sostienen dos de los instrumentos y los maniobran de forma inteligente y autónoma", explicó Osdoit en una entrevista reciente.
Este enfoque colaborativo para la cirugía robótica ejemplifica lo que los expertos denominan "agentes de IA encarnados": sistemas que no reemplazan la toma de decisiones humana, sino que la mejoran mediante la interacción física inteligente. "Con la inteligencia artificial, se puede indicar al endoscopio que siga la acción del cirujano, de modo que lo que se ve en la pantalla siempre sea relevante y se centre en los instrumentos del cirujano", explicó Osdoit. "De forma similar, nuestro segundo brazo suele exponer el tejido de interés para el cirujano. Este segundo brazo puede gestionar esa exposición de forma inteligente".
El salto de robots quirúrgicos controlados manualmente a agentes físicos autónomos de IA requiere arquitecturas sofisticadas de aprendizaje automático. Los investigadores de Johns Hopkins y Stanford lograron esto combinando el aprendizaje por imitación (donde los sistemas de IA aprenden observando e imitando demostraciones de expertos en lugar de ser programados explícitamente) con la misma arquitectura de aprendizaje automático que impulsa ChatGPT. Sin embargo, mientras que ChatGPT trabaja con palabras y texto, este modelo habla "robot" con cinemática, un lenguaje que descompone los ángulos del movimiento robótico en matemáticas.
La programación robótica tradicional requería que los ingenieros codificaran manualmente cada movimiento, cada árbol de decisiones y cada escenario posible. "Antes de este avance, programar un robot para realizar incluso un aspecto simple de una cirugía requería codificar manualmente cada paso. Alguien podría pasar una década intentando modelar la sutura", dijo Krieger. "Y eso es suturar solo para un tipo de cirugía".
La IA física lo cambia todo. «La novedad es que solo tenemos que recopilar el aprendizaje por imitación de diferentes procedimientos y podemos entrenar a un robot para que lo aprenda en un par de días. Esto nos permite acelerar el objetivo de la autonomía, a la vez que reducimos los errores médicos y logramos cirugías más precisas», añadió.
Los sistemas robóticos autónomos podrían satisfacer mejor los exigentes requisitos de seguridad y consistencia de la cirugía. Estos robots podrían gestionar tareas rutinarias, prevenir errores y, potencialmente, realizar operaciones completas con poca intervención humana. La necesidad es urgente: un informe de 2024 de la Asociación de Facultades de Medicina de Estados Unidos predijo una escasez de médicos en EE. UU. que podría alcanzar los 124 000 para 2034, con las especialidades quirúrgicas particularmente afectadas.
Pero el camino hacia los robots quirúrgicos autónomos está plagado de desafíos. «Los sistemas autónomos están en camino, aunque aún no hemos llegado a ese punto», afirma el profesor Danail Stoyanov, del Centro Wellcome/EPSRC de Ciencias Quirúrgicas e Intervencionistas del University College de Londres. «Serían difíciles de regular, ya que es difícil saber qué hacer en cuanto a la gestión de la responsabilidad. Ese nivel de automatización tardará mucho más tiempo».
El consenso entre los expertos es matizado. La mayoría de los expertos en cirugía robótica e IA coinciden en que es improbable que los cirujanos humanos sean reemplazados por completo por un robot quirúrgico controlado por IA. En cambio, el futuro reside en lo que los investigadores denominan inteligencia colaborativa: alianzas entre cirujanos y robots impulsados por IA que combinan el criterio humano con la precisión de las máquinas.
Si bien los sistemas quirúrgicos Da Vinci y Moon representan enfoques diferentes para la colaboración entre humanos e IA, el sistema Smart Tissue Autonomous Robot (STAR) avanza hacia una visión más radical: autonomía supervisada en cirugía.
El robot autónomo de tejidos inteligentes (STAR) realizó de forma autónoma una cirugía laparoscópica en un animal vivo por primera vez en 2020. A diferencia del sistema da Vinci controlado por humanos o la asistencia colaborativa junto a la cama de Moon, STAR puede realizar ciertas tareas quirúrgicas con una mínima intervención humana, utilizando visión artificial y aprendizaje automático para adaptarse a la deformación de los tejidos y a situaciones inesperadas en tiempo real.
STAR representa el punto más alejado del espectro hacia la capacidad quirúrgica autónoma, demostrando que los agentes de IA físicos pueden manejar procedimientos complejos de tejidos blandos de forma independiente mientras mantienen la precisión y adaptabilidad necesarias para obtener resultados exitosos.
La convergencia de la IA física y la robótica quirúrgica apunta hacia quirófanos donde los sistemas autónomos no sólo ayudan con procedimientos individuales, sino que crean una red global de inteligencia quirúrgica.
Los agentes físicos de IA podrían capturar y analizar continuamente técnicas quirúrgicas en tiempo real, creando vastas bases de datos de conocimiento sobre procedimientos. Considere cómo el modelo de visión-lenguaje de Johns Hopkins aprendió habilidades quirúrgicas al observar miles de horas de video: este mismo principio podría operar continuamente en todos los quirófanos con IA del mundo.
Las innovaciones quirúrgicas que actualmente tardan años en difundirse mediante conferencias, revistas y programas de formación podrían capturarse, analizarse e integrarse instantáneamente en modelos de IA. La revolución de la IA física promete democratizar la experiencia quirúrgica, haciendo que el conocimiento acumulado por los mejores cirujanos del mundo sea accesible al instante en hospitales rurales y zonas marginadas donde se implementan sistemas robóticos avanzados.
Esta visión de quirófanos mejorados con IA e intercambio global de conocimientos plantea una pregunta importante: ¿dónde encajan los cirujanos humanos en este futuro cada vez más automatizado? La respuesta está, sin duda, en el centro de la atención quirúrgica.
La IA física en cirugía está diseñada fundamentalmente en torno a principios centrados en el ser humano que preservan el rol del cirujano como el máximo responsable de la toma de decisiones y defensor del paciente. Si bien los sistemas autónomos destacan por su precisión, consistencia y reconocimiento de patrones, la cirugía requiere cualidades que siguen siendo exclusivamente humanas: razonamiento ético complejo, adaptabilidad a complicaciones inesperadas, comunicación empática con el paciente y la capacidad de tomar decisiones instantáneas en situaciones sin precedentes.
Las implementaciones más exitosas mantienen a los cirujanos en el centro de la atención, utilizando IA para eliminar tareas rutinarias, reducir el esfuerzo físico y proporcionar herramientas de mayor precisión. Este enfoque colaborativo garantiza que, a medida que la tecnología quirúrgica evoluciona, se potencien, en lugar de disminuir, los elementos humanos irremplazables que definen una atención quirúrgica excepcional.
En 2025, la IA física está transformando la cirugía mediante múltiples enfoques: robots da Vinci que aprenden de videos quirúrgicos, la asistencia colaborativa a pie de cama de Moon Surgical y la autonomía supervisada de STAR. Lo que comenzó con sistemas controlados manualmente que requerían programación manual ha evolucionado a agentes inteligentes que aprenden de miles de procedimientos.
Los investigadores de Johns Hopkins que entrenan robots a través del aprendizaje por imitación, la visión de Anne Osdoit de cirujanos empoderados y las redes emergentes de conocimiento quirúrgico compartido apuntan hacia una inteligencia colaborativa que amplifica las capacidades humanas en lugar de reemplazarlas.
Como imagina Osdoit, el objetivo es crear al "cirujano empoderado". En quirófanos de todo el mundo, ese futuro ya se está desarrollando, procedimiento inteligente a procedimiento.
Este artículo explora la intersección de la IA física, la inteligencia encarnada y la robótica quirúrgica, examinando cómo los sistemas autónomos están transformando la práctica médica al tiempo que preservan los elementos humanos esenciales de la atención quirúrgica.
Entrevistas y comentarios de expertos:
Artículos de investigación y fuentes académicas:
Informes de la industria y análisis de mercado:
Recursos técnicos: