- Los robots siguen fallando rápidamente cuando se los retira de entornos de fábrica predecibles
- Microsoft Ro-Alpha vincula la comprensión del lenguaje directamente con el control de movimiento robótico
- La detección táctil es fundamental para reducir la brecha entre el software y la actividad física
Los robots han funcionado de manera confiable durante mucho tiempo en entornos industriales estrictamente controlados con entornos predecibles y desviaciones limitadas, pero fuera de eso, a menudo tienen problemas.
Para superar este problema, Microsoft anunció Ro-Alpha, el primer modelo robótico derivado de su serie de lenguaje-visión Phi, robots que necesitan mejores formas de ver y comprender instrucciones.
La empresa cree que los sistemas pueden funcionar fuera de la línea de montaje respondiendo a condiciones cambiantes en lugar de seguir guiones rígidos.
¿Para qué está diseñado Rho-Alpha?
Microsoft llama a esto en términos generales IA física, donde se espera que los modelos de software guíen a las máquinas en situaciones menos estructuradas.
Integra lenguaje, percepción y acción, lo que reduce la dependencia de instrucciones o líneas de producción fijas.
Ro-Alpha traduce comandos del lenguaje natural en señales de control robótico y se centra en tareas de manipulación bimanual, que requieren coordinación entre dos brazos robóticos y un control detallado.
Microsoft caracteriza el sistema como una extensión del enfoque general de VLA al ampliar tanto la percepción como las entradas de aprendizaje.
“La aparición de modelos de visión-lenguaje-acción (VLA) para sistemas físicos está permitiendo que los sistemas perciban, razonen y actúen de forma autónoma junto con los humanos en entornos mucho menos estructurados”, afirmó Ashley Lawrence, vicepresidente corporativo y director general de Microsoft Research Accelerator.
Ro-Alpha incluye sensación táctil además de visión, métodos de detección adicionales como la fuerza, que es un desarrollo continuo.
Estas opciones de diseño sugieren un intento de reducir la brecha entre la inteligencia simulada y la interacción física, aunque su efectividad aún está bajo evaluación.
Una parte central del enfoque de Microsoft se basa en la simulación para abordar datos limitados de robótica a gran escala, en particular datos relacionados con el tacto.
Las trayectorias sintéticas se generan mediante el aprendizaje por refuerzo dentro de Nvidia Isaac SIM y luego se combinan con demostraciones físicas de conjuntos de datos comerciales y abiertos.
“El entrenamiento de modelos que puedan razonar y actuar sobre una base supera la falta de datos diversos del mundo real”, dijo Dipu Talla, vicepresidente de robótica e IA de vanguardia de Nvidia.
“Al utilizar NVIDIA Isaac Sim en Azure para crear conjuntos de datos sintéticos físicamente precisos, Microsoft Research está acelerando el desarrollo de modelos versátiles como Rho-alpha que pueden dominar tareas de manipulación complejas”.
Microsoft también enfatiza la entrada correctiva humana durante la implementación, lo que permite a los operadores intervenir utilizando dispositivos de teleoperación y brindando retroalimentación que el sistema puede aprender con el tiempo.
Este ciclo de entrenamiento combina simulación, datos del mundo real y corrección humana, lo que refleja una dependencia cada vez mayor de las herramientas de inteligencia artificial para compensar los escasos conjuntos de datos físicos.
El profesor Abhishek Gupta, profesor asistente de la Universidad de Washington, dijo: “Si bien la generación de datos de entrenamiento mediante sistemas robóticos teleoperadores se ha convertido en una práctica estándar, hay muchos entornos donde la teleoperación no es práctica o imposible”.
“Estamos trabajando con Microsoft Research para enriquecer los conjuntos de datos previos al entrenamiento recopilados de robots físicos con varias pantallas sintéticas utilizando una combinación de simulación y aprendizaje por refuerzo”.
Siga TechRadar en Google News Y Agréganos como fuente preferida Recibe noticias, reseñas y opiniones de nuestros expertos en tu feed. ¡No olvides hacer clic en el botón de seguir!
Y por supuesto que puedes Siga TechRadar en TikTok Reciba nuestras actualizaciones periódicas en forma de noticias, reseñas, unboxing y videos. WhatsApp muy











