OpenAI presentó formalmente su nueva línea de agentes autónomos, modelos de inteligencia artificial diseñados para ejecutar tareas en computadoras y navegadores web de forma independiente. Este desarrollo marcó el paso de los modelos generativos pasivos a sistemas de IA de acción que operan software de terceros sin supervisión constante del usuario.
Según el reporte técnico de la organización, la arquitectura permite que la herramienta mueva el cursor, haga clic en botones y complete formularios complejos para cumplir objetivos específicos. La capacidad técnica se basó en una comprensión visual y lógica de los elementos en pantalla, lo que permitió que el sistema procesara datos.
La compañía buscó con este lanzamiento posicionarse frente a competidores como Anthropic y Google, quienes también iniciaron pruebas con funciones de «uso de computadora» en sus propios modelos.
El sistema demostró eficiencia en la planificación integral de viajes, donde el agente ingresó a sitios de reserva, comparó precios y completó el proceso de pago sin que el operador humano intervenga en cada paso.
La tecnología utilizó una capa de razonamiento que le permitió corregir errores en tiempo real si una página web demoraba en cargar o si un formulario presentaba campos obligatorios adicionales.
Fuente: perfil.com