OpenAI ha presentado Operator, un innovador agente de inteligencia artificial (IA) diseñado para realizar tareas en la web en nombre de los usuarios. Este producto, disponible en una versión preliminar de investigación, promete revolucionar la forma en que interactuamos con el ecosistema digital. Usando su propio navegador, Operator puede explorar páginas web, interactuar con ellas mediante clics, desplazamientos y escritura, y ejecutar diversas tareas repetitivas, como llenar formularios, hacer reservaciones o programar videollamadas.
Operator representa un paso significativo hacia la autonomía de la IA, pues es uno de los primeros asistentes de OpenAI diseñados para trabajar de forma independiente. Su funcionamiento se basa en el modelo Computer-Using Agent (CUA), que combina capacidades de visión y razonamiento de GPT-4 mediante aprendizaje por refuerzo. Esto permite a Operator interactuar con botones, menús y campos de texto visibles en la pantalla, eliminando la necesidad de integraciones API personalizadas. Además, el sistema puede autocorregirse y devuelve el control al usuario cuando no logra completar una tarea, garantizando una experiencia fluida y colaborativa.
La herramienta también incorpora robustas medidas de seguridad. Está diseñada para rechazar solicitudes dañinas, bloquear contenido no permitido y evitar el uso indebido de datos confidenciales como credenciales de inicio de sesión. OpenAI asegura que estas características refuerzan la confianza en el uso del producto.
OpenAI y su nueva IA
OpenAI está trabajando con empresas como DoorDash, Instacart, Uber y Priceline para adaptar Operator a las necesidades del sector privado, mientras que en el ámbito público, colabora con las autoridades de Stockton, California, para agilizar procesos administrativos. Además, OpenAI subraya que el desarrollo de Operator evolucionará en función de los comentarios de los usuarios.
Operator también destaca por su flexibilidad y capacidad multitarea. Los usuarios pueden personalizar flujos de trabajo y realizar varias tareas simultáneamente, como comprar productos en Etsy mientras gestionan reservaciones en Hipcamp. Para usarlo, solo es necesario describir la tarea deseada; el agente se encarga del resto. En situaciones específicas, como la resolución de CAPTCHA o el inicio de sesión, los usuarios pueden tomar el control.
Actualmente, Operator está disponible exclusivamente para suscriptores del plan ChatGPT Pro en Estados Unidos. OpenAI planea ampliar su disponibilidad a otros países y niveles de suscripción, incluyendo Plus, Team y Enterprise, en el futuro cercano. Este lanzamiento marca un importante avance en el uso de la IA para optimizar tareas cotidianas y ampliar las posibilidades de interacción digital.