- Muchos pilotos de IA fallan en las operaciones del mundo real y Genny no alcanza la producción del 95% de los pilotos, el reclamo de Salesforce
- Las iniciativas de Cremarana-Pro, dejan presionar a sus agentes de IA con gemelos digitales
- Se utilizan dos nuevos puntos de referencia para los agentes de IA de prueba de estrés
Salesforce dice que las iniciativas están luchando para que sus pilotos de IA no fallaran en las operaciones del mundo real, y antes de desplegar empresarios, sus agentes de prueba de estrés han lanzado un nuevo servicio CRMena-Pro para permitir que sus operaciones creen un gemelo digital en sus operaciones.
La compañía ha citado una investigación reciente del MIT, que ha demostrado que el 95% del piloto de IA de los generadores ni siquiera alcanza la etapa de producción.
Cremarana-Pro evalúa a los agentes de IA en trabajos reales, como servicios al cliente, pronósticos de ventas y cadenas de suministro, pero usa datos sintéticos válidos por expertos.
Salesforce lo ayuda a probar agentes de IA con gemelos digitales
“Cremarana-Pro crea una estructura ambiental empresarial simulada rígida y rica en contexto, donde puede evaluar de forma segura las llamadas de API en sistemas relevantes, así como evaluar las capacidades de protección de datos de PII”, escribió la compañía en un anuncio.
Al agregar sonidos del mundo real al entorno de prueba, Creamarana-Pro puede evaluar mejor el rendimiento, fortalecer la elasticidad y llenar el intervalo entre el previo y la implementación.
“El resultado es el agente de IA que es capaz, consistente, creíble y agente de la empresa no”.
Las empresas también pueden ver cómo los agentes de IA realizan desafíos del mundo real, como datos de Messi, sistemas heredados y flujos de trabajo complejos.
Salesforce menciona que parte de la complejidad proviene de la gran variedad de modelos disponibles hoy en día y no es fácil saber qué modelos o modelos específicos deben usarse.
En esta melodía, la compañía ha publicado dos criterios nuevos para medir el rendimiento del agente: tarea sintética MCP-AVAL y MCP-Universi, que agrega trabajo y editores basados en el mundo real a los agentes de prueba de estrés en situaciones complejas.
En la publicación anterior, Salesforce menciona que Kramerna -pro “forman la base de la próxima frontera: la inteligencia general empresarial”, y, ahora, los usuarios pueden esperar una IA “segura, capaz e influyente” para todas las agencias.