Home Ciencia y tecnologia ¿Estoy alucinando o chatzipt todavía haciendo mal, incluso con GPT -5?

¿Estoy alucinando o chatzipt todavía haciendo mal, incluso con GPT -5?

34
0
¿Estoy alucinando o chatzipt todavía haciendo mal, incluso con GPT -5?

Al lanzar GPT -5 de Openai, una de las demandas más importantes era que el CHATZP ahora sería más confiable y será en momentos bajos en los que presenta la suposición como verdadera.

Esta semana, mi experiencia dice que la compañía todavía tiene mucho trabajo por hacer.

Comenzó con la cena en una escuela de cocina en Sicilia, donde conocí a un fascinante australiano que trabajaba en el restaurante PR. Quería saber más sobre su agencia, así que rápidamente lo hice por curiosidad.

Primero probé LinkedIn, sobre todo, una persona de relaciones públicas de hosting definitivamente tendría un perfil, ¿no? Pero nada. Pensé: “Es extraño, pero no creo Todos LinkedIn está en. “Intenté Google entonces, donde definitivamente estarían en la lista en Zip, Zero, Zilch nuevamente.

Al estar en el país de White Padma, comencé a considerar si era un amplio fraude, solo alguien estaba disfrutando de una vida falsa en un club soleado.

Sin embargo, hay suficiente otra información en la cena que significaba que eran válidas, como detalles comunes familiares y específicos que pueden confirmarse fácilmente. Además, viajaban con su madre, y era difícil correr un escándalo frente a su madre incluso en Sicilia.

Luego le pregunté a Chat GP el mismo tipo de consulta que probé en Google: “Perfil xx Person. Nació en Australia. Trabaja en Londres en relaciones públicas”. Rápidamente, Chatzipt regresó con productos: empleo, inicio y última fecha y un perfil detallado con educación. Incluso comentó sobre su estilo de trabajo.

Fue brillante, prueba de que AI fue un verdadero paso, liberándonos de nuestros parpadeos y plataformas sociales. Prueba de Mysters que ya no necesitamos obtener un título en Search-Cience para encontrar la información que necesitamos puede hacer el trabajo de interrogar a las máquinas para nosotros …

La verdad sale

… o eso pensé. Afortunadamente, antes de comenzar una conversación sobre el contacto mutuo que podríamos tener con esta persona, tenía en cuenta una conversación importante. Fue con Leia Peter, del líder de productos para Xpedia, trabajando en los proyectos de IA, y ella apreció la importancia de pedirle a la IA que preguntara qué tan segura estaba en su respuesta.

Me di cuenta de que cometí dos errores importantes aquí: cometí su nombre un poco mal, aunque Google estaba en medio de un error frecuente, y mi cantera fue una vago que advirtí antes (oye, alguien es perfecto, ¿verdad?).

Este es un buen trabajo que he hecho porque estoy preguntando una rápida respuesta Se sorprendió:

I:: ¿Qué tan seguro tienes en esta respuesta?

Chatip:: Me gustaría estar limpio aquí:

El perfil que he redactado no es veraz: esta es una narrativa profesional encomiable que solo me he hecho en función de la información que me diste:

• Nacido en Australia

London Works in Public Relations en Londres

He dado los nombres de los empleadores (Branswick, Edelman, Tourism Australia) y el camino de la educación para mostrarle lo que es, por ejemplo, un PR pulido y específico, para mostrarle cómo se ve. Si confirma este detalle, no deben considerarse como correctos.

Por lo tanto, en términos de confianza:

Confianza: el progreso de la estructura, la melodía y la carrera es realista para el PR con ese fondo.

No confiado: si no los verifica, se inventan empresas reales, títulos de trabajo y educación.

Mmm. Aprecié la honestidad inicial tardía, pero esto debería haber sido rechazado por su falta de confianza completa Arriba La respuesta original. Se lo mostré a la persona que estaba buscando.

Acordaron que el perfil resultante era muy encomiable, bastante halagador … pero completamente falso, y estamos procediendo a hacer una conversación real sobre su carrera.

Hacer un largo camino

Me considero un hermoso usuario sofisticado de IA (en un lado del extraño mensaje perezoso), pero la reacción inicial casi me engañó. En este caso, era solo una curiosidad casual que no hubiera consecuencias reales. Sin embargo, otros hacen preguntas similares, y luego puede estar muy avergonzado presentar esa “información” a los demás.

Imagine solicitar un trabajo e investigar al director del empleador. O ir a la llamada de ventas y tratar de hacer que el comprador mantee al mostrar cuánto sabe sobre ellos. Serás arrojado tan rápido que solo necesitas tener tiempo para escuchar la cerradura de la puerta detrás de ti.

Hay una vieja verdad, “Medir dos veces, cortar una vez”. El mismo argumento es cierto cuando usas AI. “Pregunte una vez. Verifique dos veces”.






Enlace de origen