Paso 4: Crear criterios de evaluación

Agentes de acceso y criterios

Dentro de cada flujo de trabajo, verá pasos individuales que representan tareas discretas que el agente debe completar.
Cada paso tendrá sus propios criterios de evaluación específicos para medir el rendimiento del agente en esa tarea.

Los criterios de evaluación de cada paso son los mismos que los de cada flujo de trabajo

Haga clic en un paso para ver o editar sus detalles de evaluación.
Defina la Técnica de evaluación:
- Elija una técnica adecuada en función de las necesidades de evaluación, como la puntuación basada en los resultados esperados.
Seleccione Comprobar con criterios:
- Esto determina la base para la comparación, como utilizar Resultado esperado (una respuesta precisa y correcta) o Prompt (una plantilla general con marcadores de posición)

Utilizar Salida Esperada:
- Cuando la respuesta del agente debe ser exacta o muy específica.
- Para tareas en las que hay una única respuesta correcta o un resultado muy definido.
- Ejemplos de escenarios incluyen tareas de extracción de datos, en las que una información concreta (como un número o identificador) debe extraerse correctamente.
Utilizar Prompt:
- Cuando se necesita flexibilidad en la respuesta, y el resultado puede variar dentro de una estructura aceptable.
- Para tareas en las que el formato es más importante que la redacción exacta, como generar respuestas con una estructura específica.
- Este enfoque es adecuado cuando las respuestas pueden contener detalles variables, pero aún así deben cumplir con una plantilla coherente.

Salidas esperadas:
- Escriba las salidas esperadas para que sean lo más precisas posible, detallando exactamente lo que el agente debe devolver.
- Evite la ambigüedad para garantizar que la respuesta del agente pueda evaluarse con precisión en función de un estándar claro.

Prompts:
- Escriba prompts con marcadores de posición para elementos variables, centrándose en la estructura y los componentes críticos en lugar de en la redacción específica.
- Utilice etiquetas claras en los marcadores de posición para especificar qué tipo de información debe ir allí (por ejemplo, <Nombre del cliente> o <Número de pedido>).
- Asegúrese de que la pregunta cubre todas las partes esenciales de la respuesta, de modo que incluso con una redacción flexible, el agente cumpla con la estructura requerida.

Asegúrese de que los criterios de cada paso son concisos, coherentes y están alineados con el comportamiento deseado del agente.
Guarde cualquier cambio para finalizar los criterios de evaluación.

Empieza hoy

Únase a nuestra plataforma y empiece a crear agentes de IA para diversos tipos de automatizaciones.