Paso 4: Crear criterios de evaluación

Paso 4: Crear criterios de evaluación

Paso 4: Crear criterios de evaluación

Agentes de acceso y criterios

  • Vaya a la sección Agentes y criterios en el marco de evaluación de Beam AI.

  • Seleccione el espacio de trabajo correspondiente al agente que está evaluando.

  • Seleccione el espacio de trabajo correspondiente al agente que está evaluando.



  • Seleccione el espacio de trabajo correspondiente al agente que está evaluando

  1. Seleccione el Agente y el Flujo de Trabajo

  • Seleccione el agente que está evaluando.

  • Identifique el flujo de trabajo específico asociado a los casos de prueba.

  1. Defina los pasos de cada flujo de trabajo

  • Dentro de cada flujo de trabajo, verá pasos individuales que representan tareas discretas que el agente debe completar.

  • Cada paso tendrá sus propios criterios de evaluación específicos para medir el rendimiento del agente en esa tarea.


  • Los criterios de evaluación de cada paso son los mismos que los de cada flujo de trabajo

  1. Establezca criterios de evaluación para cada paso

  • Haga clic en un paso para ver o editar sus detalles de evaluación.

  • Defina la Técnica de evaluación:

    • Elija una técnica adecuada en función de las necesidades de evaluación, como la puntuación basada en los resultados esperados.


  • Seleccione Comprobar con criterios:

    • Esto determina la base para la comparación, como utilizar Resultado esperado (una respuesta precisa y correcta) o Prompt (una plantilla general con marcadores de posición)

  1. Mejores prácticas para elegir entre la salida esperada y el aviso

  • Utilizar Salida Esperada:

    • Cuando la respuesta del agente debe ser exacta o muy específica.

    • Para tareas en las que hay una única respuesta correcta o un resultado muy definido.

    • Ejemplos de escenarios incluyen tareas de extracción de datos, en las que una información concreta (como un número o identificador) debe extraerse correctamente.


  • Utilizar Prompt:

    • Cuando se necesita flexibilidad en la respuesta, y el resultado puede variar dentro de una estructura aceptable.

    • Para tareas en las que el formato es más importante que la redacción exacta, como generar respuestas con una estructura específica.

    • Este enfoque es adecuado cuando las respuestas pueden contener detalles variables, pero aún así deben cumplir con una plantilla coherente.

  1. Escribir resultados esperados claros y eficaces

  • Salidas esperadas:

    • Escriba las salidas esperadas para que sean lo más precisas posible, detallando exactamente lo que el agente debe devolver.

    • Evite la ambigüedad para garantizar que la respuesta del agente pueda evaluarse con precisión en función de un estándar claro.

  • Prompts:

    • Escriba prompts con marcadores de posición para elementos variables, centrándose en la estructura y los componentes críticos en lugar de en la redacción específica.

    • Utilice etiquetas claras en los marcadores de posición para especificar qué tipo de información debe ir allí (por ejemplo, <Nombre del cliente> o <Número de pedido>).

    • Asegúrese de que la pregunta cubre todas las partes esenciales de la respuesta, de modo que incluso con una redacción flexible, el agente cumpla con la estructura requerida.

  1. Revisar y finalizar los criterios

  • Asegúrese de que los criterios de cada paso son concisos, coherentes y están alineados con el comportamiento deseado del agente.

  • Guarde cualquier cambio para finalizar los criterios de evaluación.

Empieza hoy

Empezar a crear agentes de IA para automatizar procesos

Únase a nuestra plataforma y empiece a crear agentes de IA para diversos tipos de automatizaciones.

Empieza hoy

Empezar a crear agentes de IA para automatizar procesos

Únase a nuestra plataforma y empiece a crear agentes de IA para diversos tipos de automatizaciones.

Empieza hoy

Empezar a crear agentes de IA para automatizar procesos

Únase a nuestra plataforma y empiece a crear agentes de IA para diversos tipos de automatizaciones.