الخطوة 1: إنشاء مجموعة بيانات الاختبار
انتقل إلى مجموعات بيانات التقييم
في إطار عمل تقييم Beam AI، انتقل إلى قسم مجموعات البيانات التقييمية من القائمة الرئيسية.
اختر الوكيل المناسب
اختر الوكيل الذي ترغب في تقييمه (مثل وكيل معالجة الطلبات) من قائمة الوكلاء المتاحين.
إنشاء مجموعة بيانات جديدة
انقر على إضافة سجل أو خيار مكافئ لإنشاء مجموعة بيانات اختبار جديدة.
قم بتسمية مجموعة البيانات بطريقة ذات معنى، بحيث يكون واضحًا ما هي السيناريوهات التي ستغطيها (على سبيل المثال، "حالات اختبار معالجة الطلبات" أو "استفسارات المستخدم الشائعة").
احفظ مجموعة البيانات
بمجرد إنشاء مجموعة البيانات، تأكد من حفظها. يمكنك دائمًا العودة إلى هذه المجموعة من البيانات لإضافة المزيد من المدخلات حسب الحاجة.
الخطوة 2: تحديد عينات الإدخال
الوصول إلى مجموعة البيانات التي تم إنشاؤها
افتح مجموعة البيانات التي أنشأتها للتو. سوف ترى واجهة لإضافة مدخلات اختبار محددة للوكيل.
إضافة عينات إدخال
لكل سيناريو، انقر على إضافة مدخل لبدء تحديد مدخلات عينات فردية.
اسم وصفي: قدم لكل مدخل اسمًا وصفيًا واضحًا يشير إلى السيناريو الذي يمثله (على سبيل المثال، "استفسار طلب مع بيانات مفقودة").
المرفقات: يمكنك إضافة مرفقات إذا كانت حالة الاختبار تتطلب ملفات أو وثائق إضافية للوكيل لمعالجتها.
اختيار مجموعة البيانات: تأكد من تعيين كل مدخل إلى مجموعة البيانات الصحيحة. هذا يربط المدخل مباشرة بمجموعة بيانات الاختبار التي أنشأتها.
تنويع أنواع المدخلات والتعقيد
تضمين مجموعة متنوعة من المدخلات لتغطي حالات الاستخدام المختلفة:
الحالات القياسية التي من المتوقع أن يتعامل معها الوكيل بانتظام.
الحالات النادرة، مثل البيانات غير المكتملة أو الغامضة، لاختبار مدى قوة أداء الوكيل.
الأخطاء أو الأخطاء الإملائية التي قد يرتكبها المستخدمون الفعليون.
تحديد سير العمل المتوقع للوكيل
لكل إدخال، حدد معرف سير العمل المتوقع. هذا هو سير العمل الذي يجب على العميل اتباعه عند معالجة هذا الإدخال، لضمان التعامل مع الإدخال وفقًا للتسلسل أو العملية الصحيحة.
الخطوة 3: إعداد تشغيل مجموعة البيانات
إنشاء تشغيل مجموعة بيانات
بعد إضافة المدخلات، انقر على اسم مجموعة البيانات (مثل، "My Dataset") لإنشاء تشغيل مجموعة البيانات.
انقر على إضافة سجل في قسم تشغيلات مجموعة البيانات. سيقوم هذا بإعداد مجموعة البيانات لتشغيل التقييم.
مراجعة مدخلات مجموعة البيانات
تأكد من أن تشغيل مجموعة البيانات يتضمن جميع المدخلات التي قمت بتحديدها. هذا هو الإعداد الذي سيتم استخدامه لتقييم استجابات الوكيل.
الخطوة 4: تشغيل مجموعة البيانات
فتح نافذة جانبية لتشغيل مجموعة البيانات
بعد إعداد تشغيل مجموعة البيانات، انقر عليها لفتح النافذة الجانبية التي تعرض تفاصيل التشغيل، بما في ذلك قائمة المدخلات.
تشغيل مجموعة البيانات
في النافذة الجانبية، انقر على تشغيل مجموعة البيانات لبدء عملية التقييم. سيتم إرسال جميع المدخلات في مجموعة البيانات إلى الوكيل، مما يتيح لك تقييم ردوده.
أفضل الممارسات لإنشاء مجموعات تقييم البيانات
لضمان اختبار شامل ونتائج تقييم موثوقة، اتبع هذه الممارسات الأفضل:
تضمين سيناريوهات واقعية
استخدم مدخلات تعكس حالات الاستخدام الواقعية التي سيواجهها الوكيل.
التقط مجموعة متنوعة من السيناريوهات لفهم كيفية أداء الوكيل تحت الظروف القياسية.
تغطية الحالات الحافة
تضمين المدخلات النادرة أو الشديدة التي قد يواجهها الوكيل.
يمكن أن تشمل أمثلة الحالات النادرة بيانات مفقودة أو تنسيقات غير متوقعة أو حجم إدخال كبير.
اختبار هذه الحالات يساعد في ضمان قدرة الوكيل على التعامل مع الأوضاع المختلفة بقوة.
تنويع أنواع المدخلات
ادمج أنواعًا مختلفة من المدخلات (مثل النصوص، الأرقام، التواريخ) لاختبار كيفية استجابة الوكيل لتنسيقات البيانات المختلفة.
هذا يضمن أن الوكيل يؤدي بشكل متسق بغض النظر عن نوع المدخلات.
محاكاة الأخطاء الشائعة
أضف مدخلات تتضمن أخطاء المستخدم الشائعة، مثل الأخطاء الإملائية أو المعلومات الناقصة.
هذا يتيح لك مراقبة ما إذا كان الوكيل يستجيب بشكل مناسب للمدخلات الخاطئة.
