▎AI ומרובה סוכנים
בדיקה והערכה של אוטונומיה/ T&E
דיסציפלינת בדיקה לאימות מערכות אוטונומיות על פני סימולציה, חומרה, ניסויי שדה ותרחישים עוינים.
הגדרה
בדיקה והערכה של אוטונומיה היא דיסציפלינת בדיקה לאימות מערכות אוטונומיות על פני סימולציה, חומרה, ניסויי שדה ותרחישים עוינים. ביישומי הגנה, היא בונה ראיות לכך שאוטונומיה פועלת בתנאי משימה צפויים ומדורדרים. האתגר המרכזי הוא דלילות תרחישים ופערי סימולציה-למציאות (sim-to-real gaps), במיוחד כאשר מערכות נפרסות על פני קישורים שנויים במחלוקת, גבולות קואליציוניים וצוותים מעורבים של אדם-מכונה. KhanBMS מתייחסת לכך כאל צינור הראיות שמאחורי החלטות פריסה של KhanBMS, המקשר את הקונספט בחזרה לפיקוד מודולרי, ביצוע בקצה (edge execution) וסמכות ניתנת לביקורת.
מאפייני הפניה
- שכבה
- דיסציפלינת אימות
- ערך מבצעי
- בונה ראיות לכך שאוטונומיה פועלת בתנאי משימה צפויים ומדורדרים
- סיכון עיקרי
- דלילות תרחישים ופערי סימולציה-למציאות
- תפקיד KhanBMS
- צינור הראיות שמאחורי החלטות פריסה של KhanBMS
מונחים קשורים
- סימולציית תאום דיגיטליהעתק סינתטי חי או מסונכרן של פלטפורמה, יחידה, רשת או סביבה המשמש לבדיקות ותירגול.
- בינה מלאכותית מסימולציה למציאות (Sim2Real)טכניקות המעבירות התנהגות בינה מלאכותית שאומנה בסימולציה לפלטפורמות פיזיות ולפעולות מבצעיות אמיתיות.
- צוות אדום לבינה מלאכותיתבדיקות יריבות מובנות של מערכות בינה מלאכותית לחשיפת התנהגות לא בטוחה, מוטה, ניתנת לניצול או שבירה.
- הבטחת זמן ריצה לבינה מלאכותית (RTA-AI)ארכיטקטורת בטיחות המנטרת את תפוקות הבינה המלאכותית ועוברת לגיבוי מאומת כאשר ההתנהגות חורגת מהגבולות.
#testing#safety#autonomy
