▎AI ומרובה סוכנים
אימון מבוסס ליגה
שיטת אימון עצמי השומרת על אוכלוסייה של יריבים וחברים לקבוצה כדי לשפר עמידות.
הגדרה
אימון מבוסס ליגה הוא שיטת אימון עצמי השומרת על אוכלוסייה של יריבים וחברים לקבוצה כדי לשפר עמידות. ביישומי הגנה, הוא מונע ממדיניות להפוך למתמחה מדי כנגד יריב נוכחי אחד. החלק הקשה הוא חוסר איזון בליגה, רעש הערכה, ועלויות אימון בלתי נשלטות, במיוחד כאשר מערכות נפרסות על פני קישורים שנויים במחלוקת, גבולות קואליציה, וצוותים מעורבים של אדם-מכונה. KhanBMS מתייחס לכך כדרך לשמור על סוכני KhanBMS חשופים לטקטיקות מגוונות לפני פריסה, וקושר את הרעיון בחזרה לפיקוד מודולרי, ביצוע בקצה, וסמכות ניתנת לביקורת.
מאפייני הפניה
- שכבה
- שיטת אימון מרובת-סוכנים
- ערך מבצעי
- מונע ממדיניות להפוך למתמחה מדי כנגד יריב נוכחי אחד
- סיכון עיקרי
- חוסר איזון בליגה, רעש הערכה, ועלויות אימון בלתי נשלטות
- תפקיד KhanBMS
- דרך לשמור על סוכני KhanBMS חשופים לטקטיקות מגוונות לפני פריסה
מונחים קשורים
- אימון במשחק עצמישיטת אימון שבה סוכנים משתפרים על ידי תחרות או שיתוף פעולה מול גרסאות של עצמם.
- צוות אדום לבינה מלאכותיתבדיקות יריבות מובנות של מערכות בינה מלאכותית לחשיפת התנהגות לא בטוחה, מוטה, ניתנת לניצול או שבירה.
- למידת חיזוק מרובת סוכנים (MARL)מסגרת למידת חיזוק שבה סוכנים מרובים לומדים יחד התנהגות שיתופית או יריבה.
- נראות מודלניטור קלט, פלט, סחיפה, שיהוי, ביטחון וכשלים של מודל לאחר פריסתו.
#training#ml#resilience
