▎AI ומרובה סוכנים
אימון במשחק עצמי
שיטת אימון שבה סוכנים משתפרים על ידי תחרות או שיתוף פעולה מול גרסאות של עצמם.
הגדרה
אימון במשחק עצמי (Self-Play Training) הוא שיטת אימון שבה סוכנים משתפרים על ידי תחרות או שיתוף פעולה מול גרסאות של עצמם. ביישומים ביטחוניים, שיטה זו מייצרת שונות טקטית מבלי להמתין לכתיבה ידנית של כל התנהגות אויב. החלק הקשה הוא מחזורי ניצול (exploit cycles), שיווי משקל לא מציאותיים, והתאמת יתר (overfitting) ליריבים שנוצרו באופן עצמי, במיוחד כאשר מערכות נפרסות על פני קישורים בסביבה עוינת, גבולות קואליציוניים, וצוותים מעורבים אדם-מכונה. KhanBMS מתייחסת לכך כמנוע תרגול אדום-כחול בתוך צינורות הסימולציה של KhanBMS, ומקשרת את הרעיון לפיקוד מודולרי, ביצוע בקצה, וסמכות ניתנת לביקורת.
מאפייני הפניה
- שכבה
- שיטת תכנית לימודים לאימון
- ערך מבצעי
- מייצרת שונות טקטית מבלי להמתין לכתיבה ידנית של כל התנהגות אויב
- סיכון עיקרי
- מחזורי ניצול, שיווי משקל לא מציאותיים, והתאמת יתר ליריבים שנוצרו באופן עצמי
- תפקיד KhanBMS
- מנוע תרגול אדום-כחול בתוך צינורות הסימולציה של KhanBMS
מונחים קשורים
- אימון מבוסס ליגהשיטת אימון עצמי השומרת על אוכלוסייה של יריבים וחברים לקבוצה כדי לשפר עמידות.
- לוחמת AI מדומהשימוש בסוכני AI ובסימולציות כדי לבחון מהלכי אויב, תגובות כוחותינו ודינמיקת מערכה.
- למידת חיזוק מרובת סוכנים (MARL)מסגרת למידת חיזוק שבה סוכנים מרובים לומדים יחד התנהגות שיתופית או יריבה.
- פעולות נגד AIפעולות המאתרות, משבשות, מטעות או מנצלות מערכות AI וצינורות נתונים של האויב.
#training#simulation#ml
