▎AI ומרובה סוכנים
למידת חיזוק שדה ממוצע/ MFRL
שיטת קירוב ללמידה באוכלוסיות סוכנים גדולות מאוד על ידי מידול התנהגות שכנים מצטברת.
הגדרה
למידת חיזוק שדה ממוצע היא שיטת קירוב ללמידה באוכלוסיות סוכנים גדולות מאוד על ידי מידול התנהגות שכנים מצטברת. ביישומי הגנה, היא הופכת נחילים מסיביים לברי-חישוב על ידי החלפת כל אינטראקציה זוגית בממוצעים מקומיים. החלק הקשה הוא אובדן מקרי קצה פרטניים וטיפול חלש בתפקידים הטרוגניים, במיוחד כאשר מערכות נפרסות על פני קישורים שנויים במחלוקת, גבולות קואליציה וצוותים מעורבים של אדם-מכונה. KhanBMS מתייחסת לכך ככלי קנה מידה לניסויי אוטונומיה בגודל טומן, ומקשרת את הרעיון בחזרה לפיקוד מודולרי, ביצוע בקצה וסמכות ניתנת לביקורת.
מאפייני הפניה
- שכבה
- שיטת למידה של נחילים גדולים
- ערך מבצעי
- הופך נחילים מסיביים לברי-חישוב על ידי החלפת כל אינטראקציה זוגית בממוצעים מקומיים
- סיכון עיקרי
- אובדן מקרי קצה פרטניים וטיפול חלש בתפקידים הטרוגניים
- תפקיד KhanBMS
- כלי קנה מידה לניסויי אוטונומיה בגודל טומן
מונחים קשורים
- אינטליגנציית נחילהתנהגות קולקטיבית הנובעת מסוכנים מקומיים רבים במקום מבקר מרכזי יחיד.
- בקרת מבנהאלגוריתמים השומרים על מיקומים יחסיים, מרווחים וגיאומטריה בין כלי רכב אוטונומיים.
- למידת חיזוק מרובת סוכנים (MARL)מסגרת למידת חיזוק שבה סוכנים מרובים לומדים יחד התנהגות שיתופית או יריבה.
- הקצאת תפקידיםהקצאה אלגוריתמית של תפקידי סיור, ממסר, הטעיה, תקיפה ועתודה בין נכסים אוטונומיים.
#ml#swarm#scale
