איך אנחנו מراقבים מודל שפה פנימיים ליצירת תכונות לא צפויות

OpenAI משתמשת בביצוע של תהליך דיבורים כדי לבדוק את הסיכוי להגדלת מודל שפה פנימי לפעולה לא רצויה. מטרות המודיעין הן איתור סיכונים ויישום של מגוון מערכות למניעת תופעות פוגעניות

מקור: OpenAI News — לכתבה המלאה

Comments

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

עוזר האתר מודל מקומי · gemma2
שלום! 👋 אני העוזר החכם של האתר, רץ על מודל מקומי בשרת. איך אפשר לעזור?