אמיתות SWE-bench מוגבלות

התוצאה של SWE-bench Verified עולה בביקורת ומתאימה יותר לאינטגרציה של מערכות נגמילות. ה-OpenAI מציע SW-Bench Pro כalternative.

מקור: OpenAI News — לכתבה המלאה

Comments

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

עוזר האתר מודל מקומי · gemma2
שלום! 👋 אני העוזר החכם של האתר, רץ על מודל מקומי בשרת. איך אפשר לעזור?