Continuously Hardening ChatGPT Atlas Against Prompt Injection

OpenAI is improving ChatGPT Atlas' security by using automated red teaming to identify and fix prompt injection attacks. This proactive method, powered by reinforcement learning, helps find new vulnerabilities before they can be exploited.

מקור: OpenAI News — לכתבה המלאה

Comments

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

עוזר האתר מודל מקומי · gemma2
שלום! 👋 אני העוזר החכם של האתר, רץ על מודל מקומי בשרת. איך אפשר לעזור?