Continuously Hardening ChatGPT Atlas Against Prompt Injection

OpenAI is making ChatGPT Atlas more secure against attacks that exploit vulnerabilities in prompts, using automated testing and reinforcement learning. This process helps find new attack methods early on, strengthening defenses as AI models become more independent.

מקור: OpenAI News — לכתבה המלאה

Comments

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

עוזר האתר מודל מקומי · gemma2
שלום! 👋 אני העוזר החכם של האתר, רץ על מודל מקומי בשרת. איך אפשר לעזור?