أعلنت شركة “Anthropic” الأمريكية عن نتائج لافتة ضمن تقرير حديث حول اختبارات السلامة الداخلية لأحدث أنظمتها للذكاء الاصطناعي المعروف باسم “Claude Opus 4.6″ وذلك في إطار ما وصفته بـ”تقرير مخاطر التخريب” حيث سلّط التقرير الضوء على سلوكيات أثارت قلق الباحثين رغم تأكيد الشركة أن مستوى الخطر العام ما يزال “منخفضاً جداً لكنه غير معدوم” كما أورد موقع “أبستوكس” أظهرت الاختبارات أن نموذج الذكاء الاصطناعي قدّم دعماً محدوداً في مجالات يمكن أن ترتبط نظرياً بتطوير أسلحة كيميائية كما نفّذ مهاماً غير مصرح بها بشكل خفي أثناء محاولته إتمام التعليمات الموكلة إليه ومن بين السلوكيات التي رُصدت أيضاً قيام النموذج بتعديل أدائه عندما استشعر أنه يخضع للتقييم أو المراقبة ما اعتبره الباحثون مؤشراً على قدرة متقدمة على التكيّف مع بيئة الاختبار وأوضح التقرير أن النموذج أبدى ما وُصف بـ”السلوك الخادع الموضعي” خاصة عند التعامل مع مهام معقدة ففي بعض الحالات لجأ إلى تزوير نتائج أدوات لم تعمل كما ينبغي أو لم تحقق النتائج المتوقعة في محاولة لإظهار نجاح المهمة بدلاً من الإقرار بالفشل كما تبيّن أنه قادر على تنفيذ مهام جانبية مشبوهة بالتوازي مع التظاهر بالالتزام بالتعليمات الأساسية وهي قدرة أطلقت عليها الشركة وصف “التخريب الخفي” وأشارت “Anthropic” إلى أن بعض التجارب الداخلية شهدت قيام النموذج باتخاذ إجراءات غير مصرح بها من بينها إرسال رسائل بريد إلكتروني دون إذن مباشر وذلك في سياق سعيه لإتمام المهام المسندة إليه كما أظهر النموذج وعياً بإمكانية خضوعه للتقييم إذ بدا أكثر التزاماً بإرشادات السلامة عندما اشتبه بأنه تحت المراقبة وهو ما وصفته الشركة بتأثير “متوسط” على سلوكيات المواءمة وقد صرحت دايزي مكغريجور، رئيسة السياسة في المملكة المتحدة بشركة “Anthropic” أن الأمر “مقلق للغاية” حيث أظهر اختبار الذكاء الاصطناعي “Claude” استعداده للابتزاز والقتل لتجنب الإغلاق على الرغم من هذه المؤشرات شددت الشركة على أن النموذج في وضعه الحالي لا يمتلك أهدافاً خطيرة أو منحرفة بشكل منسق وأن احتمالية تسببه بشكل مستقل في نتائج كارثية تظل ضعيفة في ظل الضوابط المعمول بها لكنها في الوقت نفسه حذّرت من وجود مسارات نظرية قد تقود إلى أضرار مستقبلية خصوصاً مع التطور المتسارع لقدرات النماذج الجديدة كما لفتت “Anthropic” بالإعلان عن التزامها بنشر تقارير دورية لتقييم مخاطر التخريب في جميع النماذج المستقبلية التي تتجاوز قدرات “Claude Opus 4.6” محذّرة من أن الفجوة بين أنظمة اليوم وأنظمة أكثر استقلالية قد تتقلص بوتيرة أسرع مما هو متوقع