تحذير علمي جديد: “تعفن دماغ الذكاء الاصطناعي” يهدد جودة الروبوتات.. والسبب “البيانات الملوثة”

كشفت دراسة علمية حديثة عن ظاهرة مقلقة أطلقت عليها اسم “تعفن دماغ الذكاء الاصطناعي”، محذرة من أن هذه المشكلة قد تؤدي إلى تراجع كبير وغير قابل للإصلاح في جودة ومصداقية نماذج الذكاء الاصطناعي.
وتكمن هذه الظاهرة في تدريب نماذج الذكاء الاصطناعي على “بيانات منخفضة الجودة”، مما ينتج عنه تقديم الروبوتات لمعلومات مضللة وتدهور في أدائها. وأكدت الدراسة أن زيادة تدريب روبوتات الدردشة الذكية على محتوى مثل المنشورات المجزأة والسطحية المنتشرة على وسائل التواصل الاجتماعي، يؤدي إلى تراجع قدرتها على التفكير المنطقي وزيادة إنتاجها للمعلومات غير الصحيحة.
تفاصيل الدراسة والتجارب:
أجرى الباحثون اختبارات مكثفة على نماذج اللغات الكبيرة (LLMs)، بما في ذلك روبوتات شهيرة مثل “إل لاما 3” (Meta Llama 3) و “كوين” (Ali Baba’s Qwen). وتم تزويد هذه النماذج بأنواع مختلفة من البيانات منخفضة الجودة، مثل:
- نصوص قصيرة ومجتزأة.
- محتوى يتضمن مواد استفزازية أو مثيرة.
- منشورات شائعة على وسائل التواصل الاجتماعي تفتقر إلى المعرفة الجوهرية.
أظهرت النتائج أن النماذج المُدربة على هذه البيانات تخطت عمليات التفكير المنطقي تمامًا، وقدمت استنتاجات سطحية أو إجابات غير منطقية، بل ونشرت معلومات مضللة وارتكبت أخطاء حتى في أسئلة الاختيار من متعدد.
مبدأ أساسي ونتائج لا رجعة فيها:
كما اختبر الفريق خلط البيانات منخفضة الجودة مع البيانات عالية الجودة، وتوصلوا إلى استنتاج مفاده أنه كلما ارتفعت نسبة البيانات الرديئة، تدهورت قدرات التفكير المنطقي للنماذج بشكل ملحوظ. وخلص الباحثون إلى تأكيد المبدأ الأساسي للذكاء الاصطناعي: “النتائج غير مرضية” (Garbage In, Garbage Out).
بالإضافة إلى تدهور الأداء، أشارت الدراسة إلى أن النماذج المُلوثة بالبيانات منخفضة الجودة أظهرت ميولاً سلبية متزايدة وبعض السمات النفسية غير المرغوب فيها. وحذّر الباحثون بشدة من أن هذا “التعفن” يصبح صعباً جداً للعكس؛ فـ “بمجرد أن تُلوث البيانات منخفضة الجودة، يصعب عكس الآثار السلبية”، حيث كانت محاولات تعديل التوجيهات أو إضافة بيانات عالية الجودة لا تحقق سوى تحسينات جزئية.




