هل يمكن أن يجعلك تشات جي بي تي أكثر ذكاءً بالفعل أم أنه يُشعِرك بذلك فقط؟
For English
دراسة حديثة من معمل MIT Media Lab وجامعات شريكة تغوص في هذا السؤال بعمق، من خلال استكشاف ما يحدث داخل أدمغتنا عندما نستخدم نماذج اللغة الكبيرة (LLMs) مثل GPT-4 لكتابة المقالات. النتائج كانت مثيرة للاهتمام، حيث أظهرت ليس فقط كيف نكتب باستخدام الذكاء الاصطناعي، بل كيف يُعيد الانهماك المعرفي تشكيل ارتباطنا المعرفي، وذاكرتنا، وشعورنا بامتلاك ما نكتبه.
الدراسة
العنوان: دماغك تحت تأثير ChatGPT: تراكم الانهماك المعرفي عند استخدام المقالات
الباحثون: MIT Media Lab، كلية ويلسلي، MassArt
الرابط: اقرأ الورقة الكاملة
لم تكن هذه مجرد استبانة أو مقالة رأي، بل تجربة علمية صارمة ومتعددة الأدوات:
المشاركون
٥٤ طالبًا جامعيًا تم تقسيمهم إلى ثلاث مجموعات:
مجموعة LLM: استخدموا ChatGPT (GPT-4o)
مجموعة البحث: استخدموا Google بدون أدوات ذكاء اصطناعي
مجموعة الدماغ فقط: لم يُسمح لهم باستخدام أي أدوات خارجية
المنهجية
كتب الطلاب مقالات بأسلوب SAT عبر ثلاث جلسات.
في الجلسة الرابعة، غيّر بعض المشاركين أدوارهم (مثلاً من LLM إلى الدماغ فقط).
أثناء الكتابة، تم تسجيل نشاط أدمغتهم باستخدام EEG.
تم تصحيح المقالات من قبل معلمين بشريين وذكاء اصطناعي، وتم تحليلها باستخدام أدوات معالجة اللغة الطبيعية (NLP).
أُجريت مقابلات مع المشاركين بعد ذلك.
النتائج
١. استخدام الأدوات = انخفاض في النشاط العقلي
أظهرت الدراسة تدرجًا واضحًا: كلما كانت الأداة أكثر تلقائية، قلّ الجهد الذي يبذله الدماغ. أظهرت مجموعة الدماغ فقط أعلى نشاط عصبي، خاصة في المناطق المرتبطة بالذاكرة والانتباه. جاءت مجموعة البحث في المرتبة الوسطى أما مجموعة LLM فقد أظهرت أضعف الإشارات المعرفية، مما يشير إلى انخفاض التركيز والجهد الذهني.
٢. الانهماك المعرفي يتراكم بمرور الوقت
في الجلسة الرابعة، استمر الطلاب الذين بدأوا باستخدام LLM ثم طُلب منهم الكتابة بدون مساعدة في إظهار انخفاض في النشاط الذهني. حتى بدون الأداة، لم يعودوا إلى نفس مستوى الانخراط العقلي. أطلق الباحثون على هذا التأثير اسم "الدَّيْن المعرفي" — وهو التكلفة المتبقية للاعتماد على الأداة.
٣. النصوص المنتجة بالذكاء الاصطناعي لا تُشعرك بالانتماء إليها
مستخدمو LLM:
كان لديهم تذكر أقل لما كتبوه.
واجهوا صعوبة في الاقتباس بدقة من مقالاتهم.
عبّروا عن شعور أقل بالملكية الشخصية للمحتوى.
في المقابل، أظهرت مجموعة الدماغ فقط إحساسًا أقوى بالانتماء والذاكرة تجاه أفكارهم
٤. القوة الظاهرة مقابل التفاعل الحقيقي
رغم أن هذه ليست النقطة الأساسية في الدراسة، فإن المقالات التي أُنتجت باستخدام LLM كانت أكثر صقلًا لغويًا، أكثر تنظيمًا، وأكثر توافقًا مع المعايير الأكاديمية المعتادة وهي الصفات التي تعطيها أنظمة التقييم الأولوية.
في المقابل، كانت مقالات مجموعة الدماغ أكثر تنوعًا، تخيلاً، وأصالةً من حيث الأفكار، كما كانت أكثر قدرة على البقاء في ذاكرة الطلاب.
وهنا يبرز سؤال عن النظام والمنهجية للأنظمة التقيمية والتعليمية وهو سؤال حاسم:
هل نحن بصدد بناء (أو الحفاظ على) أنظمة تعليمية تكافئ الطلاقة والانضباط الشكلي أكثر من الجرأة الفكرية والأصالة؟
إذا كان بإمكان نموذج لغوي، مدرَّب على الأنماط السابقة ومُبرمج على تلبية المعايير، أن يتفوق على طالب يتبع نهجًا إبداعيًا غير تقليدي حتى لو قدّم فكرة ثاقبة فماذا يقول ذلك عن القيم التي نُضمِّنها في آليات التقييم لدينا؟
التناقض البنيوي: تكافؤ الانضباط ومعاقبة الأصالة
إحدى النتائج المثيرة للقلق رغم أنها لم تُذكر بشكل مباشر في الورقة هي أن الأنظمة التعليمية قد تكافئ الامتثال على حساب الإبداع، رغم أنها تدّعي العكس.
تُظهر الدراسة أن المقالات المدعومة بـ LLM كانت أكثر صقلًا وتوافقًا مع معايير التصحيح، في حين أن مقالات مجموعة الدماغ كانت أكثر أصالة وانخراطًا معرفيًا. إذا اعتقد المصححون أن جميع المقالات كُتبت بأيدي الطلاب، فقد تحصل مقالات LLM على درجات أعلى — لا لأنها أعمق، بل لأنها تتناسب مع ما تُكافئه الأنظمة الأكاديمية.
هذا يكشف عن تناقض أعمق:
نحن نزعم أننا نقدّر التفكير النقدي، والإبداع، والوكالة/الحرية الفكرية. لكننا نقيس العمل وفق معايير تُعطي الأفضلية للشكل، والطلاقة، والبنية المعيارية وهي صفات يسهل على الذكاء الاصطناعي تقليدها.
الخطر هنا بنيوي: الطلاب الذين ينخرطون في "مخاطر فكرية" قد يُثنى على أفكارهم، لكنهم يُعاقبون لأنهم "خرجوا عن النموذج المعياري". بينما الطلاب الذين يُحسنون توجيه ChatGPT لينتج مخرجات متوافقة مع التوقعات، قد يحصلون على أعلى الدرجات — حتى مع جهد عقلي محدود.
هذه ليست مجرد ملاحظة على دراسة واحدة — بل تحدٍ مباشر لنموذج التعليم نفسه. إذا كان بإمكان الذكاء الاصطناعي التفوق على التفكير البشري الأصيل ضمن المعايير الحالية، فقد حان الوقت لنعيد النظر في ما نقيسه فعليًا.
ماذا يعني هذا للتعليم؟
هذه الدراسة لا تتعلق بالذكاء الاصطناعي فحسب، بل بكيفية تفاعله مع أنظمة تعليمية تعاني من اختلالات. وتُظهر أن:
المخرجات المصقولة المدعومة بالذكاء الاصطناعي لا تعني تعلّمًا أعمق.
قد يبدو الطلاب الذين يستخدمون LLM كأنهم يكتبون بشكل أفضل، لكنهم يصبحون أقل ارتباطًا معرفيًا بما كتبوه.
هناك تكلفة طويلة الأمد في الذاكرة، والملكية، والتفكير النقدي، عندما يُفوّض الجهد مبكرًا أو كثيرًا.
خلاصة
الجهد المعرفي مهم. عملية الكتابة بدون الذكاء الاصطناعي تخلق آثارًا ذهنية أعمق وتعلُّمًا أكثر رسوخًا.
استخدام الأدوات ليس دون تأثير. LLMs لا تغيّر المخرجات فقط، بل تعيد تشكيل طريقة تفكيرنا وتذكرنا.
يجب أن نعيد التفكير في معايير التقييم. إذا كنا نكافئ الطلاقة والانضباط المعيارية فقط، فقد نكون نُدرّب الطلاب على الانفصال عن التفكير نفسه.