شريكٌ بحثي للبرامج البحثية المعنية بدراسة أثر الذكاء الاصطناعي في التعليم العالي.

يُدير UniRubric برنامجاً مخصصاً للجامعات والمعاهد المهنية والجهات الحكومية ضمن البرامج البحثية التي تتناول أثر الذكاء الاصطناعي في التعليم العالي. نُقدِّم الأداة المنهجية؛ ويتولّى فريقكم البحثي تصميم الدراسة. تسير الشراكة وفق بروتوكول ثلاثي المراحل يصلح للنقل مباشرةً إلى قسم المنهجية في ورقتكم البحثية، ويشمل معايير تقييم ثنائية اللغة، وتصديراً كاملاً للبيانات على مستوى كلّ معيار، وقابلية إعادة الإنتاج عبر تثبيت المطالبة، فضلاً عن الحق في الاستشهاد بـUniRubric في أيّ منشورٍ علميٍّ ناتج.

تتباين الأدبيات المنشورة حول مقارنة التغذية الراجعة بين الإنسان والذكاء الاصطناعي، ولا تزال هذه المسألة قيد البحث النشط. نعدّ ذلك مسوّغاً لبرنامجنا البحثي لا حجّةً لتجنّبه؛ يُرجى الاطلاع على حالة المجال أدناه.

التقدّم لشراكةٍ بحثية الاطلاع على حالة المجال ↓

01
معامل الارتباط ICC = 0.43 بين الذكاء الاصطناعي والمحكِّمين البشر في مقالات التفكير الناقد.
أشار تحليل مقارن مختلط الأساليب إلى أن التقييم بالذكاء الاصطناعي يمكن أن يدعم الحكم البشري لا أن يحل محله في مهام التفكير الناقد. قدّم المعلمون تفسيرات أوضح وأعمق لإجابات الطلاب.
Taylor & Francis · تقييم التفكير الناقد في التعليم العالي · 2025
02
كابا كوهين κ = 0.18 بين GPT-4 والأساتذة في مقالات الماجستير.
تطابق GPT-4 مع المحكِّمين البشر في متوسط الدرجات لكن بموثوقية منخفضة بين المحكِّمين ونمط تقييم محافظ في المدى الأوسط. لم يحسّن تصميم المطالبات (prompt engineering) المحاذاة بشكل ملحوظ.
Lundgren · جامعة غوتنبرغ (arXiv 2406.16510) · 2024
03
الذكاء الاصطناعي يميل إلى التقييم المتساهل للضعفاء والقاسي للمتميزين — التحيز نسبي.
وجد Wetzler وزملاؤه أن تقييم الذكاء الاصطناعي التوليدي يُظهر تحيزاً نسبياً متسقاً، وأوصوا بعدم استخدامه كأداة تقييم مستقلة للكتابة الدقيقة التي تتطلب الإبداع وعمق التفكير.
جامعة ولاية أوهايو · Wetzler وآخرون · 2024
04
دمج المعايير (rubric) يحسّن محاذاة الذكاء الاصطناعي مع المحكِّمين البشر بشكل ملحوظ.
162 مقالة بالإنجليزية كلغة أجنبية من طلاب أتراك قيّمها ChatGPT وDeepSeek ومحكِّمان بشريان. مع معايير صريحة، أظهر ChatGPT حساسية أقوى وتوافقاً أفضل. مقالات الرأي حققت أفضل توافق، أما المقالات الجدلية فكانت الأضعف.
ResearchGate · ChatGPT لتقييم الكتابة · 2024
05
GPT-4 طابق موثوقية المعلمين في مقالات الإنجليزية كلغة أجنبية الصينية.
حلّلت نظرية التعميم (G-theory) 30 مقالة من اختبار CET-4 ووجدت أن موثوقية تقييم GPT-4 تطابق أو تتجاوز موثوقية أربعة معلمين جامعيين. كانت التغذية الراجعة النوعية من ChatGPT أكثر صلة من تغذية المعلمين الراجعة في اللغة والمحتوى والتنظيم.
Nature · مجلة الإنسانيات والعلوم الاجتماعية · 2024
06
التغذية الراجعة من الذكاء الاصطناعي أدّت إلى درجات مراجعة أعلى مقارنةً بعدم تقديم تغذية راجعة.
حصل طلاب صينيون يتعلمون الإنجليزية كلغة أجنبية (ن=35) راجعوا مقالاتهم باستخدام تغذية ChatGPT الراجعة على درجات أعلى بشكل ملحوظ من مجموعة بلا تغذية راجعة. صنّف الطلاب تغذية المعلمين على أنها أكثر فائدة وأسهل تطبيقاً.
ScienceDirect · الحاسوب والكتابة · 2024

هذه نقاط انطلاق، لا إجماع علمي. تحيز الانتقاء، وحساسية المطالبات، وتغيّر إصدارات النماذج، وصغر العينات النموذجي في الدراسات التجريبية الأولية كلها مخاوف منهجية قائمة. البرنامج البحثي يحتاج إلى تصميمه الخاص، ومجموعته الخاصة، وتحليله الخاص.

معايير ثنائية اللغة — بين الكتابة باللغة الأولى (L1) والكتابة باللغة الثانية (L2)
يعمل النموذج المُقيِّم بصورةٍ أصلية في أكثر من 100 لغة، من بينها العربية. تحتفظ واصفات المعايير والاقتباسات الداعمة والتغذية الراجعة الموجَّهة للطالب جميعها بلغة التسليم. ويُدعم العرض من اليمين إلى اليسار في طبقة الواجهة.
تصدير البيانات على مستوى المعيار
كل عملية تقييم تُصدَّر بصيغة CSV أو JSON: الدرجات لكل معيار، نطاق الواصف المُطابَق، اقتباس المعيار، الاقتباس الداعم من نص الطالب، الدرجة النهائية بعد تعديل المحاضر، وطابع زمني للتدقيق. يحلل الباحثون البيانات الخام، لا لقطات الشاشة.
حق الاستشهاد
إذا استشهدت دراستك بـUniRubric — بالاسم، والإصدار، والتاريخ — فهذا مرحَّب به ومُتوقَّع. نطلب فقط أن تتضمن سلسلة النموذج والإصدار التي نسجّلها على كل عملية تقييم لتحقيق إمكانية إعادة الإنتاج.
المحاضر في الحلقة على كل درجة
لا تُصدَر أي درجة للطالب قبل أن يراجعها المحاضر ويعتمدها. هذا مُثبَّت في الكود، وليس إعداداً. بوابة الاعتماد هي بالضبط الميزة التي يريد تصميم بحثك دراستها.
برنامج مفصَّل حسب دراستك
حجم العينة، تصميم المعايير، زوج اللغة، تدريب المحكِّمين، بروتوكولات أخلاقيات البحث — نعمل مع التصميم الذي قدّمته لجهة التمويل، لا ضد قالب تجربة عام.

01
قبل افتتاح نافذة الدراسة
المعايرة والتعمية
يقوم فريقك وUniRubric بتقييم مجموعة مرجعية مشتركة من 10-20 عينة في زوج اللغة والتخصص محل الدراسة. تُراجَع الفروقات، وتُضبط واصفات المعايير لتتوافق مع السجل المحلي للمؤسسة، ويُثبَّت إعداد المطالبة (prompt). ثم يُحفظ هاش (hash) المطالبة المثبَّتة كي يمكن إعادة إنتاج الدراسة.
لفريقك البحثي
يمنح قسم المنهجية بروتوكول معايرة قابلاً للدفاع. سيسأل المحكِّمون عن طريقة ضبط الذكاء الاصطناعي على سياقك — هذه هي الإجابة.
على جانبنا
نتعرّف على المعايير وعلى الصوت اللغوي للدفعة. تبقى عمليات الضبط محصورة في دراستك دون أن تنتقل بين الدفعات.
02
خلال نافذة الدراسة
التقييم المتوازي — مستقل ومُعمَّى
يقيّم المحاضرون بشكل اعتيادي ويُصدرون الدرجات للطلاب عبر نظام إدارة التعلم، تماماً كما لو لم نكن موجودين. يقيّم UniRubric الأعمال نفسها بشكل مستقل وصامت — لا يرى المحاضر درجة الذكاء الاصطناعي قبل تسليم درجته. تُسجَّل المجموعتان مع طوابع زمنية، وسلاسل النموذج والإصدار، والاقتباسات المعيارية التي ارتُكزت إليها كل درجة.
لفريقك البحثي
هذه هي مرحلة جمع البيانات. صدِّر كل شيء بصيغة CSV أو JSON بأي وتيرة — يومية، أسبوعية، أو في نهاية الفصل. التحليل الإحصائي يجري في الأدوات التي يستخدمها فريقك أصلاً؛ UniRubric أداة بحثية لا محلِّل.
على جانبنا
يُحفظ مبدأ المحاضر في الحلقة. تجربة الطالب لا تتغير. تجري دراستك إلى جانب التدريس دون أن تعطّله.
03
اختياري — السنة الثانية من المنحة عادةً
أدوات المقارنة والمراجعة المدمجة
بعد أن تكون الدراسة قد جرت لفصل أو فصلين، يطلق UniRubric داخل المنتج واجهة مقارنة مقتصرة على دفعتك: فروقات على مستوى المعيار، معامل الارتباط ICC وكابا κ مجمَّعَين لكل محكِّم ولكل لغة، رصد الانجراف خلال الفصل، ومخططات Bland-Altman لأي زوج من المعايير تختاره. تحليل المجموعات الفرعية حسب اللغة الأولى/الثانية، ولغة التسليم، وخبرة المحكِّم.
لفريقك البحثي
دورات أسرع بين التحليل والتعديل على تصميم الدراسة. مفيدة إذا كانت مخرجات منحتك تشمل توصيات تطبيقية للتبني، لا مجرد المقارنة الإحصائية.
على جانبنا
هذه المرحلة الأكثر تعقيداً في البناء — تُموَّل عادةً ضمن المنحة أو عبر ترتيب خدمات بحثية مستقل.

البروتوكول نفسه سواء كنت تقارن التغذية الراجعة بين الإنسان والذكاء الاصطناعي في لغة واحدة، أو في زوج لغة أولى/ثانية، أو بين مؤسستين. التفاصيل — حجم العينة، بروتوكولات أخلاقيات البحث، صياغة الاستشهاد، مخطط تصدير البيانات — تُكتب جميعها في مقترح البرنامج الذي نعيده إليك بعد بريدك الأول.

01 — المعايرة رسوم ثابتة لكل دراسة: وقتٌ هندسي مخصَّص، ومراجعةٌ من المستشارة البحثية، وتشغيلُ إعدادات المرساة بمطالبةٍ مُثبَّتة، وتقريرُ معايرةٍ موثَّق يُرفَق ضمن قسم المنهجية. يُحتسَب كرسمٍ واحد يُدفَع عند بداية التعاون.
02 — التقييم المتوازي تسعير B2B القياسي لدينا لكل طالب: أيّاً كان حجم الاستخدام داخل مجموعة الدراسة، يُحتسَب وفق الفئات نفسها التي يتبعها أيُّ نشرٍ مؤسسي — راجعوا صفحة التعاقد للاطلاع على الفئات المُعلَنة. لا توجد رسوم إضافية مرتبطة بطبيعة البحث، ويمكن للمجموعة أن تنتقل مباشرةً إلى نشرٍ مدفوع بعد انتهاء نافذة المنحة، إذا كان التبنّي المؤسسي ضمن مخرجات بحثكم.
03 — أدوات المقارنة والمراجعة المدمجة عرض سعر مخصَّص لكل دراسة: مرحلةٌ هندسية مخصَّصة: لوحاتُ تحكُّم خاصةٌ بمجموعة الدراسة، واحتسابُ معاملات الاتساق ICC، وكابا كوهين κ مُجمَّعَين وفق تصميم دراستكم، ورصدٌ للانجراف، ومخطّطات Bland–Altman، وتحليلٌ للمجموعات الفرعية. يُسعَّر كاتفاقية خدمات بحثية مستقلة، تُفعَّل عادةً في السنة الثانية من المنحة. ونرحِّب بإدراجنا متعاقداً من الباطن في طلب المنحة ذاته.

نتعامل مع الشراكات البحثية بوصفها برنامجاً تعاونياً طويل الأمد، لا صفقةً عابرة. وإذا كانت لدى جهة التمويل اشتراطاتٌ على علاقات المورِّدين، أو حاجةٌ إلى مقياس تسعيرٍ متدرِّجٍ لميزانيات الاتحادات البحثية، فاذكروا ذلك في الرسالة الأولى — وسنعمل ضمن هذا القيد لا ضدَّه.

د. روهينا طاهر

Research Advisor, UniRubric

حاصلة على درجة الدكتوراه؛ تعمل محاضِرةً في أستراليا. حاصلة على درجة الماجستير في القيادة التربوية من جامعة قطر (2014). مُحكِّمة لدى دار النشر BMC ومؤلِّفة منشورة. تتولّى الدكتورة طاهر الإشراف الاستشاري على برنامج التعاون البحثي في UniRubric، وتُقدّم الدعم للفِرق البحثية الجامعية والحكومية في تصميم دراساتها، وإعداد خطط البيانات، ورسم مسار النشر.

ORCID: 0000-0002-7735-6414 ↗

اسم المؤسسة *البريد الإلكتروني للتواصل *موضوع البحث *وصف موجز *

شريكٌ بحثي للبرامج البحثية المعنية بدراسة أثر الذكاء الاصطناعي في التعليم العالي.

معامل الارتباط ICC = 0.43 بين الذكاء الاصطناعي والمحكِّمين البشر في مقالات التفكير الناقد.

كابا كوهين κ = 0.18 بين GPT-4 والأساتذة في مقالات الماجستير.

الذكاء الاصطناعي يميل إلى التقييم المتساهل للضعفاء والقاسي للمتميزين — التحيز نسبي.

دمج المعايير (rubric) يحسّن محاذاة الذكاء الاصطناعي مع المحكِّمين البشر بشكل ملحوظ.

GPT-4 طابق موثوقية المعلمين في مقالات الإنجليزية كلغة أجنبية الصينية.

التغذية الراجعة من الذكاء الاصطناعي أدّت إلى درجات مراجعة أعلى مقارنةً بعدم تقديم تغذية راجعة.

معايير ثنائية اللغة — بين الكتابة باللغة الأولى (L1) والكتابة باللغة الثانية (L2)

تصدير البيانات على مستوى المعيار

حق الاستشهاد

المحاضر في الحلقة على كل درجة

برنامج مفصَّل حسب دراستك

المعايرة والتعمية

التقييم المتوازي — مستقل ومُعمَّى

أدوات المقارنة والمراجعة المدمجة

01 — المعايرة

02 — التقييم المتوازي

03 — أدوات المقارنة والمراجعة المدمجة

د. روهينا طاهر