نظام تصنيف الأوراق البحثية واقتراح المحكمين بالاعتماد على معالجة اللغات الطبيعية NLP والنموذج اللغوي AraBERT

المؤلفون

  • رزان حلاق
  • د. محمد بسّام الكردي

الكلمات المفتاحية:

أوراق بحثيّة، تصنيف، نموذج لغوي، معالجة اللغات الطبيعية، نظام توصية

الملخص

تعتبر آليّة مراجعة الأوراق البحثية أداة التحكم بجودة الأبحاث العلمية المقدمة للنشر في المجلات والمؤتمرات العلمية، ومع ازدياد عدد الأبحاث العلمية المقدمة للنشر زاد الضغط على عملية المراجعة والتي تعتمد على الجهد البشري في فرز الأبحاث حسب موضوعها وإسنادها إلى المحكم الأنسب، ما زاد الحاجة لتطوير النظام التقليدي المتّبع لتفادي حدوث بطء أو تحيّز أو نقص في جودة العملية ولمواكبة التسارع العلمي المستمر. ومع تطور أدوات وتقنيّات الذكاء الصنعي وظهور العديد من الأدوات والمكتبات المساعدة في تحليل نصوص اللغة العربية ما سهّل استخدامها لتطوير النظم الحالية. تمّ في هذا البحث إنشاء مصنف متعدد التسميات للأبحاث حسب موضوعها (Multi-Label Classifier) بالاعتماد على نموذج التعلم العميق المدرب مسبقاً على اللغة العربية AraBERT وتم تخصيصه عبر تدريبه على بيانات مجلة محكّمة (المجلة السورية للبحوث الزراعية) بعد معالجتها أولياً باستخدام تقنيات معالجة اللغات الطبيعية، وأثبت هذا المصنف قدرته على تحديد موضوع البحث باستخدام العنوان والملخص فقط، وتم توظيف هذا المصنف في بناء نظام توصية بالمحكمين الأنسب لتحكيم ورقة بحثية، وهو عبارة عن نظام استرجاع المعلومات والذي يعمل على تصنيف وتحليل نصوص كل من البحث المقدم للتحكيم والأبحاث المنشورة سابقاً لمجموعة المحكمين في المجلة وتضمين النص دلالياً بالاعتماد على النموذج AraBERT للمقارنة بين النصوص وقياس نسبة التشابه لتقديم اقتراحات بأسماء عشر محكمين ذوي الاختصاص الأقرب للبحث، كما يوفر النظام اقتراحات إضافية كمحكمين جدد من ضمن الباحثين الذين نشروا مسبقاً في المجلة. تم اختبار النظام المنشأ على بيانات المجلة المحكمة، وأعطى نموذج التصنيف القيم 86.5%، 91.8%، 92.4%، 91.4% لكل من المقاييس Accuracy، F1-score، Precision، Recall على التوالي. كما وُجد أن 85% من المحكمين المقترحين من قبل النظام مناسبين تماماً للمراجعة حسب تقييم خبراء النشر في المجلة، وبتطبيق مقياس recall@ 10 أظهر أنّ 49% من الاقتراحات المقدمة من نظام التوصية طابقت المحكمين الفعليين للأبحاث المختبرة. تظهر أهمية هذا النظام كأداة فعّالة

لمساعدة المحريين في المجلات والمؤتمرات العلمية في تصنيف الأبحاث واختيار المحكمين الأنسب بسرعة وفعاليّة ودون تحيّز.

التنزيلات

منشور

2023-12-06

كيفية الاقتباس

رزان حلاق, & د. محمد بسّام الكردي. (2023). نظام تصنيف الأوراق البحثية واقتراح المحكمين بالاعتماد على معالجة اللغات الطبيعية NLP والنموذج اللغوي AraBERT. مجلة جامعة دمشق للعلوم الهندسية, 39(4). استرجع في من http://journal.damascusuniversity.edu.sy/index.php/engj/article/view/10869