دراسة مرجعية لخوارزميات تجميع تدفق البيانات
الكلمات المفتاحية:
تدفقات البيانات، تجميع تدفق البيانات، التجميع في الوقت الفعليالملخص
يعد تنقيب تدفق البيانات مجالاً بحثياً نشطاً لأنه يقوم باكتشاف المعرفة من كميات كبيرة من البيانات التي يتم إنشاؤها باستمرار وجمعها في الوقت الفعلي. يشتمل التّعلم غير الخاضع للإشراف على أحد أكثر مهام التنقيب عن البيانات شيوعاً وهو التجميع.
نقدم هذا البحث لتوضيح أهم المفاهيم والخصائص الأساسية المشتركة لخوارزميات تجميع تدفق البيانات مثل تغير المفهوم وهياكل البيانات والنوافذ الزمنية وطرق معالجة البيانات بالإضافة لبعض التحديات التي تواجه الخوارزميات مثل التعامل مع البيانات الشاذة والمتطورة والذاكرة المحدودة والوقت المحدود ومعالجة البيانات متعددة الأبعاد وعدد المجموعات، كما قمنا بأخذ عينة من الخوارزميات لتجميع تدفق البيانات وعرض المفاهيم والتحديات الموضحة ضمن البحث باستخدام هذه العينة وذلك بطريقة إحصائية غرافيكية. لتوضيح ومقارنة المعايير المستخدمة في خوارزميات تجميع تدفق البيانات.