تحسين كشف الأغراض ثلاثية الأبعاد من خلال المعلومات السياقية والسمات ثنائية الأبعاد
الكلمات المفتاحية:
فهم المشهد، التعرّف على الأغراض ثلاثية الأبعاد، الشبكات العصبونية التلافيفية، السمات السياقيةالملخص
أصبحت عملية فهم المشهد في البيئة ثلاثية الأبعاد من أحد أهم الموضوعات البحثية النشطة ضمن نطاق الرؤية الحاسوبية، فبمقارنتها مع البيئة ثنائية الأبعاد ذات الصور
الملونة، تحوي الصور ثلاثية الأبعاد على مجموعة ضخمة من المعلومات التي يمكن الاستفادة منها في عملية فهم المشهد وتحديد الأغراض الموجودة ضمنه، حيث تتعدد التطبيقات التي تعتمد على الفهم ثلاثي البعد للمشهد مثل تجوال الروبوتات وتطبيقات الألعاب ذات الواقع المعزّز وغيرها الكثير. إن المعلومات ثلاثية الأبعاد المحصلة بواسطة الحساسات تتصف بكونها معلومات غير بنيوية وليست مرتبة، مما يجعل عملية الاستفادة منها بالطرق التقليدية (كالشبكات العصبونية التلافيفية والشبكات العصبونية العودية) المستخدمة مع الصور ثنائية الأبعاد عند تطبيقها بصورة مباشرة أمراً صعباً.
نقدّم في هذا البحث نموذجاً جديداً (CIMVNet) للتعرف على الأغراض ضمن البيئة ثلاثية الأبعاد بالاعتماد على تعزيز معلومات الصور ثلاثية الأبعاد بمجموعة من السمات التي استُخرجت من الصور الملونة ثنائية الأبعاد، بالإضافة إلى الاستفادة من المعلومات السياقية للمشهد وارتباطات مكوناته المختلفة في تحسين دقة السمات ثلاثية الأبعاد المستخرجة. أثبت النموذج المطوّر أن الاستفادة من أكثر من مصدر للبيانات ضمن الصورة ثلاثية الأبعاد يحسّن من دقة التصنيف، فقد حقق النموذج المقترح تحسناً بالدقة مقارنة مع النتائج الخاصة بالدراسات المرجعية، بزيادة 3.04% عن أعلى دقة تم التوصّل إليها في الدراسات المرجعية السابقة.