تقنيات الأبعاد الثلاثية
تقنيات الأبعاد الثلاثية
يُصبح استخدام تقنيات الأبعاد الثلاثية جذابًا بشكل متزايد لمختلف التطبيقات الأكاديمية والصناعية (مثل الترفيه، والتصوير ثلاثي الأبعاد، والملاحة الروبوتية، والجراحة الطبية، وغيرها) ومع ذلك، فإن المعالجات المُطبقة عادةً لالتقاط المحتوى أو نقله أو عرضه (مثل الضغط، والنقل، وما إلى ذلك) قد تؤثر على الجودة المُدركة.
ولكن، عندما تكون هذه التشوهات حتمية، لا يُمكن لتقييم الجودة الذاتي أن يُوفر لنظام مستقل تغذية راجعة فورية. مع التطور السريع لأنظمة العرض الرقمي ثلاثي الأبعاد خلال العقد الماضي، لعب تقييم جودة الصورة (IQA) دورًا هامًا في توفير معلومات قيّمة لاختبار العملية وتحسينها ووضع معايير لها ومراقبتها.
لذا، تُعدّ المقاييس الفعّالة ضرورية لتحسين تقنيات العرض ثلاثي الأبعاد وضمان تجربة استخدام عالية الجودة. التصوير المجسم، المعروف أيضًا باسم التصوير المجسم ثلاثي الأبعاد، هو تقنية تُستخدم في معظم شاشات العرض ثلاثية الأبعاد لخلق وهم العمق في الصورة باستخدام الرؤية المجسمة للعينين. وقد طُوّرت مناهج تقييم جودة الصورة المجسمة (SIQA)، التي تختلف عن مناهج تقييم جودة الصورة ثنائية الأبعاد، خصيصًا لهذا النوع من المحتوى.
بشكل عام، يمكن تقسيم مقاييس تقييم جودة الصورة (IQA) وتقييم جودة الصورة المجسمة (SIQA) إلى فئتين: مناهج ذاتية ومناهج موضوعية. يعتمد التقييم الذاتي على آراء المُقيّمين، ويُعبّر عنه غالبًا بمتوسط درجة الرأي (MOS) أو متوسط فرق درجة الرأي (DMOS). يُعدّ هذا النهج فعالاً وموثوقاً لتقييم الجودة الإدراكية، ولكنه ينطوي على بعض العيوب، مثل استهلاكه للوقت، وتكلفته العالية، وعدم ملاءمته للتطبيقات عبر الإنترنت.
في المقابل، يوفر التقييم الموضوعي تقييماً آلياً يُعالج قصور التقييم الذاتي. ولذلك، بُذلت جهودٌ حثيثة لتصميم أساليب دقيقة لتقييم جودة الصور (IQA/SIQA). مع ذلك، تُقسّم الأساليب الموضوعية الحالية إلى ثلاث فئات: مقاييس المرجع الكامل (FR)، ومقاييس المرجع المُخفّض (RR)، ومقاييس انعدام المرجع (NR). تستخدم أساليب المرجع الكامل صورة ستيريو مرجعية، بينما تستخدم أساليب المرجع المُخفّض معلومات جزئية فقط من الصورة المرجعية، في حين أن صورة ستيريو مرجعية غير متاحة تماماً لمقاييس انعدام المرجع. ونتيجةً لذلك، تُعدّ نماذج انعدام المرجع أكثر فائدة في معظم التطبيقات.
يتزايد استخدام تقنيات الأبعاد الثلاثية بسرعة، ويُستخدم التصوير المجسم عادةً لعرض المحتوى ثلاثي الأبعاد. مع ذلك، قد يؤدي الضغط والنقل والمعالجات الأخرى اللازمة إلى تقليل جودة هذه الصور. وقد حظي تقييم جودة الصور المجسمة (SIQA) باهتمام متزايد لضمان تجربة مشاهدة جيدة للمستخدمين، ولذا طُرحت عدة طرق في الأدبيات العلمية، مع تحسن ملحوظ في الطرق القائمة على التعلم العميق. تقدم هذه الورقة البحثية طريقة جديدة لتقييم جودة الصور المجسمة (SIQA) تعتمد على التعلم العميق دون الحاجة إلى مرجع، باستخدام فرضية الرؤية الأحادية والانتباه البصري البشري. أولًا، تُنشأ الصورة الأحادية مع مراعاة وجود التنافس البصري الذي يغطي حالة التشوه غير المتماثل. ثانيًا، تُحسب خريطة البروز مع مراعاة معلومات العمق. وتهدف هذه الأخيرة إلى استخراج أجزاء من المناطق الأكثر أهمية من الناحية الإدراكية.
أخيرًا، تُضبط نسخة مُعدلة من الشبكة العصبية الالتفافية (CNN) المدربة مسبقًا وتُستخدم للتنبؤ بدرجة الجودة من خلال الأجزاء المختارة. تم تحليل خمسة نماذج مختلفة مدربة مسبقًا ومقارنتها من حيث النتائج. تم تقييم أداء المقياس المقترح على أربع مجموعات بيانات شائعة الاستخدام (قواعد بيانات 3D LIVE للمرحلتين الأولى والثانية، بالإضافة إلى Waterloo IVC 3D للمرحلتين الأولى والثانية). وبالمقارنة مع أحدث المقاييس، تُحقق الطريقة المقترحة نتائج أفضل. سيتم إتاحة
في أغلب تصميمات نماذج انعدام المرجع لتقييم جودة الصور، تلعب مؤشرات الجودة، المعروفة أيضاً بخصائص بنية الصورة المُدركة للجودة، دوراً أساسياً. تُحدث التشوهات المُضافة إلى الصور تغييرات في الخصائص البنيوية التي يُمكن رصدها من خلال إحصائيات الخصائص البنيوية.
استنادًا إلى كيفية حساب هذه الخصائص المُراعية للجودة، يمكن تصنيف نماذج NR إلى أساليب تعتمد على التعلّم الآلي وأخرى لا تتطلب تدريبًا. تتمتع الأساليب التي لا تتطلب تدريبًا بإمكانية تعميم داخلية، ومع ذلك، فإن أداءها حاليًا أقل من أداء الأساليب القائمة على التعلّم الآلي.
في المقابل، وباستخدام تقنيات التعلّم الآلي مثل انحدار متجه الدعم (SVR) والغابة العشوائية (RF)، يمكن ربط قيم خصائص الصورة بمؤشر جودة الصورة بسهولة، مما يُساعد نماذج NR-IQA القائمة على التعلّم الآلي على تحقيق أداء تقييم أعلى نسبيًا. علاوة على ذلك، حققت الخوارزميات القائمة على التعلّم العميق، والتي تربط الصورة أو بنية الصورة مباشرةً بمؤشر الجودة، نتائج واعدة في السنوات الأخيرة. ولكن، توجد عدة عيوب في هذه الأخيرة، مثل دقة بكسل الإدخال الثابتة، وحساسية البكسل للهجمات، والحاجة إلى بيانات تدريب واسعة النطاق.
بغض النظر عن أسلوب التعلّم المُستخدم في نظام SIQA، فإن نمذجة النظام البصري البشري