خوارزميات التحسين الميتا-هيروستيكي
خوارزميات التحسين الميتا-هيروستيكي
يُصنف البحث عن حل في فضاء بحث واسع ضمن مسائل NP-hard، ويُعرف بأنه مسألة تحسين متعددة الأهداف (أي، الهدف الأول: تقليل عدد الخصائص المختارة كخصائص تمثيلية؛ الهدف الثاني: زيادة دقة تصنيف عملية اختيار الخصائص) (تشين وآخرون، 2019؛ هان وآخرون، 2014؛ لي وآخرون، 2017؛ يوسف وآخرون، 2016).
استُخدمت خوارزميات التحسين الميتا-هيروستيكي (MHO) بنجاح مؤخرًا لمعالجة العديد من مسائل التحسين المعقدة، بما في ذلك مسألة اختيار النظام. ووفقًا لخوارزميات MHO، أثبتت الطريقة القائمة على السكان قدرتها على تحقيق نتائج أفضل من الطرق التقليدية في معالجة مختلف مسائل التحسين في الهندسة والعلوم والصناعة. الخوارزميات الأكثر شيوعًا هي خوارزمية بحث الجاذبية (GSA) (Taradeh et al., 2019)، Gray Wolf Optimizer (GWO) (Emary, Zawbaa, & Hasanien, 2016b)، خوارزمية تحسين الحوت (WOA) (Tubishat, Abushariah, Idris, & Aljarah, 2019)، خوارزمية Krill Herd (KHA) (أبو ليغة، 2019)، خوارزمية تحسين مستعمرة النمل (ACO) (كبير، شاه جهان، ومراس، 2012)، الخوارزمية الجينية (GA) (أبو ليغة وخضر، 2017)، خوارزمية سرب الأسماك الاصطناعية (AFS) (لين، تشين، هونغ، 2015)، خوارزمية الخفافيش (BA) (العمري، خضر، البيطار، & أبوعليجة، 2017a)، وخوارزمية تحسين سرب الجسيمات (PSO) (أبو عليجة، خضر، وحنانده، 2018)، ومُحسِّن أكويلا (AO) (أبو عليجة وآخرون، 2021)، وخوارزمية التحسين الحسابي (AOA) (أبو عليجة، ديابات، ميرجليلي، عبد العزيز، وجاندومي، 2020).
في الوقت الحاضر، تتوافر كميات هائلة من البيانات في مختلف المجالات، مما يُسبب صعوبات في المعالجة الرقمية للبيانات الخام (Ewees, El Aziz, & Hassanien, 2019). يُعدّ اختيار الميزات (FS) آلية معالجة مسبقة أثبتت فعاليتها في تعزيز أداء تقنيات التعلّم المختلفة، وتحسين دقتها، وتقليل وقت الحساب اللازم لعملية التدريب (Arora, Sharma, & Anand, 2020).
تكمن أهمية أنظمة اختيار الميزات في وجود ميزات زائدة وغير ذات صلة في مجموعات البيانات، والتي تؤثر سلبًا على فعالية تقنيات التعلّم. تُصنّف مشكلة اختيار الميزات ضمن مشاكل البحث الصعب، لأنها تهدف إلى تحديد أقل عدد ممكن من الميزات التي تُعبّر عن المجموعة الأساسية من الميزات دون فقدان المعلومات الجوهرية (Agrawal et al., 2020, Emary et al., 2016a). مع تطور أدوات جمع البيانات، أصبح عدد هائل من الخصائص متاحًا في مجموعات البيانات المأخوذة من مجالات واقعية كالمجالات الطبية،
والتعرف على الأنماط، وعلم الأحياء، والاتصالات. ولذلك، أصبح فحص هذه الكميات الهائلة من البيانات غير فعال. ونتيجةً لذلك، يُعد البحث عن خصائص مفيدة وغنية بالمعلومات، وتوليد جميع المجموعات الفرعية المحتملة للخصائص لاختيار مجموعة فرعية واحدة فقط، عمليةً تستغرق وقتًا طويلاً وتُمثل تحديًا كبيرًا، نظرًا لكونها منهجية بحث شاملة (عبد الباسط وآخرون، 2020؛ نيغاز وآخرون، 2020).
إضافةً إلى استراتيجيات البحث، يُعد تقييم نتائج مجموعات فرعية مختارة من الميزات جانبًا آخر يُستخدم لإيجاد الميزات التمثيلية. تُصنَّف طرق اختيار الميزات إلى ثلاث فئات: المُغلِّفات، والمُرشِّحات، والمُضمَّنة، وذلك وفقًا لمعايير تقييم المجموعات الفرعية. لمزيد من التفاصيل، يُرجى مراجعة أبو عليجة، خضر، البطار، والعمري (2017) وليو وموتودا (2012). في الآونة الأخيرة، حظيت أساليب التغليف باهتمام العديد من الباحثين،
كما ورد في الأدبيات (Chandrashekar and Sahin, 2014, Tsai and Chen, 2019)، نظرًا لأهمية أسلوب التعلم في عملية اختيار الميزات. ولذلك، يعتمد اختيار أي ميزة من الميزات الأصلية على أداء مخرجات أسلوب التعلم (مثل دقة التصنيف أو صحة المصنف المستخدم). وقد استُخدمت أساليب تصنيف متنوعة في مختلف طرق اختيار الميزات. على سبيل المثال، انظر شجرة القرار (DT)، وخوارزمية أقرب جار (k-NN)، والشبكات العصبية الاصطناعية (ANN) (Emary et al., 2016a, Faris et al., 2020).

كانت الخوارزمية الجينية (GA) أول خوارزمية تطورية مقترحة في الأدبيات، وقد طُوّرت بناءً على القاعدة الأساسية للتطور عبر الأجيال (Sampson, 1976). في خوارزمية تحسين سرب الجسيمات (PSO)، يُحدد كل جسيم من خلال موقعه، ولياقته، ومتجه سرعته (Eberhart & Kennedy, 1995). تُعدّ خوارزمية AFS إحدى خوارزميات البحث القوية التي تعتمد على هجرة الأسماك وذكائها أثناء عملية البحث عن الطعام (عزيزي، 2014). أما خوارزمية GSO فهي خوارزمية قوية نسبيًا مستوحاة من الطبيعة، وتتميز بتكلفة حسابية أقل من بعض الخوارزميات التطورية الأخرى (بينيثا، ساتيا، وآخرون، 2012). تجدر الإشارة إلى أن تقنيات البحث عن الغذاء المختلفة استخدمت حسابات المصفوفات في الدراسات السابقة. وفي التقنيات الحديثة والواعدة (درينياس وآخرون، 2008؛ بول وآخرون، 2015أ)، يُعتبر اختيار مجموعة فرعية من الأعمدة طريقةً فعّالة لإجراء البحث عن الغذاء ضمن حدود نظرية معينة. وقد استُخدمت هذه التقنيات لإجراء البحث عن الغذاء على خوارزمية k-means (بول، ماجدون-إسماعيل، ودرينياس، 2015ب)، وانحدار ريدج.