يتزايد حجم البيانات على شبكة الإنترنت العالمية (WWW) باستمرار
يتزايد حجم البيانات على شبكة الإنترنت العالمية (WWW) باستمرار
بما في ذلك المصادر المتخصصة. هذا التزايد يجعل مهمة استخراج هذه البيانات أكثر تعقيدًا من ذي قبل، خاصةً مع وجود مصادر متعددة غير مترابطة. فلكل مصدر من هذه المصادر طريقته الخاصة في وصف البيانات حتى لو كانت تحتوي على نفس البيانات. ونتيجةً لذلك، تبرز الحاجة إلى تطوير طريقة جديدة قادرة على ربط هذه المصادر المتعددة. يمكن تحقيق ذلك عبر طرق مختلفة، مثل حساب التشابه بين بياناتها، وهي إحدى أكثر التقنيات شيوعًا لربط المصادر المختلفة أو العناصر الموجودة فيها.
مع ذلك، صُممت معظم هذه التقنيات لحساب التشابه بناءً على المطابقة المباشرة أو التشابه الدلالي بين أوصاف العناصر/العُقد. كما بُذلت بعض المحاولات لاستغلال علاقة واحدة (علاقة مُسماة) للعمل جنبًا إلى جنب مع التشابه الدلالي المحسوب بناءً على تشابه النصوص (Yih et al., 2014).
مع انتشار مصادر البيانات على شبكة الإنترنت العالمية (WWW)، يتداخل بعضها، مما يُسهم في مساعدة الباحثين على اكتشاف المزيد من المعلومات والحقائق. إلا أن استخراج المعلومات والبيانات، ثم حساب التشابه الدلالي بينها، مهمة معقدة نظرًا لاختلاف طرق وصف المعلومات في هذه المصادر. لذا، يمكن التغلب على هذه المشكلة بتصميم طريقة جديدة للتشابه الدلالي تأخذ في الحسبان عوامل متعددة، ولا تقتصر على الوصف النحوي للبيانات.
تصف هذه الورقة البحثية طريقة جديدة للتشابه الدلالي تستغل عوامل مختلفة لحساب التشابه الدلالي بين مصادر متنوعة. هذه العوامل هي وصف العقدة والعلاقات المحيطة بها (التصاعدية والتنازلية) من أنطولوجيات متعددة. سيسهم هذا في حساب التشابه الدلالي من زوايا نظر متعددة، وسيساعد في تعزيز علاقات التشابه بين المصادر المختلفة لاكتشاف أوجه تشابه دلالية جديدة بين أعراض الإنفلونزا.
قد يُفضي ذلك إلى السيطرة على انتشار تفشي الإنفلونزا. طُبقت هذه الطريقة على مجموعة من أنطولوجيات الإنفلونزا لاكتشاف حالات تشابه جديدة قد لا تكون واضحة في المصادر الأصلية. كما أُجري تقييم غير متصل بالإنترنت على مجموعة من الأنطولوجيات، وقورنت بالطرق الأساسية والمتخصصة، حيث تفوقت على كلتيهما وحققت درجات تشابه أكثر دقة.
يُساعد السيناريو التالي على فهم أهمية وجود طريقة جديدة للتشابه الدلالي تُساعد الأطباء والباحثين على الوصول إلى تشخيص أكثر دقة وتُتيح لهم توسيع آفاقهم حول أمراض مُحددة كالإنفلونزا. لنفترض أن هناك مريضًا يُعاني من الإنفلونزا ويشك في نوعها.
ذهب المريض إلى الطبيب لتشخيص نوع الإنفلونزا ووصف الدواء المناسب. لكن بعد بضعة أيام، تدهورت حالة المريض بسبب خطأ في التشخيص، والذي حدث نتيجة التشابه بين الإنفلونزا الموسمية ونوع آخر من الإنفلونزا (مثل كوفيد-19)، المصنف جائحةً من قبل منظمة الصحة العالمية. عادةً ما يستخدم الأطباء معارفهم وخبراتهم لتشخيص الأمراض. ولكن في بعض الأحيان، قد تتشابه أعراض الأمراض بشكل كبير، أو قد لا يكون الأطباء مركزين بما يكفي أثناء التشخيص لانشغالهم بمتابعة عدة مرضى، أو قد يكون ضغط العمل سببًا آخر يزيد من خطر الخطأ في التشخيص. وهذا بدوره يُسرّع من انتشار الأمراض، لا سيما مع الأوبئة والجائحات مثل متلازمة الشرق الأوسط التنفسية (MERS-CoV) أو كوفيد-19. لهذه الأسباب، تُصبح طريقة جديدة للتشابه الدلالي ضرورةً ملحةً لتجاوز العديد من العواقب التي قد تظهر كتشخيص خاطئ.

... ستقدم هذه الورقة البحثية طريقة جديدة لحساب التشابه الدلالي بين مصادر متعددة (مثل أنطولوجيات الإنفلونزا) استنادًا إلى مزيج من التشابه بين الوصف النصي للعقدة أو العنصر، بالإضافة إلى العلاقات التصاعدية والتنازلية (مثل "هو" و"يحتوي على"). ستُصاغ هذه العلاقات بناءً على الشبكة الدلالية المستنتجة، والتي حُسبت بناءً على تداخل البيانات بين المصادر المختلفة. قد تساعد طريقتنا المقترحة الأطباء والباحثين على فحص معظم الحالات ذات الأعراض المتشابهة من زوايا متعددة (أي بالاعتماد على تشابه وصف العنصر، بالإضافة إلى جميع العلاقات المحيطة) قبل تشخيص مرضاهم. سيساهم هذا في تقليل نسبة الأخطاء في تشخيص المرضى، كما حدث مع المريض في السيناريو السابق. كما سيساعد الأطباء والباحثين على اكتشاف المزيد من المعلومات.