تفاصيل الوثيقة

نوع الوثيقة : رسالة جامعية 
عنوان الوثيقة :
نظام ارجاع المعلومات المعتمد على الوكيل البرمجي
Agent Based Information Retrieval System
 
الموضوع : كلية الحاسبات وتقنية المعلومات - قسم علوم الحاسبات، 
لغة الوثيقة : العربية 
المستخلص : في عصرنا الحاضر أصبح الويب أكبر مستودع للبيانات، فمن الطبيعي أن يتم استخراج المعلومات من الويب. محركات البحث على شبكة الإنترنت أصحبت واحدة من أكثر الأدوات استخدامًا لاستخراج المعلومات من الويب. محركات البحث تسمح للمستخدمين البحث واسترجاع المعلومات بسهوله من خلال إدخال الاستعلام سواء كان كلمة او جمله معينة. بالرغم من أن محركات البحث تقوم بعمل جيد في البحث للعثور على صفحات معينة إلا أنها قد تكون أقل فعاليه لتلبية استفسارات واسعة أو غامضة، هذا بسبب وجود نتائج لمواضيع مختلفة ومعاني عديدة لنفس الاستعلام مما يُلزم المستخدم للبحث في عدد كبير النتائج الغير متعلقة في موضوعه حتى يجد النتيجة التي يريدها. من جانب آخر هنالك عدد كبير من التكرار في نتائج البحث مما يعكس سلبا ويزيد من بحث المستخدم للحصول على النتيجة المرجوة. هذه الرسالة تعالج مشكلتين أساسيتين هما التكرار وغموض المعنى للكلمات. حيث أن تعدد المعاني وتكرار النتائج سبب من أسباب ضعف أداء نظام استرجاع المعلومات. التكرار في صفحات الويب (Near Duplicate webpages) ستحل عن طريق أداة تقوم بكشفها وإزالتها حيث ان إزالة هذا التكرار يعود بالنفع في اوجه كثيرة منها تقليل عدد النتائج البحث هذا يؤدي إلى تقليل وقت البحث مما يسمح للمستخدم بأن يجد رغباته بأسرع ما يمكن. تنظيم نتائج البحث في مجموعات (Search result Clustering) من طرق حل غموض الكلمات وتعدد معانيها حيث أنه يقوم بتنظيم نتائج البحث إلى مجموعة من المجموعات ذا المعنى الواحد. تصميم خوارزميه لهذا التنظيم امر ليس بسهل لأنه يجب علينا أن نتأكد أن الاسم المختار لكل مجموعة مقروء وذو معنى ويمثل هذه المجوعة بالفعل. تقترح هذه الرسالة بناء نظام استرجاع المعلومات المعتمد على الوكيل البرمجي يقوم بعمليه تصفيه النتائج من التكرار و تجميع البيانات وتنظيمها عن طريق اضافة مكوني التجميع والتصفية (Filtering and Clustering Component). وكلاء مكون التجميع (Agent Based Clustering Component ) يتعاملوا مع صفحات الويب من خلال تجمعها وتنظيمها في مجموعات بناء على المعنى الفعلي للكلمة. الورد نت (WordNet) يستخدم للمساعدة في عمليه التنظيم بناء على مترادفات WordNet. وكلاء مكون التصفية (Agent Based Filtering Component ) يقوموا بإزالة التكرار من نتائج البحث. أثبتت التجارب أن مكون التصفية المقترح يحقق دقه (precision) بنسبة تصل الى 97 % و استدعاء (recall) يصل الى 97 % و مكون التجميع حقق دقه في معنى اسم المجوعة (cluster label) تصل الى 92 % . 
المشرف : د. فتحي البرعي عيسى 
نوع الرسالة : رسالة ماجستير 
سنة النشر : 1433 هـ
2012 م
 
المشرف المشارك : د.ميسون فؤاد محمدنور ابوالخير 
تاريخ الاضافة على الموقع : Sunday, November 18, 2012 

الباحثون

اسم الباحث (عربي)اسم الباحث (انجليزي)نوع الباحثالمرتبة العلميةالبريد الالكتروني
بسمة صالح السلميAlsulami, Bassma Salehباحثماجستير 

الملفات

اسم الملفالنوعالوصف
 34322.pdf pdf 

الرجوع إلى صفحة الأبحاث