Search In this Thesis
   Search In this Thesis  
العنوان
An improved text mining technique /
المؤلف
Dief, Nada Adel El-Sayed Nasr Ahmed.
هيئة الاعداد
باحث / ندى عادل السيد نصر أحمد ضيف
مشرف / علي إبراهيم الدسوقي
مشرف / عمرو ثابت علي الدين
مناقش / ھشام عرفات علي
الموضوع
Mining. Data Mining. Data Mining - methods.
تاريخ النشر
2016.
عدد الصفحات
120 p. :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
الهندسة
تاريخ الإجازة
01/01/2016
مكان الإجازة
جامعة المنصورة - كلية الهندسة - Computers and Systems Engineering Department
الفهرس
Only 14 pages are availabe for public view

from 139

from 139

Abstract

نتيجة تزايد كمية البيانات و إنتاج الآلاف من الوثائق على شبكة الانترنت أصبح من الصعب على المستخدم أن يراجع و يحلل الوثائق يدويا. و هذا أدى إلى أهمية التنقيب في تقيات تعدين البيانات النصية. التوجه للتلخيص التلقائي للنصوص. واحد من أهم هذه التقنيات هو التلخيص التلقائي للنصوص. توفير الملخصات التلقائية لبعض الموضوعات يساعد المستخدم في الغلب على مشكلة الحجم الهائل من الوثائق و البيانات الموجودة. معظم الأنظمة الحاليه المستخدمة في استخراج ملخصات للنصوص تحتوي على عدة قيود منها التكرار و عدم الدقة في استخاج الجمل المهمة و التغطية الضعيفة و انعدام التماسك بين الجمل المختارة. هذه الرسالة تقدم EMDG framework للتلخيص التلقائي للنصوص. هذا الإطار يعتمد على خطوات جديدة لقياس مدى تشابه الجمل و طريقة مميزة لإختيار الجمل تعتمد على عمليتين و هما تجميع وتقسيم الجمل واعطائها معيار أو رقم معين. و يعتمد أيضا على تقنيات لإعادة ترتيب الجمل المشتركة بعد إزالة الجمل المكررة.
لقد تمت تجارب واسعة النطاق على أكثر من مجموعة بيانات مثل DUC 2005, DUC 2006, DUC 2007 . وهذا أثبت أن الاطار المقترح أكثر فعالية من النظم الحالية. و يستخدم تقييم ROUGE للتحقق من صحة و فعالية النظام المقترح و قد أظهرت النتائج التجريبية إنه الأكثر فعالية و تفوق في التقنيات الأساسية. حيث يتميز الملخص النهائي بالتغطية الشاملة و المتماسكة.