Search In this Thesis
   Search In this Thesis  
العنوان
Handling missing values in data stream /
المؤلف
Khalil, Azza Ali Abd El Aziz Mostafa.
هيئة الاعداد
باحث / عزة علي عبدالعزيز مصطفي خليل
مشرف / حسن حسين السيد سليمان
مشرف / أحمد عطوان محمد عبده
مشرف / محمد محفوظ محمد الموجي
مشرف / ميرفت مصطفى فهمي أبوالخير
الموضوع
Database management. Soft computing. Data processing. Intelligent transportation systems.
تاريخ النشر
2024.
عدد الصفحات
online resource (111 pages) :
اللغة
الإنجليزية
الدرجة
ماجستير
التخصص
علوم الحاسب الآلي
تاريخ الإجازة
1/1/2024
مكان الإجازة
جامعة المنصورة - كلية الحاسبات والمعلومات - تكنولوجيا المعلومات
الفهرس
Only 14 pages are availabe for public view

from 111

from 111

Abstract

تمثل البيانات المفقودة تحديًا شائعًا في مصادر البيانات المختلفة، بسبب أخطاء إدخال البيانات يدويًا، وأعطال المعدات، وعدم الاستجابة للمسح. تواجه النمذجة التنبؤية، التي تعتمد على مجموعات البيانات الكاملة، عقبات كبيرة في ظل وجود قيم مفقودة. تتناول هذه الأطروحة هذه القضية من خلال نهج متعدد الأوجه. الأهداف الأساسية هي كما يلي : أولاً، تطوير منهجية تستخدم الخوارزميات الذكية وتقنيات الحوسبة الناعمة للإحتساب الذكي للقيم المفقودة. ثانيًا، تم تقييم هذه الطريقة على مجموعات البيانات المرجعية، مع دمج القيم المفقودة المقدمة ومقارنة النتائج المحسوبة مع مجموعة البيانات الأصلية. ثالثا : تحليل مقارن للنظام المقترح مع طرق الإسناد القياسية لقياس مدى فعاليته. رابعا، تقييم تأثير الطريقة المقترحة على تجانس البيانات وحالتها الطبيعية بعد الإسناد باستخدام التدابير الإحصائية المعمول بها. وأخيرا، يتم تحديد كفاءة الطريقة المقترحة من خلال قياسات وقت التنفيذ على أحجام مختلفة من البيانات. تم تصميم النظام المقترح لإحتساب القيم العددية والفئوية المفقودة بذكاء، والتي تنشأ إما من فقدانها عشوائيًا أو فقدانها تمامًا بشكل عشوائي. وهي تعمل على افتراض أن ظروف البيئة الخارجية والداخلية أثناء الحصول على البيانات تظل ثابتة. في حالة الانحراف عن الإجراء العادي مما يؤدي إلى فقدان القيم، يستخدم النظام نهجًا مختلطًا يجمع بين تعظيم التوقعات الغامضة للبحث العالمي وأقرب جيران k (kNN) للبحث المحلي لاشتقاق قيم المطابقة Fuzzy K-Top (FKTMs). تخفف هذه العملية من التخمينات المتحيزة من خلال تحديد البيانات القابلة للمقارنة وتوليد تقدير من خلال خوارزمية تعظيم التوقعات الغامضة ونهج التجميع الغامض، متبوعًا بـ kNN للعثور على أقرب قيمة مطابقة. يتم قياس أداء طريقة FKTM المقترحة مقابل مجموعتين من البيانات الطبيعية المتاحة للجمهور، العلاج المناعي والعلاج بالتبريد، باستخدام مصنفات مثل الغابات العشوائية (RF)، والانحدار اللوجستي (LR)، وآلة ناقل الدعم (SVM)، مع تحقيق RF نتائج متفوقة. من خلال تحقيق دقة تبلغ 93.3% في العلاج بالتبريد و85.6% في العلاج المناعي، يتفوق النهج المقترح على طريقة التضمين المعروفة، التضمين متعدد المتغيرات بواسطة المعادلات المتسلسلة (MICE)، باستخدام مصنف SVM. في مجموعة بيانات العلاج المناعي، تتفوق التقنية المقترحة على الفئران بدقة تصل إلى 82.2%. يوضح التحليل المقارن مع خمس تقنيات التضمين في مجموعة بيانات العلاج بالتبريد الأداء المتفوق للتقنية المقترحة. تؤكد الاختبارات الإحصائية (ليفين وشابيرو ويلك) أن الطريقة المقترحة لا تؤثر سلبا على البيانات. علاوة على ذلك، فإن مقاييس الأداء، بما في ذلك وقت التنفيذ وخطأ التضمين، تظهر الكفاءة وتقلل من الأخطاء عبر مجموعات البيانات ذات الأحجام المختلفة.