Author: Ziedan, Rania Ramadan Abdeldayem Elsayed./ Title: Dilect and accent recognition in spoken arabic /

Search In this Thesis

العنوان

Dilect and accent recognition in spoken arabic /

المؤلف

Ziedan, Rania Ramadan Abdeldayem Elsayed.

هيئة الاعداد

باحث / رانيا رمضان عبدالدايم السيد زيدان

مشرف / منى فاطمة محمد مرسي أحمد

مشرف / عادل سعيد المغربى

مناقش / عبدالوهاب كامل السماك

مناقش / مايكل ناصيف ميخائيل

الموضوع

Dialect and accent recognition in spoken arabic.

تاريخ النشر

2018.

عدد الصفحات

218 p. :

اللغة

الإنجليزية

الدرجة

الدكتوراه

التخصص

الهندسة الكهربائية والالكترونية

تاريخ الإجازة

1/1/2018

مكان الإجازة

جامعة بنها - كلية الهندسة بشبرا - الهندسة الكهربية

الفهرس

Only 14 pages are availabe for public view

from

218

from

218

Abstract

الكشف عما إذا كان المتكلم يتحدث بلغته ولكنته الأم وتحديدها يعتبر من القضايا الهامة التي تواجه الباحثين في مجال التعرف على الكلام، وتحديد الأصل العرقي للفرد وفي العديد من التطبيقات، مثل خدمة العملاء والتطبيقات الآلية في المخابرات وتطبيقات الذكاء الاصطناعي، وذلك لان الأفراد لديهم أساليب التحدث المختلفة الخاصة بهم وهذا يتوقف على العديد من العوامل، مثل اللكنة واللهجة والخلفية الاجتماعية والاقتصادية التي تؤدى الى اختلاف النغمة والإيقاع بالنسبة لبعض الكلمات أو تؤدى لاختلاف المعنى لنفس الكلمة في اللكنات المختلفة او استخدام كلمات مختلفة خاصة بكل لكنة. ولهذا تشكل هذه الاختلافات صعوبات عند محاولة تصميم أنظمة التعرف على الكلام بلغة معينة لأن من المعروف أن اللغة واللكنة الأم تؤثر سلبا على أداء الكشف على المتكلم والكلام بلكنة مختلفة عن النطق الأصلي للغة بسبب الاختلاف في طريقة النطق عن النطق الأصلي للغة وعادة ما يؤدي ذلك إلى تدهور الأداء للأنظمة الالية للتعرف على الكلام والمتحدث.
في هذه الرسالة، تم تطبيق واختبار أسلوب اللهجة والتعرف على اللهجة، والذي يركز على الكشف عن عرق المتحدث باللغة العربية من خلال الكشف عن المنطقة التي تنتمي إليها المتحدث حسب لهجته. وتعتبر اللغة العربية هي اللغة الرسمية المستخدمة في معظم الدول العربية كما انها تستخدم في أكثر من 22 دولة ولديها عدد كبير من اللهجات المختلفة تمامًا بالإضافة إلى اللغة العربية الرسمية المكتوبة. هذه الرسالة تقدم نظام للتعرف على اللكنات في مدة قصير فقط من ثلاث او سبع ثواني مما يعد تطور ملحوظ في أنظمة التعرف على اللكنات.
يعتمد النظام المقترح في هذه الرسالة على قاعدة بيانات متخصصة تم اعدادها خصيصا للاستخدام في هذه الرسالة وهي تسمى Spoken Arabic Regional Archive (SARA) وهى تحتوي على مقاطع صوتية بالعامية العربية من ثلاث لكنات مختلفة ولهجاتها، وهي اللكنة المصرية ولكنة شبه الجزيرة العربية واللكنة الشامية.
وقد تم اختبار النظام المقترح بتجارب وسيناريوهات مختلفة باستخدام خوارزميات مختلفة لاستخراج خصائص اللكنات وتصنيفها وخوارزميات معالجة وتحديد دقة النتائج، أشارت النتائج التي تم التوصل إليها الى تحسين معدلات التعرف على اللكنة واللهجة مقارنة بالأبحاث المنشورة للغة العربية، كما أن هذه النتائج تؤكد صحة أن قاعدة البيانات اتى تم اعدادها ”SARA” يمكن أن تتنافس كمجموعة بيانات عربية.
الوصف العام للرسالة:
الرسالة المقدمة مكتوبة باللغة الإنجليزية وتشتمل على صفحة للشكر، فهرس المحتويات، قائمة بالأشكال، قائمة بالجداول، وقائمة بالاختصارات، ملخص للرسالة، كما تتضمن قائمة وافية بالكتب والأبحــاث والمقالات العلمية المرتبطة بموضوع البحث والتي اعتمدت عليها الباحثة في إعـــداد بحثها. وفيمــا يلي عـرض موجـز لأهم ما تضمنـتــه أبواب الرسالة:
• الفصل الأول
يعرض مقدمة عن البحث كما يتم استعراض الأهداف الرئيسية للبحث كما يتطرق الي المشاكل التي تواجه عملية التعرف الألى على اللكنات عامة والتعرف على لكنة المتحدث باللغة العربية خاصة، ويحتوي أيضا على عرض لفصول الرسالة.
• الفصل الثاني
يستعرض المفاهيم الرئيسية المستخدمة في الرســالة والتي تشمل بعض الخوارزميات الخاصة بالتعامل مع الصوت واستخراج الخصائص المميزة للأصوات وتصنيفها كما يحتوي على بعض خوارزميات تقييم نظام التعرف على اللكنات
• الفصل الثالث
يستعرض هذا الفصل شرحا للأبحاث السابقة للتعرف على اللكنات الخاصة باللغة الإنجليزية والعربية بالإضافة لبعض اللغات الأخرى، وذلك بعرض الخوارزميات المستخدمة في كل بحث لتحليل الأصوات واستخراج خصائصها والخوارزميات الخاصة بالتصنيف والنتائج المنشورة في كل بحث.
• الفصل الرابع
يحتوي الفصل الرابع على دراسة تفصيلية لقواعد البيانات المنشورة الخاصة باللغة العربية ولكناتها، كما يحتوي على وصف تفصيلي لقاعدة البيانات المستخدمة في البحث والتي تم إعدادها كجزء من برنامج البحث وتسمى Spoken Arabic Regional Archive (SARA) وتحتوى على اللكنة المصرية وبعض لهجاتها واللكنة الشامية وبعض لهجاتها بالإضافة الى لكنة شبه الجزيرة العربية وبعض لهجاتها.
• الفصل الخامس
يقدم هذا الباب النظام المقترح للتعرف على لكنات اللغة العربية كما يحتوي على بعض السيناريوهات لتحسين دقة النتائج كاعتماد النظام على تحديد جنس المتحدث. كما يحتوي أيضا على استخدام خوارزميات الدمج لتحسين النتائج.
• الفصل السادس
يستعرض هذا الفصل مجموعة من التجارب المستخدمة لتطبيق النظام المقترح باستخدام الخوارزميات المختلفة في تحليل الأصوات واستخراج الخصائص المميزة لكل لكنة وتصنيفها والنتائج التي تم الوصول إليها في جميع الحالات مع شرح للنتائج باستخدام الخوارزميات المختلفة في تقييم دقة النظام.
• الفصل السابع
يعرض أهم الاستنتاجات التي تم التوصل إليها ويقترح بعض الاتجاهات المستقبلية في هذا المجال.