دراسة تحليلية لخوارزميتي ( MFCCو Endpoint) ومدى تأثيرهما في نسب التعرف على الصوت
الملخص
يشتمل التعرف على الصوت قسمين أساسيين وهما التعرف على الكلام والتعرف على المتكلم، حيث تعد عمليات التعرف هذه من أهم التقنيات الحديثة وقد تم تطوير العديد من الأنظمة التي تختلف بالطرق المستخدمة في استخراج السمات وطرق التصنيف لتدعم أنظمة تعرف من هذا النوع. اشتملت الدراسة في هذا البحث على القسمين السابقين، حيث تم تصميم نظام تعرف على المتكلم وأوامره الصوتية واستخدام عدة خوارزميات متكاملة لإنجاز البحث. قمنا بإجراء دراسة تحليلية لخوارزميةMel Frequency Cepstral Coefficients ((MFCC المستخدمة في استخراج السمات، وتمت دراسة بارامترين خاصين بهذه الخوارزمية هما عدد المرشحات في بنك المرشحات وعدد السمات المأخوذة من كل إطار وعلاقة هذين البارامترين ببعضهما ومدى تأثير قيمتهما على نسب التعرف. وتم استخدام الشبكات العصبية ذات التغذية الأمامية والانتشار الخلفي للخطأ Forwarding back propagation Neural Networks (FFBPNN)Feed كمصنف وحللنا أداء الشبكة للوصول إلى أفضل خصائص ومكونات محققة عملية التعرف. كما تمت دراسة خوارزمية Endpoint المستخدمة لإزالة فترات الصمت وتأثيرها في نسب التعرف على الصوت. Voice recognition includes two basic parts: speech and speaker recognition. These recognition processes consider as the most important processes of modern technologies, many systems has been developed that differ in the methods used to extract features and classification ways to support recognition systems of this type. The study was conducted in this research on the previous subject, where the system is designed to recognize the speaker and his voice orders and focus on several complementary algorithms to carry out the research. we conducted an analytical study on MFCC algorithm used in the extraction of features, and it has been studying two parameters the number of filters in the filters bank and the number of features that taken from each frame and the impact of these two parameters in the recognition rate and the relationship of these two parameters on each other. It was the use of feed forwarding back propagation neural networks performance analysis as characteristics and we analyze the performance of the network to gain access to the best features and components to the process of achieving recognition. And it has been studying Endpoint algorithm that used to remove periods of silence and its impact on voice recognition rates.التنزيلات
منشور
إصدار
القسم
الرخصة
الحقوق الفكرية (c) 2020 مجلة جامعة تشرين للبحوث والدراسات العلمية- سلسلة العلوم الهندسية

هذا العمل مرخص بموجب Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
-
يحتفظ المؤلفون بحقوق النشر ويمنحون حق النشر في المجلة لأول مرة مع نقل الحقوق التجارية إلى مجلة جامعة تشرين للبحوث والدراسات العلمية-سلسلة العلوم الهندسية بموجب الترخيص CC BY-NC-SA 04 الذي يسمح للأخرين بمشاركة العمل مع الإقرار بتأليف العمل والنشر الأولي في هذه المجلة. يمكن للمؤلفين أن يستخدموا نسخة من مقالاتهم في نشاطهم العملي وعلى مواقع علمية خاصة بهم على أن يتم الإشارة إلى مكان النشر مجلة جامعة تشرين للبحوث والدراسات العلمية-سلسلة العلوم الهندسية ويمتلك القراء الحق بنسخ ونقل من المقالات والمزج والإضافة إلى اعمالهم العلمية والاستشهاد مع ذكر مجلة جامعة تشرين للبحوث والدراسات العلمية-سلسلة العلوم الهندسية الناشر .
- المجلة تستخدم ترخيص CC BY-NC-SA مما يعني
- الإسناد - يجب عليك منح الائتمان المناسب ، وتقديم ارتباط إلى الترخيص ، وبيان ما إذا تم إجراء تغييرات.
- يمكنك القيام بذلك بأي طريقة معقولة ، ولكن ليس بأي طريقة توحي بأن المرخص يؤيدك أو يؤيد استخدامك.
- غير تجاري - لا يجوز لك استخدام المواد لأغراض تجارية -
- . ShareAlike إذا قمت بإعادة مزج المواد أو تحويلها أو البناء عليها ، فيجب عليك توزيع مساهماتك بموجب نفس الترخيص مثل الأصل. لا قيود إضافية - لا يجوز لك تطبيق الشروط القانونية أو التدابير التكنولوجية التي تقيد الآخرين قانونًا من فعل أي شيء يسمح به الترخيص
- .