اختبار وتقييم العوامل المؤثرة في أنظمة التعرف السمعية لكلمات معزولة في اللغة العربية
الملخص
تعد تقنيات التعرف على الكلام من أهم التقنيات الحديثة، وقد تم تطوير العديد من الأنظمة المختلفة من حيث الطرائق المستخدمة في استخراج السمات وطرائق التصنيف، لكن مهما كانت الخوارزمية المستخدمة أو طريقة التصنيف فإن في تكنولوجيا معالجة الكلام للتطبيقات الحقيقية يمكن للعديد من الحقائق أن تشوه أو تتلف الكلام، مما يجعل الكلام لا يبدو بالطريقة التي تم تسجيله فيها. يقترح البحث إنشاء نظام للتعرف على الكلمات المعزولة بالاعتماد على السمات السمعية المستخرجة من فيديوهات منطوقة لكلمات باللغة العربية، ومن ثم إضافة مكون الطاقة والمشتقات التفاضلية وتحديد عدد قنوات المرشح الأمثلي في مرحلة استخراج السمات لخوارزمية معاملات تردد ميل لزيادة نسبة التعرف. تم استخدام نماذج ماركوف المخفية في مرحلة التصنيف وتحديد عدد الحالات الأمثلي في المصنف. تم اختبار النظام على 4155 عينة، فبينت النتائج أن السمات المضافة إلى الخوارزمية والاختبارات التجريبية على عدد قنوات المرشح وعدد حالات المصنف مما رفع أداء الخوارزمية وبالتالي معدل التعرف الذي وصل إلى 92%. ومن أجل أغراض الاختبار والتقييم في أنظمة التعرف على الكلام تم إدخال ضجيج مفتعل ومراقبة تأثيره على نسب التعرف، لذلك قام البحث بتطبيق هذه الطريقة لأول مرة على قاعدة بيانات منطوقة باللغة العربية. ولتقليل من أثره تم تطبيق إحدى طرق تقدير إشارة الضجيج – في بحثنا قمنا بتطبيق الطريقة الأكثر تطبيقا" بالنسبة لقواعد البيانات في اللغات الأخرى وهي الطرح الطيفي - لتقدير إشارة الضجيج وطرحها من الاشارة المشوبة وذلك ليكون مدخلا" للحد من أثر الضجيج. هذا التقدير قدم تحسين منخفض عندما طبق على ملفات SNR المنخفضة وحسن النتائج مع ملفات SNR العالية فقط. لكن نتج عن الطرح الطيفي ضجيج موسيقي حيث تمت مراقبته برفع عتبة التوهين لتلائم الكلمات المنطوقة باللغة العربية . The speech recognition is one of the most important techniques of modern techniques, there has been many different systems developed in terms of the methods used in the features extraction and classification methods, But whatever the algorithm used, or the method of classification in speech processing technology in real applications can be for many of the facts that the deformation or damage of speech, making speech does not seem the way you recorded it. This study proposes design a system to identify isolated words depending on the audio features extracted from videos to the words in Arabic Language and then the energy and Temporal derivative components is added, the optimal number of channels in the filterbank determined in extracting features of the method Mel Frequency Cepstral Coefficient (MFCC) stage, it was used hidden Markov models HMM as classification and determine the optimal number of cases in classifier . The system was tested on 4155 samples. The results showed that the added features of the algorithm and experimental tests on the number of channel of filter bank and the number of cases in classifier, raising the performance of the algorithm and thus identify which reached 92% rate. And for testing and evaluation purposes in the speech recognition systems have been introduced artificially noise and monitor its impact on the recognition ratios, so the research application of this method for the first time on the data base pronunciations in Arabic. To minimize the effect of the noise signal we have to applied method of estimating - in our research we have implemented the most way application "For databases in other languages, a Spectral subtraction - to estimate the noise signal and subtracted from the reference vestiges so as to have access" to reduce the impact of noise. This estimate gave a low improve when applied to low SNR and good results with only a high SNR files. But the resulting spectral subtraction musical noise, where it was monitored to raise the threshold of attenuation to match spoken words in Arabicالتنزيلات
منشور
إصدار
القسم
الرخصة
الحقوق الفكرية (c) 2020 مجلة جامعة تشرين للبحوث والدراسات العلمية- سلسلة العلوم الهندسية

هذا العمل مرخص بموجب Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
-
يحتفظ المؤلفون بحقوق النشر ويمنحون حق النشر في المجلة لأول مرة مع نقل الحقوق التجارية إلى مجلة جامعة تشرين للبحوث والدراسات العلمية-سلسلة العلوم الهندسية بموجب الترخيص CC BY-NC-SA 04 الذي يسمح للأخرين بمشاركة العمل مع الإقرار بتأليف العمل والنشر الأولي في هذه المجلة. يمكن للمؤلفين أن يستخدموا نسخة من مقالاتهم في نشاطهم العملي وعلى مواقع علمية خاصة بهم على أن يتم الإشارة إلى مكان النشر مجلة جامعة تشرين للبحوث والدراسات العلمية-سلسلة العلوم الهندسية ويمتلك القراء الحق بنسخ ونقل من المقالات والمزج والإضافة إلى اعمالهم العلمية والاستشهاد مع ذكر مجلة جامعة تشرين للبحوث والدراسات العلمية-سلسلة العلوم الهندسية الناشر .
- المجلة تستخدم ترخيص CC BY-NC-SA مما يعني
- الإسناد - يجب عليك منح الائتمان المناسب ، وتقديم ارتباط إلى الترخيص ، وبيان ما إذا تم إجراء تغييرات.
- يمكنك القيام بذلك بأي طريقة معقولة ، ولكن ليس بأي طريقة توحي بأن المرخص يؤيدك أو يؤيد استخدامك.
- غير تجاري - لا يجوز لك استخدام المواد لأغراض تجارية -
- . ShareAlike إذا قمت بإعادة مزج المواد أو تحويلها أو البناء عليها ، فيجب عليك توزيع مساهماتك بموجب نفس الترخيص مثل الأصل. لا قيود إضافية - لا يجوز لك تطبيق الشروط القانونية أو التدابير التكنولوجية التي تقيد الآخرين قانونًا من فعل أي شيء يسمح به الترخيص
- .