دانلود متن کامل کارشناسی ارشد مهندسی برق گرایش الکترونیک

برای رعایت حریم خصوصی نام نگارنده درج نمی شود

پایان نامه دوره کارشناسی ارشد در رشته برق- الکترونیک

موضوع:

غنی سازی سیگنال گفتار مبتنی بر روش تفریق طیفی و تجزیه مقادیر منفرد

استاد راهنما:

دکتر محمدرضا کرمی

اساتید مشاور:

دکتر رضا قادری

دكتر حسین میارنعیمی

تکه هایی از متن به عنوان نمونه :

چكیده
در این پایان‌نامه ابتدا به بررسی خلاصه ای از چگونگی تولید گفتار در انسان پرداخته و سپس به بررسی اجمالی روش های عمده بهسازی گفتار و مسائل و مباحث موجود در این روش ها پرداخته شده است. در بررسی این روش ها سعی شده است تا ضمن بیان اصول و مبانی هر روش، نقاط ضعف و قوت آنها را ذکر شود. سپس در فصل دوم، روش مشهور تفریق طیفی معرفی و بررسی شده است. در این فصل همچنین به روش های بهینه شده تفریق طیفی مثل تفریق طیفی تعمیم یافته، اصلاح مقادیر منفی، تفریق طیفی چند بانده و … پرداخته شده است. در روش های مبتنی بر تفریق طیفی، روش پایه تفریق طیفی، تفریق طیفی تعمیم یافته، تفریق طیفی چند باند، پیاده­سازی و تحلیل و ارزیابی شدند. از مشكلات عمده در روش های مبتنی بر تفریق طیفی تولید نویز موزیكال می باشد كه تلاش شد تا میزان تولید نویز موزیكال در روش بهبودیافته تفریق طیفی چند باند، كاهش یابد.
در فصل سوم به معرفی تجزیه مقادیر منفرد پرداخته می شود و توضیح کاملی در زمینه ریاضیات تجزیه مقادیر منفرد و خواص و قضایای مربوط به این تجزیه آورده شده است. همچنین روش های بدست آوردن مقادیر منفرد و بردارهای ویژه در این فصل توضیح داده شده است. سپس مروری بر کاربردهای این تجزیه به خصوص در پردازش سیگنال آورده شده است. در انتهای فصل نیز روش های تشخیص نواحی سكوت یا الگوریتم های VAD بیان شده است.
در فصل چهارم، روش های پیشنهادی بهسازی گفتار بر اساس روش تفریق طیفی و تجزیه مقادیر منفرد ارائه شده اند. در این فصل ابتدا طریقه محاسبه نویز تخمینی با بهره گرفتن از تجزیه مقادیر منفرد توضیح داده شده است و سپس روش بهینه کردن نویز تخمینی با بهره گرفتن از الگوریتم های VAD و آشکار ساز حروف بی صدا و صدا دار بیان شده است. در تمامی روش های پیشنهادی حذف نویز مبتنی بر تفریق طیفی از تجزیه مقادیر منفرد به منظور تخمین نویز استفاده شده است. در روش های پیشنهادی سعی بر آن بوده است که حالت بهینه را با تغییر پارامتر ها بدست آوریم. در فصل پنجم نتایج حاصله از شبیه سازی روش های پیشنهادی آورده شده و با کارهای قبلی مقایسه و ارزیابی می شوند. در پایان، در فصل ششم به جمع بندی مطالب و موضوعات مورد بحث پرداخته شده است.

واژه های کلیدی:
غنی سازی سیگنال گفتار، تفریق طیفی، تجزیه مقادیر منفرد، آشکار ساز گفتار ، تبدیل موجک، طیف نگاره (اسپکتروگرام)، تست شنوائی.

فهرست مطالب

عنوان    صفحه
مقدمه    1
فصل اول- مروری بر روش های عمده بهسازی گفتار
1-1-    مبانی تولید سیگنال گفتار……………………………………………………………………………..    3
1-2-    مفاهیم بهسازی گفتار…………………………………………………………………………………..    7
1-3-    کاربردهای عمده بهسازی گفتار…………………………………………………………………….    8
1-4-    طبقه بندی روش های بهسازی گفتار……………………………………………………………..    9
1-4-1-   کاهش نویز با بهره گرفتن از خاصیت تناوبی گفتار……………………………………………..    11
1-4-2-   بهسازی گفتار بر اساس مدل………………………… ………………………………………….    12
1-4-3-   تکنیک های مبتنی بر دامنه طیفی زمان-کوتاه……………………………………………….    13
1-4-4-   روش های مبتنی بر آستانه گذاری روی ضرایب موجک……………………………….    15
1-4-5-   حذف وفقی نویز……………………………………………………………………………………..    16

فصل دوم- مروری بر روش های تفریق طیفی
2-1-    تفریق طیفی……………………………………………………………………………………………….    19
تعمیم روش های تفریق طیفی………………………………………………………………………    21
مقادیر طیفی منفی……………………………………………………………………………………….    23
اطلاحات روی تفریق طیفی………………………………………………………………………….    24
2-4-1-    متوسط گیری اندازه…………………………………………………………………………………    24
2-4-2-    تعمیم تفریق طیفی…………………………………………………………………………………..    25
2-4-3-    تفریق طیفی با بهره گرفتن از كف طیفی و تفریق بیش از حد……………………………..    25
2-4-4-    تفریق طیفی با تخمین گر MMSE STSA………………………………………………….    27
2-4-5-    تفریق طیفی بر مبنای ویژگی های ادراكی…………………………………………………..    28
2-4-6-    روش های تفریق طیفی وابسته به فركانس………………………………………………….    29
2-4-7-    تفریق طیفی چند باند………………………………………………………………………………    30
2-4-7-1-    پیش پردازش……………………………………………………………………………………..    32
2-4-7-2-    شرح تفریق طیفی چند باند…………………………………………………………………..    34

فصل سوم- آشنائی با تجزیه مقادیر منفرد و الگوریتم های VAD
3-1-    تجزیه مقادیر منفرد……………………………………………………………………………………..    38
رابطه بین تجزیه مقادیر منفرد و تجزیه مقادیر ویژه………………………………………….    39
مقادیر ویژه و بردارهای ویژه………………………………………………………………………..    40
3-3-1-    روش یافتن مقادیر ویژه……………………………………………. ……………………………    40
3-3-2-    مقادیر ویژه مختلط………………………………………………………………………………….    42
3-3-3-    مقادیر ویژه ماتریس های مثلثی و قطری…………………………………………………….    43
3-3-4-    مقادیر ویژه ماتریس های هم خانواده با A ………………………………………………..    44
3-3-5-    رابطه بین مقادیر ویژه ماتریس های AB و BA…………………………………………    45
3-3-6-    تعیین چند جمله ای مشخصه یک ماتریس…………………………………………………    47
3-3-6-1-    روش کریلف    …………………………………………………………………………………    47
3-3-6-2-    روش لورییر……………………………………………………………………………………….    49
3-3-6-3-    روش ضرایب نامعین…………………………………………………………………………..    50
3-3-7-    روش های تبدیلی در یافتن مقادیر ویژه……………………………………………………..    52
3-3-7-1-    روش ژاکوبی……………………………………………………………………………………..    52
3-3-7-2-    روش گیونز………………………………………………………………………………………..    54
3-3-7-3-    روش هاوس هلدر………………………………………………………………………………    55
3-3-8-    روش های مبتنی بر تجزیه ماتریس برای یافتن مقادیر ویژه…………………………..    57
3-3-8-1-    روش LR برای یافتن مقادیر ویژه………………………………………………………..    57
3-3-8-2-    روش QR برای یافتن مقادیر ویژه………………………………………………………..    60
کاربرد های تجزیه مقادیر منفرد…………………………………………………………………….    62
3-4-1-    کاربرد تجزیه مقادیر منفرد در پردازش سیگنال……………………………………………    63
الگوریتم های تشخیص نواحی سكوت و صدادار و بی صدا…………………………….    64
3-5-1-    تشخیص قسمت های سكوت با بهره گرفتن از قدرمطلق اندازه…………………………..    65
3-5-2-    روش نرخ عبور از صفر…………………………………………………………………………..    66
3-5-3-    روش های حوزه ی فرکانس…………………………………………………………………….    67
3-5-4-    روش کدینگ پیشگویی خطی(LPC)………………………………………………………..    68
3-5-5-    استفاده از تبدیل بسته موجك باز در تشخیص فریم های سكوت………………….    70

فصل چهارم- استفاده از تجزیه مقادیر منفرد در روش تفریق طیفی
4-1-    استفاده از تجزیه مقادیر منفرد در روش تفریق طیفی (روش SVSS)………………..    74
4-1-1-    قسمت تخمین نویز…………………………………………………………………………………    75
4-1-2-    فیلتر کردن مقادیر منفرد……………………………………………………………………………    76
4-1-2-1-    تعیین آستانه در فریم سکوت………………………………………………………………..     80
4-1-2-2-    تعیین آستانه در فریم بی صدا و صدا دار………………………………………………..     80
4-1-3-    قسمت تفریق طیفی…………………………………………………………………………………    85
تفریق طیفی با بهره گرفتن از SVD و الگوریتم های VADو V/UV detector…..    85
تفریق طیفی چند بانده با بهره گرفتن از SVD و الگوریتم هایVADوV/UV detector (SVMBSS)……………………………………………………………………………………    86

فصل پنجم- نتایج پیاده سازی و ارزیابی
5-1-    معیار های سنجش………………………………………………………………………………………    89
5-1-1-    نسبت سیگنال به نویز………………………………………………………………………………    89
5-1-2-    اسپكتروگرام (طیف نگاره)……………………………………………………………………….    89
5-1-2-1-    طراحی اسپكتروگرام……………………………………………………………………………     92
5-1-2-2-    نحوه توزیع مقادیر در اسپكتروگرام……………………………………………………….     95
5-1-3-    تست شنوائی………………………………………………………………………………………….    97
بررسی و مقایسه نتایج حاصله………………………………………………………………………    97
5-2-1-    تست شنوائی………………………………………………………………………………………….    104

فصل ششم- جمع­بندی و نتیجه­گیری
6-1-    جمع­بندی و نتیجه­گیری ……………………………………………………………………………..    108

فهرست جداول

عنوان    صفحه
جدول 1-1- تکنیک های مختلف غنی سازی گفتار……………………………………………………………    10
جدول 4-1- مقادیر بهینه درصد انرژی  ………………………………………………………………………..    83
جدول 5-1- نتایج غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط روش های PSS، ‍SVPSS، MBSS  وSVMBSS …………………………………………………………………………..
103
جدول 5-2- نمره کیفیت شنیدن نویز……………………………………………………………………………….    105
جدول 5-3- نتایج تست شنوائی غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………..
107

فهرست اشکال

عنوان    صفحه
شکل 1-1- برش عرضی سیستم صوتی انسان……………………………………………………………………    4
شکل 1-2- مدل زمان گسسته عمومی برای تولید سیگنال گفتار…………………………………………..    5
شکل 1-3- حرف بی صدا s……………………………………………………………………………………………    6
شکل 1-4- حروف صدادار e………………………………………………………………………………………….    6
شکل 1-5- تبدیل فوریه حرف بی صدای s………………………………………………………………………    6
شکل 1-6- تبدیل فوریه حرف صدا دار e…………………………………………………………………………    7
شکل 1-7- بلوك دیاگرام یک سیستم بهسازی مبتنی بر خاصیت تناوبی گفتار………………………..    11
شکل 1-8- بلوك دیاگرام یک سیستم غنی ساز مبتنی بر دامنه طیفی زمان – کوتاه…………………..    13
شکل 1-9- بلوك دیاگرام الگوریتم حذف نویز در حوزه موجک………………………………………….    15
شکل 1-10- دیاگرام کلی سیستم حذف کننده وفقی نویز……………………………………………………    17
شکل 2-1- بلوك دیاگرام تفریق طیفی توان (PSS)……………………………………………………………    23
شکل 2-2- بلوك دیاگرام تفریق طیفی تعمیم یافته (GSS)………………………………………………….    23
شکل 2-3- نمودار تعیین   از روی SNR (با فرض  )…………………………………………    26
شکل 2-4- SNR های مقطعی برای 4 باند فركانسی گفتار نویزی………………………………………..    32
شکل 3-1- نمودار اندازه یك سیگنال صوتی بر حسب زمان……………………………………………….    66
شکل 3-2- بلوك دیاگرام آنالیز كپسترال……………………………………………………………………………    68
شکل 3-3- میزان خطای خروجی فیلتر معكوسLPC  به ازای حروف صدا دار و بی صدا……..    69
شکل 3-4- مرز تصمیم برای جداسازی قسمت های صدادار سیگنال……………………………………    72
شکل 4-1- بلوك دیاگرام کلی روش ارائه شده  SVD-Spectral Subtraction (SVSS)…….    75
شکل 4-2- فریم بی صدا در حوزه زمان……………………………………………………………………………    77
شکل 4-3- فریم صدا دار در حوزه زمان…………………………………………………………………………..    78
شکل 4-4- خود همبستگی در فریم سکوت آغشته به  نویز………………………………………………..    78
شکل 4-5- خود همبستگی در فریم بی صدا……………………………………………………………………..    79
شکل 4-6- خود همبستگی در فریم صدا دار…………………………………………………………………….    79
شکل 4-7- مقایسه مقادیر منفرد فریم های بی صدا و صدا دار ……………………………………………    79
شکل 4-8- مقادیر منفرد فریم سكوت نویزی…………………………………………………………………….    81
شکل 4-9- مقادیر منفرد فریم صدا دار  (الف) تمیز   (ب) نویزی با  SNR=10 db……………..    82
شکل 4-10- مقادیر منفرد فریم بی صدا  (الف) تمیز   (ب) نویزی با SNR=10 db……………..    82
شکل 4-11- بلوك دیاگرام روش بدست آوردن مقادیر بهینه آستانه………………………………………    83
شکل 5-1- هیستوگرام مقادیر فرکانسی…………………………………………………………………………….    96
شکل 5-2- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت حالت گذرا……    99
شکل 5-3- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت طیف نگاره……    100
شکل 5-4- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت حالت گذرا……    101
شکل 5-5- نتایج غنی سازی سیگنال گفتار آغشته به نویز سفید گوسی بصورت طیف نگاره……    102
شکل 5-6- متوسط غنی سازی ده سیگنال گفتار مختلف آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………………..
104
شکل 5-7- نتایج تست شنوائی غنی سازی سیگنال گفتار آلوده به نویز سفید گوسی توسط چهار روش PSS، ‍SVPSS، MBSS  وSVMBSS…………………………………………………………..
106

مقدمه:
با رشد روز افزون استفاده از سیستم های گفتاری در كاربردهای عملی روزمره، نیاز به حفظ كیفیت گفتار به عنوان امری اجتناب ناپذیر مطرح شده است. شرایط ایده آل و عاری از نویز كه در كارها و شبیه سازی های آزمایشگاهی در نظر گرفته می شود، در بسیاری از كاربردهای واقعی به طور جدی نقض گردیده و برقراری آنها زیر سئوال رفته است. به عنوان مثال استفاده از تلفن همراه، سمعك، سیستم بازشناسی گفتار و یا هر وسیله ارتباط گفتاری در یك محیط نویزی ، همگی از مواردی است كه در آن حفظ كیفیت گفتار و بالا نگه داشتن کارایی سیستم، از اهمیت خاصی برخوردار است. بدون استفاده از روش های بهسازی گفتار، عملکرد این سیستم ها به شدت تنزل یافته و چه بسا كه غیر قابل قبول می شود. از این رو، مبحث بهسازی گفتار به عنوان یكی از ضرورت های كاربردی و عملی، از زمینه های فعال تحقیقاتی در سال های اخیر بوده است.

فرضیات پایان نامه:
كلیه روش های شرح داده شده در پایان‌نامه و نیز كلیه روابط حاكم بر آنها، برمبنای سه فرض اساسی ذیل استوار می‌باشند.
–    نویز به سیگنال اضافه می شود.
–    فقط یک کانال در دسترس است.
–    سیگنال گفتار و نویز ناهمبسته هستند.
به این ترتیب آغشتگی سیگنال گفتار به نویز را می توان به شکل زیر مدل کرد:

كه s(n) بیانگر سیگنال اصلی و تمیز صوت ، d(n) نویز آلوده كننده و G ضریب كنترل كننده انرژی نویز (و لذا کنترل کننده SNR) است. در این پایان‌نامه، این ضریب با   ادغام شده و یك سیگنال نویزی بصورت ذیل نمایش داده شده است:

فصل اول
مروری بر روش های عمده بهسازی گفتار

در این فصل ابتدا به بررسی خلاصه ای از چگونگی تولید گفتار در انسان پرداخته و سپس به بررسی اجمالی روش های عمده بهسازی گفتار و مسائل و مباحث موجود در این روش ها می پردازیم. در بررسی این روش ها سعی شده است تا ضمن بیان اصول و مبانی هر روش، نقاط ضعف و قوت آنها را ذکر کنیم.

1-1- مبانی تولید سیگنال گفتار
سیگنال گفتار جهت برقراری ارتباط بین گوینده و شنونده مورد استفاده قرار می گیرد. گوینده ازطریق یکسری فرآیندهای عصبی و حرکات ماهیچه ای موج سیگنال گفتار را تولید می کند و شنونده از طریق سیستم  شنیداری آن را دریافت کرده و سپس از پردازش آن را به سیگنال های عصبی بر می گرداند شکل (1-1) برش عرضی از سیستم تولید سیگنال گفتار را نشان می دهد. همانطورکه در شکل دیده می شود اجزای اصلی سیستم شامل شش ها، نای ( لوله هوا)، حنجره (که رکن اصلی در تولید صوت است.)، حفره حلقی (گلو)، حفره دهانی (دهان) و حفره دماغی (بینی) می باشد.

ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل و با فرمت ورد موجود است

متن کامل را می توانید دانلود نمائید

چون فقط تکه هایی از متن پایان نامه در این صفحه درج شده (به طور نمونه)

ولی در فایل دانلودی متن کامل پایان نامه

 با فرمت ورد word که قابل ویرایش و کپی کردن می باشند

موجود است

تعداد صفحه :165

قیمت : 14700 تومان

—-

پشتیبانی سایت :       (فقط پیامک)       serderehi@gmail.com

در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.

  *

 

 


3 دیدگاه

دیدگاه‌ها بسته است.