دانشگاه شیراز
دانشـكده مهندسـی
پایاننامه كارشناسی ارشد در رشته مهندسی کامپیوتر (هوش مصنوعی)
ارائه یک مدل جدید یادگیری به منظور آموزش طبقهبندیکنندههای سریال
استاد راهنما:
دکتر رضا بوستانی
بهمن 1392
(در فایل دانلودی نام نویسنده موجود است)
تکه هایی از متن پایان نامه به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)
چکیده
امروزه ایجاد و آموزش بهینه دستهبندیکننده های مستحکم و سریع به یکی از مهمترین دغدغههای علم هوش مصنوعی و به ویژه حوزه یادگیری ماشین بدل شده است. با رشد روز افزون در حجم و سرعت تولید داده، نیاز به تولید دستهبندیکنندههای دقیق و سریع بیش از پیش حس می شود و در واقع یک چالش محسوب می شود. روشهای یادگیری جمعی طی سالیان اخیر اثبات کردهاند که برای رفع مشکلات یاد شده گزینههای مناسبی هستند.
روشهای یادگیری جمعی، گروهی از مدل های ضعیف را تولید میکنند که با تلفیق مناسب و هوشمندانه خروجی آنها می توان به یک دستهبندیکننده قوی دست یافت. این روشها زمانی که از الگوریتمهای تقویتی در ساختار سریال بهره میبرند، کارایی به مراتب بالاتری از خود نشان میدهند.
استفاده از شیوه تقسیم-و-تسخیر یا همان separate-and-conquer در زمان آموزش هر لایه از ساختار سریال، دلیل قدرت یادگیرهای جمعی سریال میباشد؛ علاوه بر آن، تعیین مرزهای تصمیم موارد جزیی در دورهای نخست ساختار سریال انجام میشود و در دورهای آتی این مرز پالایش شده و موارد سختتر را در بر خواهد گرفت. عملکرد مدل کلاسیک ساختار سریال، در مواجهه با مسائل دوکلاسه، به این صورت است که نمونههای غیر هدف که در لایههای اولیه یاد گرفته میشوند از سیستم حذف شده و با نمونههای سختتر جایگزین میشوند؛ که میتوان از این استراتژی با نام bootstrapping یاد کرد. با این روند، یادگیری بهینه کلان-به-جزیی یا همان learning coarse-to-fine حاصل میشود.
در این مطالعه، یک مدل نوین برای آموزش طبقهبندیکنندههای سریال ارائه شده است که از روش وارسی اعتبار در ساختار آن استفاده شده است. در روش پیشنهادی، درصدی از دادههای درست دستهبندیشده در لایه نخست ساختار به منظور حفظ عمومیت سیستم، برای آموزش به لایه بعدی فرستاده میشود و این روند برای لایههای بعدی ادامه خواهد یافت. بدین ترتیب، مدل ارائه شده در مقابل دادههای نویزی بسیار مقاوم بوده و انحراف معیار نرخ خطای آزمایش آن، از روشهای رقیب کمتر میشود.
واژه های کلیدی: یادگیری ماشین، الگوریتمهای یادگیری جمعی، coarse-to-fine learning، یادگیرهای جمعی سریال، separate-and-conquer
فهرست مطالب
عنوان صفحه
1-3. الگوریتمهای یادگیری جمعی.. 3
1-4. دسته بندی کننده های سریال.. 4
1-6. نگاهی کلی به فصول رساله. 6
روشهای Boosting چندکلاسه.. 18
2-4-1. دستهبندیکنندهی سریال.. 24
دستهبندیکنندههای سریال همزمان… 28
3-2. روش LogitBoost سریال تودرتو. 34
3-3. ساختار سریال پایش دادهها به کمک الگوریتم – نزدیکترینهمسایه. 39
4-2. دستهبندیکنندههای مورد استفاده برای مقایسه. 43
4-2-1. دلایل انتخاب روشهای رقیب… 43
4-2-2. جزییات پیادهسازی روشهای رقیب… 44
4-4. مجموعه دادههای بهکار رفته در آزمایشها 48
مجموعه دادههای مربوط به مسائل چندکلاسه.. 48
مجموعه دادههای مربوط به مسائل دوکلاسه.. 49
5-2. نتایج حاصل از آزمایش هفت ترکیب مختلف از پارامترها برای روش پیشنهادی اول.. 54
5-2-1. تحلیل نتایج حاصل از آزمایش هفت ترکیب مختلف از پارامترها برای روش پیشنهادی اول.. 56
5-3. نتایج حاصل از آزمایش روش پیشنهادی اول و روشهای رقیب… 58
5-4. نتایج حاصل از آزمایش روش پیشنهادی دوم. 61
واژه نامه فارسی به انگلیسی… 68
واژه نامه انگلیسی به فارسی… 72
فهرست جداول
عنوان صفحه
جدول 2-1.مثال از یک ماتریس کد گذاری به روش ECOC برای یک مساله چهار کلاسه 17
جدول 4-1. جزییات مجموعه دادههای چندکلاسه.. 49
جدول 4-2. جزییات مجموعه دادههای دوکلاسه.. 50
جدول 5-1. مشخصات مجموعه دادههای استفاده شده برای بررسی تاثیر پارامترها در روش پیشنهادی اول……. 55
جدول 5-2.مقادیر آزمایشی ترکیبات مختلف پارامترها برای روش پیشنهادی اول 55
جدول 5-4.میانگین رتبه بندی برای 7 ترکیب پارامتری مقایسه شده بر 11 مجموعه داده چندکلاسه………. 58
جدول 5-7.میانگین رتبه بندی برای 5 روش مقایسه شده بر 11 مجموعه داده چندکلاسه 60
جدول 5-10.میانگین رتبه بندی برای 4 روش بر روی 12 مجموعه داده دوکلاسه 62
فهرست الگوریتمها
عنوان صفحه
الگوریتم 1……… شبه کد مربوط به روش AdaBoost. 14
الگوریتم 2……… شبه کد مربوط به روش AdaBoost.M2. 19
الگوریتم 3……… شبه کد مربوط به روش AdaBoost.OC. 21
الگوریتم 4……… شبه کد مربوط به روش AdaBoost.ECC. 23
الگوریتم 5……… ساختار سریال Viola-Jones. 25
الگوریتم 6……… شبه کد مربوط به فاز آموزش ساختار سریال پیشنهادی اول 38
الگوریتم 7……… شبهکد مربوط به الگوریتم LogitBoost برای مسائل چندکلاسه 46
فهرست شکل ها
عنوان صفحه
شکل 2-1. ساختار سریال Viola-Jones [42] 26
شکل 2-2. ساختار دستهبندیکننده سریال همزمان.. 29
شکل 2-3. ساختار درختی ارائه شده توسط لینهارت… 31
شکل 3-1. ساختار کلی روش دستهبندی سریال پیشنهادی اول.. 35
شکل 3-2. مکانیزم انتقال داده از یک لایه به لایه بعدی در روش پیشنهادی اول.. 37
شکل 3-3. ساختار سریال پیشنهادی دوم.. 40
امروزه شاهد رشد عظیمی در تولید داده هستیم. فعالیتها و تعاملهای روزانه انسانها، حجم چشمگیری از دادهها و اطلاعات را به وجود میآورد؛ به عنوان مثال در ارتباطات از راه دور، تراکنش هایمالی و بانکی، شبکههای اجتماعی، فعالیتهای اینترنتی عام، امور مربوط به بهداشت و درمان، پایش اطلاعات امنیتی، اطلاعات و دادههای آماری مانند سرشماری نفوس و بسیاری موارد دیگر [1,2]. با پیشرفت چشمگیر تجهیزات سخت افزاری، هزینه ذخیره داده کم شده است؛ این در حالی است که آنالیز صحیح و استخراج اطلاعات مفید از این حجم از داده به یک دغدغه تبدیل شده است. هوش مصنوعی[1] و به ویژه حوزه یادگیری ماشین[2]، به دنبال یافتن روشها و ابزارهای موثر جهت رفع این مشکل می باشد.
اصلیترین زمینه تحقیقاتی در حوزه یادگیری ماشین، شناسایی الگو[3] است؛ یعنی استخراج اطلاعات و الگوهای تکرار شونده از داده ورودی[4]، که این اطلاعات برای انجام تصمیمگیری در مورد دادههای نادیده[5] کاربرد دارد.
بر اساس نوع پیش بینی دادههای نادیده، انواع روشهای شناسایی الگو را می توان به دو گروه کلی روشهای مبتنی بر دستهبندی[6] و روشهای مبتنی بر رگرسیون[7] تقسیمبندی کرد. سیستمهای مبتنی بر دستهبندی، سعی در ساختن مدلی دارند که خروجی آن گسسته[8] میباشد و این خروجی در واقع برچسب کلاسی[9] است که سیستم برای یک نمونه خاص پیشنهاد میدهد؛ در مقابل، سیستمهای مبتنی بر رگرسیون، تابعی پیوسته[10] را مدل میکنند و خروجی آنها به صورت عددی[11] میباشد.
یادگیری ماشین را میتوان به چهار دسته کلی یادگیری با نظارت[12] و یادگیری بدون نظارت[13]، یادگیری نیمه نظارتی[14] و یادگیری فعال[15] تقسیمبندی کرد. در یادگیری با نظارت، سیستم با دادههای آموزشی که دارای برچسبهای کلاس معین هستند آموزش داده میشود. این گروه از الگوریتمها که بسیار رایج نیز میباشند، سعی در ساخت مدلی دارند که به بهترین نحو دادههای آموزشی را به برچسب کلاس داده شدهی آنها مرتبط سازند. مدل ساخته شده بر این اساس، در مرحله آزمایش[16] سعی در پیش بینی برچسب کلاس دادههای آزمایشی خواهد کرد. در مقابل این گروه از الگوریتم ها، الگوریتم های مبتنی بر یادگیری بدون نظارت، بدون دریافت برچسب کلاس دادههای آموزشی، سعی در دستهبندی دادههای آموزشی میکنند؛ به این نوع از یادگیری، خوشهبندی[17] نیز گفته میشود. گاهی تنها بخشی از برچسب کلاس دادههای آموزشی در دسترس است بنابر این دسته سوم از الگوریتمها، یعنی الگوریتمهای نیمهنظارتی، عملکردی مابین الگوریتمهای نظارتی و الگوریتمهای بدون نظارت دارند. در یادگیری فعال، سیستم در مرحله آموزش، با انسان تعامل دارد؛ به این صورت که انسان برچسبهای مناسب را به دادههای ورودی نسبت میدهد و سیستم با توجه به برچسبهای اختصاص داده شده، به پایش اطلاعات خود و مدل آموزشی میپردازد.
این رساله منحصرا بر روشهای دستهبندی مبتنی بر یادگیری نظارتی تمرکز دارد. به بیان رسمیتر، الگوریتمهایی که از یک مجموعه آموزشی[18] مانند D، شامل n داده نمونه ورودی به فرم {(x1,y1),…, (xn,yn)} که هر نمونه متشکل از یک بردار خصیصه[19] با بعد d و یک برچسب کلاس که برای مسائل K کلاسه، آموزش میبینند و خروجی این آموزش، یک دستهبندیکننده[20] یا فرضیه[21] است که در حالت ایده آل یک مرزبندی تصمیم[22] دقیق برای جداسازی کلاسها در کل فضای انجام خواهد داد.
[1] Artificial intelligence
[2] Machine learning
[3] Pattern recognition
[4] Input data
[5] Unseen data
[6] Classification
[7] Regression
[8] Discrete
[9] Class label
[10] Continues-valued function
[11] Numerical
[12] Supervised learning
[13] Unsupervised learning
[14] Semi-supervised
[15] Active learning
[16] Testing phase
[17] Clustering
[18] Training set
[19] Feature vector
[20] Classifier
[21] Hypothesis
[22] Decision boundary
تعداد صفحه : 100
قیمت :14700 تومان
بلافاصله پس از پرداخت لینک دانلود فایل در اختیار شما قرار می گیرد
و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.
پشتیبانی سایت : serderehi@gmail.com
در صورتی که مشکلی با پرداخت آنلاین دارید می توانید مبلغ مورد نظر برای هر فایل را کارت به کارت کرده و فایل درخواستی و اطلاعات واریز را به ایمیل ما ارسال کنید تا فایل را از طریق ایمیل دریافت کنید.
14,700 تومانافزودن به سبد خرید