دانشگاه اصفهان

دانشکده کامپیوتر

گروه کامپیوتر

 

 

 

پایان نامه ­ی کارشناسی ارشد رشته مهندسی کامپیوتر

گرایش نرم افزار

 

 

 

سیستم پیشنهاد دهنده اطلاعات با بهره گرفتن از روش ترکیبی مدل غذایابی بهینه و رتبه ­بندی سه­گانه روابط معنایی داده­های متصل

 

اسفندماه 1391

 

برای رعایت حریم خصوصی نام نگارنده و استاد راهنما در سایت درج نمی شود

(در فایل دانلودی نام نویسنده و استاد راهنما موجود است)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

است.

چکیده، حجم عظیم داده­های موجود در داده­های پیوندی باعث شده است که کاربر نتواند داده­های مورد نیازش را در زمان مناسب پیدا کند. برای رفع این معضل، سیستم­های بیشماری به منظور گزینش داده­ ها طراحی و پیاده­سازی شده است که همچنان نتوانسته ­اند دقت و کارایی مناسبی داشته باشند. سازگار کردن الگوریتم­های موجود با ورودی و شرایط داده­های پیوندی می ­تواند دقت این سیستم­ها را بالا برد.

در این پایان نامه ، سیستم­ پیشنهادگری طراحی و پیاده­سازی می­شود که با ورودی­ و مشخصات داده­های پیوندی سازگار باشند. روش پیشنهادی از دو الگوریتم به نام­های نظریه غذایابی بهینه و رتبه ­بندی سه­گانه استفاده می­ کند و داده­ ها را از نظر تناسب با موضوع مورد علاقه کاربر رتبه ­بندی می­ کند. رتبه ­بندی سه­گانه داده­های پیوندی را تحلیل کرده و میزان ارتباط آن داده را نسبت به یک موضوع خاص محاسبه می­ کند. سپس، نظریه غذایابی بهینه نتایج حاصل از رتبه ­بندی سه­گانه را گزینش کرده و پس از مرتب­سازی به کاربر ارئه می­ کند. پیشنهادهای ارائه شده توسط این سیستم هم از ارزش معنایی مناسبی برخوردار است و هم اینکه با ساختار و چگونگی شیوه یافتن و دریافت اطلاعات در انسان هماهنگ است.

روش پیشنهادی با الگوریتم استاندارد رتبه ­بندی سه­گانه بر روی پنح مجموعه داده­ دیبی­پدیا مقایسه شده است. ارزیابی­ها نشان می­دهد که دقت روش پیشنهادی از روش استاندارد رتبه ­بندی سه­گانه بیشتر بوده است، با این وجود روش استاندارد از کارایی زمان اجرای بهتری برخوردار است.

کلیدواژه­ها: سیستم­های پیشنهادگر، داده­های پیوندی، نظریه غذایابی بهینه، رتبه ­بندی سه­گانه

 

فهرست مطالب

عنوان                                                                                                                                  صفحه

فصل یکم: کلیات تحقیق

1-1 مقدمه. 1

1-2 موضوع تحقیق.. 2

1-3 اهداف تحقیق.. 4

1-4 اهمیت و ارزش تحقیق بر روی داده‌های پیوندی.. 5

1-5   ساختار تحقیق.. 5

فصل دوم: معرفی سیستم‌های پیشنهاد دهنده

2-1 مقدمه. 6

2-2 سیستم‌های پیشنهاد دهنده. 7

2-3 بررسی‌های تاریخی.. 7

2-4 طبقه بندی.. 8

2-4-1 روش‌های همبستگی.. 9

2-4-1-1 الگوریتم‌های مبتنی بر حافظه. 9

2-4-1-2 الگوریتم‌های مبتنی بر مدل.. 11

2-4-1-3 نقاط ضعف روش های فیلتر همبستگی.. 12

2-4-2 روش مبنی بر محتوا 12

2-4-3 روش‌های مبتنی بر دانش…. 13

2-4-4 روش‌های آماری.. 14

2-4-5 روش‌های مبتنی بر سودمندی.. 15

2-4-6 روش‌های ترکیبی.. 16

2-5 سیستمهای پیشنهاد دهنده مبتنی بر داده‌های پیوندی.. 17

2-6 جمع بندی.. 20

فصل سوم: مروری بر داده‌های پیوندی و نظریه غذایابی

3-1 مقدمه. 24

3-2 ایده اصلی RDF.. 23

3-2-1 منابع.. 24

3-2-2 ویژگی‌ها 25

3-2-3 گزاره‌ها 25

3-2-4 نمونه یک گزاره. 26

3-3 داده پیوندی.. 27

3-3-1 پشته تکنولوژی داده پیوندی.. 28

 

 

 

عنوان                                                                                                                                   صفحه

3-3-3 پروژه داده‌های باز پیوندی.. 29

3-3-4 انتخاب شناسه های همسان منابع و واژه نامه‌های RDF.. 30

3-4 نظریه ی چرای بهینه. 31

3-5 مدل محدوده­های وصله­ای.. 32

3-6 نظریه مقدار مرزی کارنوف… 34

3-7 مدل رژیم غذایی بهینه. 34

3-7-1 شرح مسئله روباه. 35

3-7-2 ساده سازی مسئله روباه. 35

3-7-3 روباه آسان­گیر. 36

3-7-4 روباه سخت­گیر. 37

3-7-5 روباه حسابگر. 37

3-8 مدل ریاضی انتخاب غذای بهینه. 37

3-9 الگوریتم انتخاب رژیم بهینه. 38

3-10 اصول انتخاب رژیم غذایی بهینه. 39

3-11 جمع­بندی.. 40

فصل چهارم: پیاده سازی مدل ترکیبی رتبه‌بندی سه‌گانه بهینه شده و غذایابی بهینه

4-1 مقدمه. 41

4-2 مدل رتبه‌بندی سه‌گانه. 43

4-2-1 جمع آوری داده ها 44

4-2-2 ساخت تنسور معادل گراف… 45

4-2-3 پیش پردازش…. 45

4-2-3-1 کاهش حجم داده ها از راه حذف خصوصیات غالب… 46

4-2-3-2 وزن­دهی خصوصیات… 47

4-2-4 تحلیل پارافک…. 47

4-3 تحلیل روش رتبه‌بندی سه‌گانه. 49

4-3-1 مرحله پیش پردازش…. 49

4-3-2 عملیات حذف… 49

4-3-3 عملیات وزن دهی.. 51

4-4 دسته بندی خصوصیات بر اساس دامنه. 52

4-4-1 خصوصیات تعریف شده در استاندارد RDF.. 52

4-4-2 خصوصیات تعریف شده درسطح منبع داده. 53

4-4-3 خصوصیات تعریفی یک حوزه خاص…. 54

 

 

عنوان                                                                                                                                   صفحه

4-4-4 مثالی از دسته­بندی خصوصیات… 54

4-4-5 رابطه تکرار خصوصیات با اهمیت آنها در موضوع. 55

4-4-6 خصوصیات ابهام آمیز. 56

4-4-7 خصوصیات زائد. 56

4-4-8  نتیجه بررسی خصوصیات… 57

4-5 اعمال پیش پردازش بر روی اسناد RDF.. 57

4-5-1 امتیازدهی و حذف خصوصیات… 58

4-5-2 انباره­ی خصوصیات از پیش تعریف شده. 58

4-5-3 امتیازدهی خصوصیات… 59

4-5-4 وب به عنوان  منبع امتیازدهی خصوصیات… 59

4-5-5 امتیازدهی پویا 62

4-5-6 ارسال جستار به گوگل.. 62

4-5-7 آماده سازی کلیدواژه های جستجو. 62

4-5-8 رفع ابهام از جستار. 63

4-5-9 پردازش صفحات بازگشتی.. 63

4-5-10 تحلیل آماری صفحات وب و محاسبه امتیاز خصوصیات… 64

4-6 تحلیل پارافک…. 65

4-7 افزودن خصوصیات جدید به انباره خصوصیات حذفی.. 67

4-8 کاربرد نظریه غذایابی بهینه در سیستم.. 68

4-9 تغییرات مورد نیاز روش انتخاب رژیم بهینه. 68

4-9-1 کاهش شباهت و تعداد نمونه ها با پیش پردازش…. 69

4-9-2 استفاده از نمونه به جای نوع. 70

4-10 تعریف بهره، هزینه و سودمندی.. 71

4-11 تنظیم الگوریتم و کنترل خروجی­ها 72

4-12 تحلیل عملکرد الگوریتم.. 72

4-13 جمع­بندی.. 72

فصل پنجم: پیاده سازی و ارزیابی

5-1 مقایسه نتایج با پیش پردازش استاندارد. 74

5-2 پیاده سازی.. 75

5-3 مقایسه عملیات پیش پردازش در دو روش…. 75

5-4 مقایسه نتایج نهایی.. 77

5-5 کارایی زمان اجرا 83

 

عنوان                                                                                                                                   صفحه

5-6 مقایسه نتایج پردازش شده و بدون پردازش با نظریه انتخاب بهینه رژیم غذایی.. 83

5-7 بررسی بیشترین داده­های قابل ارائه. 84

5-8 جمع­بندی.. 85

فصل ششم: نتیجه گیری و کارهای آینده

6-1 خلاصه راهکارهای ارائه شده. 86

6-2 راهکارهایی برای ادامه پژوهش…. 88

منابع و ماخذ.. 90

 

 

فهرست شکل­ها

عنوان                                                                                                                                   صفحه

شکل 1-1: ساختار انتزاعی داده‌های پیوندی.. 2

شکل 1-2: یک مدل از روابط در داده‌های پیوندی.. 3

شکل 2-1: ماتریس شباهت کاربران در روش همبستگی.. 11

شکل 2-2 :تعریف پروفایل کاربر در قالب FOAF.. 17

شکل 2-3 : معماری سیستم پیشنهادگر بر پایه FOAF.. 18

شکل 2-4 یک نمونه از پیشنهاد دهی دیبیرک… 19

شکل 2-5 یک نمونه از ارائه دلایل مربوط به یک پیشنهاد در دیبیرک… 19

شکل 3-1: نمونه ای از پیوندهای RDF.. 24

شکل 3-2: یک گزاره متشکل از دو منبع و یک صفت سازنده یک رابطه. 25

شکل 3-3: گزاره “امید رفیعی مالک صفحه وب است”. 26

شکل 3-4: نمونه یک RDF در قالب  XML.. 26

شکل 3-5 : شمایی از ابر داده های باز متصل در مارچ 2009. 30

شکل 3-6: مدل جستجوی غذا در بین محدوده ها توسط یک چرنده. 32

شکل 3-7: الگوریتم انتخاب رژیم غذایی بهینه. 39

شکل 4-1: مدل رتبه‌بندی سه‌گانه. 43

شکل 4-2: یک گراف ساده معنایی.. 44

شکل 4-3: تنسور معادل گراف معنایی شکل 4-2. 45

شکل 4-4: تجزیه تنسور T به 3 ماتریس عامل.. 48

شکل 4-5: یک RDF ساده  با خاصیت resource. 52

شکل 4-6: یک RDF ساده  با خاصیت type. 53

شکل 4-7: یک RDF ساده با خاصیت wordnet_type. 53

شکل 4-8: یک RDF  توصیفگر یک گروه موسیقی.. 54

شکل 4-9 (الف): نتایج یک گزاره غلط… 61

شکل 4-9 (ب): نتایج یک گزاره درست… 61

شکل 4-10: مراحل امتیاز دهی خصوصیات و حذف خصوصیات نامطلوب… 65

شکل 4-11: شبه کد الگوریتم CP-ALS.. 66

شکل 5-1: مقایسه نتایج پیش پردازش روش استاندارد با روش بهینه. 77

شکل 5-2: مقایسه تعداد خصوصیات انتخاب شده با دو روش استاندارد و بهینه. 82

شکل 5-3: تعداد پیوندهای مبهم پیشنهاد شده دو روش استاندارد و بهینه. 82

شکل 5-4: تعداد پیوندهای (منابع RDF) پیشنهاد شده دو روش استاندارد و بهینه. 83

شکل 5-5: نمونه ای از گشت و گذار بین پیوندهای RDF داده های پیوندی.. 85

شکل 5-6: امتیازدهی به نتایج روش انتخاب بهینه غذا (امتیازدهی بین 1 تا 10) 85

 

فهرست جدول­ها

عنوان                                                                                                                                   صفحه

جدول 2-1: دسته بندی روش­های پیشنهاددهی.. 8

جدول 2-2: انواع مدل­های ترکیبی.. 16

جدول 4-1: 20 خاصیت مربوط به گروه­های موسیقی از dbpedia.org.. 50

جدول 4-2: بررسی مطلوبیت خاصیت­های مربوط به گروه­های موسیقی از جدول 4-1. 51

جدول 4-3: دسته بندی خاصیت­ها مربوط به گروه­های موسیقی از جدول 4-1. 55

جدول 4-4: برخی از خاصیت­های دسته اول و دوم در انباره ایستا 58

جدول 4-5: نتایج جستجو در گوگل برای 3 موضوع عمومی نتایج 10 صفحه اول.. 60

جدول 4-6: سابقه حذف خصوصیات (اطلاعات موضوع و تعداد حذف­ها فرضی هستند) 67

جدول 4-7: نمونه­ای نرمال از داده­های ورودی روش انتخاب رژیم غذایی بهینه. 69

جدول 4-8: نمونه­ای غیر طبیعی از داده­های ورودی روش انتخاب رژیم غذایی بهینه. 70

جدول 5-1: نتایج حذف خاصیت با پیش پردازش استاندارد. 75

جدول 5-2: نتایج حذف خاصیت با پیش پردازش روش ارائه شده. 76

جدول 5-3: نتایج نهایی روش رتبه‌بندی سه‌گانه استاندارد بر روی مجموعه داده بیتلز. 78

جدول 5-4: نتایج نهایی روش رتبه‌بندی سه‌گانه بهینه شده بر روی مجموعه داده بیتلز. 80

جدول 5-5: نتایج نهایی روش پیشنهادی تحقیق بر روی مجموعه داده معیار دیبی­پدیا 81

 

فصل یکم

کلیات تحقیق

 

 

 

 

1-1 مقدمه

سیستم‌های پیشنهاد دهنده یک نوع ویژه از سیستم‌های فیلتر اطلاعات است، که در آن مورد­ها را، بر این اساس که چه موردی‌ برای کاربر جذاب است، از یک مجموعه بزرگ از مورد­ها و کاربران فیلتر می­ کنند. در این تحقیق روشی جهت پیشنهاددهی بر روی داده­های پیوندی با بهره گرفتن از نظریه غذایابی جانوران ارائه می­شود. ایده­ی داده‌های پیوندی برای اولین بار در سال 2006 توسط تیم برنز لی[1] به عنوان یک نظریه­ی غیر رسمی‌ارائه شد. تا به امروز زمینه ­های فنی انجام تحقیقات از طریق پیاده­سازی ابزار­های مورد نیاز برای ایجاد مجموعه­های داده، اتصال آن­ها به یکدیگر و همچنین گشت و گذار ساده بین آن­ها ایجاد شده است. نظریه غذایابی چگونگی یافتن غذا توسط جانوران را تشریح می­ کند و در تحقیقات بسیاری نشان داده شده است که انسان­ها نیز برای یافتن اطلاعات از این روش استفاده می­ کند.

1 Tim Berners-Lee

تعداد صفحه :

قیمت :37500 تومان

بلافاصله پس از پرداخت ، لینک دانلود فایل در اختیار شما قرار می گیرد

و در ضمن فایل خریداری شده به ایمیل شما ارسال می شود.

پشتیبانی سایت  serderehi@gmail.com