متن کامل پایان نامه مقطع کارشناسی ارشد رشته  کامپیوتر با عنوان :بررسی روش های خوشه بندی توزیعی در ادامه مطلب می توانید صفحات ابتدایی این پایان نامه را بخوانید

دانشگاه آزاد اسلامی
واحد تهران جنوب
دانشكده تحصیلات تكمیلی

سمینار برای دریافت درجه كارشناسی ارشد “M.Sc”
مهندسی كامپیوتر – نرم افزار

عنوان :
بررسی روش های خوشهبندی توزیعی

برای رعایت حریم خصوصی اسامی استاد راهنما و نگارنده درج نمی شود

تکه هایی از متن به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چكیده
چگونگی سازماندهی و ادغام نتایج پرسوجوی بازیابیشده از منابع مختلف، یكی از موضوعات كلیدی در
بازیابی اطلاعات توزیعی است. برخی از پژوهشها و آزمایشات پیشین توصیه میكنند كه مرور اسـنادی
كه بهصورت خوشه بیان میشوند به نسبت اسنادی كه تنها در یـك لیـست مطـرح مـی شـوند كـارآیی
بیشتری دارند. ارائهی نتایج بازیابی بهصورت خوشه مبتنیبر فرضیهی خوشه است. بر طبق این فرضـیه،
وضعیت اسناد درون یك خوشه ارتباط مشابهی با پرسوجوی مطرح شده دارند.
خوشهبندی میتواند بهعنوان فرآیند بخشبندی یك مجموعه از الگوها به گـروههـای معنـادار همگـن و
منفصل بهنام خوشهها تعریف شود. در خوشهبندی دادههـای توزیـعشـده، مجموعـهی دادههـا در میـان
چندین سایت توزیع شدهاند.
خوشـهبنـدی در حـوزههـای كـاربردی مـدرن مثـل تعـاون در خریـد و فـروش ، بیولـوژی مولكـولی و
چندرسانهای وظیفهای مهم بر دوش دارد. در بسیاری از این حـوزههـا ، اساسـا اطلاعـات از سـایتهـای
مختلفی گرفته میشود. برای اقتباس اطلاعات از این داده ها ، آنها بهصورت یك مجموعـه درآمـدهانـد و
خوشهبندی میشوند.
در سالهای اخیر، پیشنهاداتی برای اكتشاف دانش و كاوش داده ها، و بهویژه برای خوشهبندی گـسترش
یافته اما تنها تعداد كمی از آنها برای منابع داده ای توزیعشده اسـت. در ایـن تحقیـق، یـك مـروری بـر
الگوریتمهای خوشهبندی توزیعی مطرح شدهاست.

مقدمه
امروزه حتی با گسترش وب، كاربران برای یافتن نیازهای خود با مناب ع اطلاعاتی بسیاری مواجه هـستند.
چگونگی یافتن سریع نیازهای كاربر از این اقیانوس اطلاعات، یك مسئله ی مهم است. اگـر چـه راهحـل
استفاده از موتور های جستجو در پایگاه داده های یكتا ظاهرا برای آن كارآمد است ، اما در عمل ایـن راه
حل برای جمع آوری همهی اطلاعات مورد نیاز ، به خـصوص اطلاعـات مـرتبط بـا منـابع مخفـی وب ،
ممكن است مشكلاتی را به دنبال داشته باشد.
كشف دانش در پایگاه داده، كاوش داده ها نامیده میشود و ابزاری ارزشمند برای گزینش اطلاعات مفیـد
از هر پایگاه داده است. این ابزار قابلیت محاسباتی بالایی دارد و میتواند به توزیع و موازیسازی دادههـا
بپردازد. برای مسائل مربوط به كاوش دادههـا ، لازم اسـت تـا بخـشبنـدی هوشـمندانه ای از دادههـا را
بهدست آوریم. بدین طریق ما می توانیم داده ها را به صورت جداگانه بررسی كنیم. به منظـور كمـك بـه
قانونمند كردن مساله، معیار اصلی برای بخشبندی هوشمندانه میتواند این باشد كه داده های درون هر
بخش تا آن جاییكه احتمال دارد ، با هم مشابه باشند، در حالی كه داده های درون بخشهای مختلف بـا
یكدیگر هیچ شباهتی نداشته باشند. این معیار همان چیزی است كه در الگوریتمهای خوشهبندی مـورد
استفاده قرار میگیرد و به ما اجازه میدهد تا برای دستیابی به كـل پایگـاه داده، بـه مـوازیسـازی ایـن
مساله بپردازیم.
در فصل اول این تحقیق، مفاهیم توزیعشدگی بهطور خلاصه مورد بررسی قرار میگیرد. سپس در فـصل
دوم، به بحث در مورد خوشهبندی توزیعی پرداخته میشود. در فصل سوم، الگـوریتمهـای خوشـهبنـدی
مورد بررسی و مطالعه قرار گرفته و بهدنبال آن برخی از كاربردهای خوشهبندی در فصل چهـارم مطـرح
میشوند. در نهایت، در فصل پنجم یك نتیجهگیری كوتاهی از این مباحث به عمل میآید.

مقدمه 1-1
یك سیستم توزیع شده، از یك مجموعه از كامپیوترهای مستقل تشكیل شده است كه كـاربران، آنهـا را
به صورت یك سیستم یكپارچه می بینند.[1]
چند مطلب از تعریف فوق مشخص می شود. اول اینكه در یك سیستم توزیـع شـده، تعـدادی كـامپیوتر
وجود دارد. مطلب دیگر اینكه كاربران سیستم توزیع شده، تصور می كنند كه با یك سیستم واحـد كـار
می كنند. از مجموع این دو نكته می توان فهمید كه اجزای داخل یك سیستم توزیع شده باید به شكلی
با همدیگر تعامل داشته باشند كه بتوانند برای كاربر خود این تصور را ایجاد كنند كه با یك سیستم كار
می كند. اینكه چگونه چنین تعاملی ایجاد شود یك مسأله ی م هم در مبحث سیستم های توزیـع شـده
است.
در واقع هیچ اجباری در مورد نوع كامپیوترهای داخل سیـستم توزیـع شـده، همچنـین در مـورد روش
اتصال بین آنها وجود ندارد. یعنی اینكه نباید این محدودیت ها را كه اجزای این سیـستم هـا یـا اتـصال
بین آنها از نوع خاصی باشند، برای سیستم های توزیع شده در نظر گرفت. از طرفی كاربر این سیستمها
نباید هیچ اطلاع و نگرانی در مورد تفاوت های بین كامپیوترهای مختلف موجود در یك سیـستم توزیـع
شده و روشی كه با هم ارتباط برقرار می كنند، همچنین سازمان داخلی سیستم، داشته باشد . ایـن یـك
ویژگی حیاتی برای سیستم های توزیع شده است كه به آن شـفافیت مـی گوینـد . سیـستمی كـه ایـن
ویژگی را نداشته باشد، طبق قسمت دوم تعریف فوق یك سیستم توزیع شده خوانده نمی شود.
ویژگی دیگر سیستم های توزیع شده این است كه این سیستم ها طبق قوانین اسـتانداردی كـه فرمـت،
محتوا و معنی پیام های فرستاده شده و دریافت شده را مشخص می كنند، ارتباط برقرار می كننـد . بـه
این ویژگی باز بودن می گویند. این قوانین به طور رسمی در قالب پروتكل ها تدوین می شوند . پیروی از
این پروتكل ها باعث می شود اجزای متنوع و متفاوت موجود در سیستم های توزیع شـده كـه احتمـالاً
مربوط به عرضه كنندگان متفاوت هستند، بتوانند با هم كار كنند.

 تعداد صفحه :82

قیمت : پنج هزار تومان

—-

پشتیبانی سایت :       

*         serderehi@gmail.com

رابی