:
دادهکاوی سودمندترین ابزار کشف دانش از میان تراکنشها است [3] [2] [1]. یکی از کاربردهای مهم دادهکاوی، کشف قوانین انجمنی میباشد که یکی از مهمترین روش های بازشناسی الگو در سیستمهای بدون نظارت است. کشف قوانین انجمنی مانند جستجوی طلا در یک پایگاه داده بسیار بزرگ است، که در اینجا منظور از طلا یک قانون جذاب که هنوز کشف نشده است، میباشد. از این طریق میتوان تمام قوانین ممکن را در یک پایگاه داده پیدا کرد، اما مسئله اینجاست که تحلیل تعداد زیادی قانون کار سختی است. به همین جهت، معیارهایی همچون ضریب پشتیبان و ضریب اطمینان برای مشخص کردن قوانین با کیفیت بالاتر به کار میروند.
 اکثر الگوریتمهای کاوش قوانین انجمنی، مانند الگوریتم Apriori و AIS، مبتنی بر روش هایی هستند که توسط Agrawalدر [4] و [5] پیشنهاد شدهاند. با بهره گرفتن از این متدها نمیتوان قوانینی را که شامل صفات خاصه عددی هستند کشف نمود. این الگوریتمها مسئله کاوش قوانین انجمنی را به دو قسمت
تقسیم میکنند [1 : [6) تولید مجموعه اقلام مکرر، که در آن همه اقلامی که معیار حداقل پشتیبان را ارضا میکنند پیدا میشوند.تولید قوانین انجمنی، که در آن قوانین انجمنی که حد اقل اطمینان را ارضا میکنند از مجموعه اقلام مکرر تولید شده در مرحله قبل استخراج میشوند. از میان این دو مرحله، تولید قوانین انجمنی، پیچیدگی محاسباتی بالاتری دارد، لذا روش هایی که به طور کارا مجموعه اقلام مکرر را تولید میکنند میتوانند جالب توجه واقع شوند. به محض پیدا شدن مجموعه اقلام مکرر، قوانین انجمنی از این مجموعه اقلام استخراج میشوند.
 در بسیاری از مسائل، ممکن است با اقلام دادهای سر و کار پیدا کنیم. که صریح 3 یا 4عددی هستند.
قوانین حاصل از این مجموعه اقلام را قوانین انجمنی عددی مینامند. به همین دلیل، الگوریتمهایی برای کاوش قوانین انجمنی عددی ارائه شدند. در یک قانون انجمنی عددی صفات خاصۀ داده ها محدود به نوع بولین نیستند، بلکه میتوانند دو نوع عددی (مثل سن، حقوق و گرما) و یا صریح (مثل جنسیت و علامت تجاری) باشند [7]. از

خرید متن کامل این پایان نامه :

 
مقالات و پایان نامه ارشد
 
 آنجایی که کاوش قوانین انجمنی عددی یک مسئله بهینه سازی سخت است تا یک مسئله گسسته سازی ساده، دستۀ مهمی از مسائل کاوش قوانین انجمنی وجود دارند که تنها زمانی میتوانند با یک الگوریتم بهینه سازی ترکیبی حل شوند که بازة پیوستۀ مقادیر مجاز صفات خاصۀ عددی به مجموعۀ محدودی تبدیل شوند. مسئله تبدیل بازة پیوسته به مجموعۀ متناهی همیشه کار راحتی نیست، به خصوص
زمانی که بازة اولیه، بازة وسیعی باشد و شفافیت و دقت بالایی مد نظر باشد. بنابراین، در این گونه موارد، معمولاً الگوریتمهایی که به طور طبیعی و ساده قادر به کار کردن با متغیرهای پیوسته عددی هستند، بهتر عمل میکنند [8].
 در سالهای اخیر، الگوی هوش جمعی و به خصوص از این میان بهینه سازی کلونی مورچهها و بهینه سازی گروه ذرات، توجه زیادی را در تحقیقات به خود جلب کرده است. همینطور، این الگوریتمها رایجترین متاهیوریستیکهای هوش جمعی برای داده کاوی هستند.
 هوش جمعی، شاخه نسبتاً جدیدی از هوش مصنوعی است که به بررسی هوش جمعی حاصل از گروهی از عاملهای ساده میپردازد. الگوریتمهای هوش جمعی مبتنی بر رفتار اجتماعی هستند که درطبیعت قابل مشاهده است، مانند کلونی مورچهها، دسته پرندگان، گروه ماهیها و کندوی زنبور عسل که در
آنها تعدادی از اعضاء که قابلیت‌های محدودی دارند با همکاری هم قادرند به راه حلهایی برای مسائل پیچیده، دست پیدا کنند.
 اولین الگوریتم ACO، توسط Dorigo و همکارانش در سال 1992 در [8] جهت حل مسئله فروشندة دورهگرد ارائه شد. این الگوریتم از رفتار جستجوی غذا در مورچه های حقیقی الهام گرفته شده است. اساس این رفتار، ارتباط غیر مستقیم مورچهها از طریق دنباله های شیمیایی فرومون است که آنها را
قادر به کشف کوتاهترین مسیر از لانه تا منبع غذا میسازد. تا کنون الگوریتمهای ACO متعددی برای حل مسائل بهینه سازی گسسته و پیوسته، ارائه شده است. اخیراً، نسخۀ پیوستۀ متاهیوریستیک بهینه سازی کلونی مورچهها، با هدف حل مسائل بهینه سازی پیوسته توسط Socha و Dorigo، به نام ACOR، در [10] ،[8] و [11] ارائه شده است. نسخۀ ACOR، به جای استفاده از تابع احتمالی که، یک مقدار برای هر رأس (که نشان دهنده یک مقدار منفرد برای متغیر گسسته است) در نظر میگیرد، از یک توزیع احتمال که شامل توابع چگالی احتمال گوسی متعددی است و به راحتی قابل نمونهگیری میباشد، استفاده میکند. این الگوریتم در دادهکاوی برای آموزش وزنهای یک شبکه عصبی در [12] به کار رفته است. بر اساس آزمایشات انجام گرفته روی سه مجموعه دادة تشخیص پزشکی، آنها دریافتند، نسخه هیبرید، که الگوریتم 13] Levenberg-Marquart] را با ACOR ترکیب میکند، بهتر از الگوریتمهای Levenberg-Marqunt و انتشار به عقب عمل میکند. نتایج نشان میدهد، با وجود این که محیط آزمایشگاهی نسبتاً محدود است، پتانسیل کاربرد ACOR در داده کاوی امید بخش است.
 تا کنون هیچ مطالعهای صورت نگرفته است که از ACOR برای کاوش قوانین انجمنی عددی استفاده کرده باشد. در این پایان نامه، به توصیف چگونگی پیدا کردن بازههای پر تکرار دادگان عددی و قوانین انجمنی حاصل از آنها توسط ACOR، در یک مرحله و بدون نیاز به مشخص کردن حد اقل
پشتیبان و اطمینان قوانین پرداخته شده است. در الگوریتم پیشنهادی، تابع هدفی که قرار است بهینه شود، تابعی وزن دار بوده، که سه معیار پشتیبان، اطمینان و جذابیت را به طور همزمان بهینه میکند و عملکرد چند هدفه دارد. نتایج نشان میدهد که قوانین انجمنی دقیق و صحیحی از این طریق، قابل تولید خواهند بود.
موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...