وبلاگ

توضیح وبلاگ من

دانلود پایان نامه ارشد:داده کاوی پویا با استفاده از عامل

 
تاریخ: 05-11-99
نویسنده: نویسنده محمدی

­ای بر داده ­کاوی

 

داده ­کاوی به معنای یافتن نیمه خودکار الگوهای پنهان موجود در مجموعه داده ­های موجود می­باشد[38]. داده ­کاوی از مدلهای تحلیلی ، کلاس بندی و تخمین و برآورد اطلاعات و ارائه نتایج با بهره گرفتن از ابزارهای مربوطه بهره می گیرد. می­توان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بین داده ­های فعلی و پیش ­بینی موارد نامعلوم و یا مشاهده نشده عمل می­ کند. برای انجام عملیات داده ­کاوی لازم است قبلا روی داده ­های موجود پیش­پردازشهایی انجام گیرد. عمل پیش پردازش اطلاعات خود از دو بخش کاهش اطلاعات و خلاصه­سازی و کلی­سازی داده ­ها تشکیل شده است. کاهش اطلاعات عبارت است از تولید یک مجموعه کوچکتر، از داده ­های اولیه، که تحت عملیات داده ­کاوی نتایج تقریبا یکسانی با نتایج داده ­کاوی روی اطلاعات اولیه به دست دهد[38]. پس از انجام عمل کاهش اطلاعات و حذف خصایص غیر مرتبط نوبت به خلاصه­سازی و کلی­سازی داده ­ها می رسد. داده ­های موجود در بانک­های اطلاعاتی معمولا حاوی اطلاعات در سطوح پایینی هستند، بنابراین خلاصه­سازی مجموعه بزرگی از داده ­ها و ارائه آن به صورت یک مفهوم کلی اهمیت بسیار زیادی دارد. کلی­سازی اطلاعات، فرایندی است که تعداد زیادی از رکوردهای یک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می نماید. خود روش های داده ­کاوی به سه دسته کلی تقسیم می­شوند که عبارتند از خوشه­بندی، طبقه ­بندی و کشف قواعد وابستگی. در ادامه هر یک از این روشها را بطور کلی معرفی می­نماییم.

 

 

 

1-1-1- خوشه­بندی

 

فرایند خوشه­بندی سعی دارد که یک مجموعه داده را به چندین خوشه­ تقسیم نماید بطوریکه داده ­های قرار گرفته در یک خوشه با یکدیگر شبیه بوده و با داده ­های خوشه ­های دیگر متفاوت باشند. در حال حاضر روش های متعددی برای خوشه­بندی داده ­ها وجود دارد که بر اساس نوع داده ­ها، شکل خوشه ­ها، فاصله داده ­ها و غیره عمل خوشه­بندی را انجام می­دهند. مهمترین روش های خوشه­بندی در زیر معرفی شده ­اند:

 

  • روش های تقسیم ­بندی : روش های خوشه­بندی که بروش تقسیم بندی عمل می­ کنند، داده ­های موجود در یک مجموعه داده را به k خوشه تقسیم می­ کنند، بطوریکه هر خوشه دو خصوصیت زیر را داراست :

      • هر خوشه یا گروه حداقل شامل یک داده می­باشد.

     

    • هر داده موجود در مجموعه داده دقیقا به یک گروه یا خوشه تعلق دارد.

معیار اصلی در چنین مجموعه داده ­هایی میزان شباهت داده ­های قرار گرفته در هر خوشه می­باشد. در حالیکه داده ­های قرار گرفته در دو خوشه مختلف از نظر شباهت با یکدیگر فاصله زیادی دارند. مقدار k که بعنوان پارامتر استفاده می­گردد، هم می ­تواند بصورت پویا تعیین گردد و هم اینکه قبل از شروع الگوریتم خوشه­بندی مقدار آن مشخص گردد.

 

 

پایان نامه

 

 

  • روش های سلسله مراتبی : روش های سلسله مراتبی به دو دسته کلی روش های bottom-up و روش های top-down تقسیم می­گردند. روش های سلسله مراتبی bottom-up به این صورت عمل می­ کنند که در شروع هر کدام از داده ­ها را در یک خوشه جداگانه قرار می­دهد و در طول اجرا سعی می­ کند تا خوشه ­هایی نزدیک به یکدیگر را با هم ادغام نماید. این عمل ادغام تا زمانی که یا تنها یک خوشه داشته باشیم و یا اینکه شرط خاتمه برقرار گردد، ادامه می­یابد. روش های top-down دقیقا بطریقه عکس عمل می­ کنند، به این طریق که ابتدا تمام داده ­ها را در یک خوشه­ قرار می­دهد و در هر تکرار از الگوریتم، هر خوشه به خوشه ­های کوچکتر شکسته می­ شود و اینکار تا زمانی ادامه می­یابد که یا هر کدام از خوشه ­ها تنها شامل یک داده باشند و یا شرط خاتمه الگوریتم برقرار گردد. شرط خاتمه معمولا تعداد کلاستر یا خوشه می­باشد.

 

 

  • روش های مبتنی بر چگالی : اکثر روش های خوشه­بندی که بروش تقسیم ­بندی عمل می­ کنند معمولا از تابع فاصله بعنوان تابع معیار خود بهره می­برند. استفاده از چنین معیاری باعث می­گردد که الگوریتم خوشه­بندی تنها قادر به ایجاد خوشه ­هایی با اشکال منظم باشد. در صورتیکه اگر خوشه ­های واقعی در داده ­ها دارای اشکال غیرمنظمی باشند، این الگوریتم­ها در خوشه­بندی آنها با مشکل مواجه می­گردند. برای حل اینگونه مشکلات یکسری از روشها برای خوشه­بندی پیشنهاد گردیده­اند که عمل خوشه­بندی را بر مبنای چگالی داده ­ها انجام می­دهند. ایده اصلی در این روشها بر این اساس است که خوشه ­ها تا زمانی که داده ­های قرار گرفته همسایگی خوشه ­ها از حد معینی بیشتر باشد، رشد می­ کنند و بزرگ می­شوند. چنین روش هایی قادرند خوشه ­هایی با شکلهای نامنظم نیز ایجاد نمایند.

البته دسته دیگری از روش های خوشه­بندی مانند روش های مبتنی بر گرید، روش های مبتنی بر مدل و … وجود دارند که می­توانید آنها را در ]38[ مطالعه نمایید.

 

 

 

1-1-2- کشف قواعد وابستگی

 

بحث قواعد وابستگی به مقوله کشف عناصری یا المان­هایی در یک مجموعه داده می ­پردازد که معمولا با یکدیگر اتفاق می­افتند و بعبارتی رخداد آنها بنوعی با یکدیگر ارتباط دارد. بطور کلی هر قاعده یا rule که از این مجموعه داده­ بدست می­­آید، دارای شکل کلی بصورت  می­باشد که نشان می­دهد چنانچه الگوی X اتفاق بیفتد، با احتمال بالایی الگوی Y نیز اتفاق خواهد افتاد. برای مطالعه بیشتر در مورد مقوله کشف قواعد وابستگی می­توانید به ]38[ مراجعه نمایید.

 

 

 

1-1-3- طبقه ­بندی

 

فرایند طبقه ­بندی در واقع نوعی یادگیری با ناظر می­باشد که در طی دو مرحله انجام می­گردد. در مرحله اول مجموعه ­ای از داده ­ها که در آن هر داده شامل تعدادی خصوصیت دارای مقدار و یک خصوصیت بنام خصوصیت کلاس می­باشد، برای ایجاد یک مدل داده بکار می­روند که این مدل داده در واقع توصیف کننده مفهوم و خصوصیات مجموعه داده ­هایی است که این مدل از روی آنها ایجاد شده است. مرحله دوم فرایند طبقه ­بندی اعمال یا بکارگیری مدل داده ایجاد شده بر روی داده ­هایی است که شامل تمام خصوصیات داده ­هایی که برای ایجاد مدل داده بکار گرفته­ شده ­اند، می­باشد، بجز خصوصیت کلاس این مقادیر که هدف از عمل طبقه ­بندی نیز تخمین مقدار این خصوصیت می­باشد.

 

الگوریتم­ها و روش های مختلفی برای طبقه ­بندی تاکنون پیشنهاد شده ­اند که برای مثال می­توان از روش های طبقه ­بندی با بهره گرفتن از درخت تصمیم، طبقه ­بندی بیزین، SVM ، طبقه ­بندی با بهره گرفتن از شبکه­ های عصبی، طبقه ­بندی مبتنی بر قواعد و … ]56[ نام برد. در اینجا ما قصد نداریم وارد مباحث مربوط به الگوریتم­ها و روش های طبقه ­بندی شویم و تنها روش طبقه ­بندی مبتنی بر قواعد را بدلیل استفاده از آن در فاز دوم پروژه در اینجا معرفی خواهیم نمود. در صورت نیاز به مطالعه بیشتر می­توانید به فصل ششم مرجع ]38[ مراجعه نمایید.

 

 

 

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)


فرم در حال بارگذاری ...

« پایان نامه ارشد:بررسی عملكرد خانواده در كنترل خشم نوجوانان دختر و پسر (15-18) شهر تهرانپایان نامه ارشد:شناسایی وطبقه بندی مواد زائد جامد و مایع صنعتی در صنایع فلزی و شیمیایی به روش UNEP و RCRA »
 
مداحی های محرم