Artificial Intelligence - هوش مصنوعی

Artificial Intelligence - هوش مصنوعی (http://artificial.ir/intelligence/)
-   داده كاوی(Data mining) (http://artificial.ir/intelligence/forum61.html)
-   -   فرق آمار و داده كاوي (http://artificial.ir/intelligence/thread9292.html)

Astaraki ۰۲-۳۰-۱۳۹۰ ۱۰:۵۷ قبل از ظهر

فرق آمار و داده كاوي
 
فرق امار و داده كاوي
:113:

قابليت تعميم نتايج عمومي يکي از مشخصه‌هاي متمايز کننده داده­کاوي و تحليل آماري است. از آنجائي­که روش­هاي مرسوم تحليل آماري در رابطه با تحليل داده‌هاي اوليه‌اي است که در ارتباط با فرضيه تحقيقاتي ويژه‌اي جمع‌آوري شده‌اند؛ داده­کاوي مي‌تواند در ارتباط با داده‌هاي ثانويه‌اي که به دلايل مختلف جمع‌آوري شده است، باشد. به عنوان مثال داده‌هايي که در يک انبار داده جمع‌آوري شده است.از اين گذشته داده‌هاي آماري مي­توانند داده‌هاي حاصل از آزمايش­هاي مختلف باشد (مانند نتايج يک آزمايش که به طور تصادفي در رفتارهاي مختلف به همه واحدهاي آماري تخصيص داده مي‌شوند)، اما در داده­کاوي داده‌ها بيشتر مشاهده‌اي[1] مي­باشد.يك رويکرد ديگر براي بيان تفاوت تحليل‌هاي آماري با داده­کاوي، موضوع تحليل بالا به پايين[2] و پايين به بالا[3] است. روش بالا به پايين يا روش تحليـلي تاييد کننده[4]، نوعـي تاييد و تصديق کردن فرضيه­هاست و سعي در گسترش آگاهي در مورد يک پديده ويژه است. در روش­هاي آماري سعي مي­شود با استفاده از تحليل­هايي که مربوط به آمار هستند روابطي را که از قبل در بين داده­ها وجود داشته تاييد نمايند. درحالي­که در داده­کاوي که نوعي از تحليل پايين به بالا يا تحليل مکاشفه[5] ايست سعي در يافتن اطلاعات مفيد از اطلاعات قبلي که مورد توجه نبوده­اند دارد. هدف از جستجو در داده­ها در داده­کاوي بررسي ارتباط بين آنها و ايجاد نتايج و نظريه­هاي جديد است. نتايج بدست آمده از تحليل پايين به بالا سعي در معرفي ارتباط بين داده­ها دارد ولي نمي­تواند در مورد علت مفيد بودن اين کشفيات و ميزان ارزشمندي آنها توضيح دهد.
تحليل­هاي بالا به پايين که به عنوان ابزارهاي تاييد کننده شناخته مي­شوند در تاييد کشفيات و ارزيابي کيفيت تصميم­گيريهاي مبتني بر اين کشفيات مورد استفاده قرار مي­گيرند.
از جنبه ديگر مي­توان سه فرق اساسي را بين داده­کاوي و تحليل­هاي آماري قائل شد:1- داده­کاوي حجم بسيار زيادي از داده­ها را تحليل مي­کند. به علت محدوديت منابع رايانه­اي در يک لحظه نمي­توان به همه داده­ها دسترسي داشت تا بتوان تحليل­هاي آماري روي آنها انجام داد.2- ساختار داده­ها در بسياري از موارد به صورت مرسوم و رده­اي ذخيره نشده است (مانند داده­هاي موجود در اينترنت) بنابراين روش­هاي تحليل آماري در اين نوع داده­ها ضعف دارند.3- نتايج حاصل از داده­کاوي کم و بيش بايد مفيد و نتيجه بخش باشند. اين موضوع موجب مي­شود تا رويکرد اساسي در داده­کاوي به سمت تجاري بودن آن باشد.[1] - Observational[2] - Top- Down [3] - Bottom-up[4] - Confirmative[5] - explorative


منبع


زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۱۲:۴۳ بعد از ظهر ميباشد.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.