نمايش پست تنها
قديمي ۰۲-۳۰-۱۳۹۰, ۱۰:۵۴ قبل از ظهر   #1 (لینک دائم)
Astaraki Female
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,337 تشكر در 3,127 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Cool داده کاوی توزيع شده

داده کاوی توزيع شده

داده­­کاوی توزيع شده عبارت است از کشف نيمه خودکار الگوهای پنهان موجود در داده­ها، در حالتی که داده­ها و يا مکانيزمهای استنتاج، به صورت توزيع شده باشند. غيرمتمرکز بودن داده­ها بدان معناست که داده­ها به صورت توزيع شده بين دو يا چند سايت بوده و هزينه انتقال تمام يا بخشی از داده­ها به يک سايت مرکزی، قابل صرفنظر نباشد. توزيع شده بودن مکانيزمهای استنتاج، به معنای لزوم لحاظ کردن هزينه ارتباط بين مکانيزمهای مختلف در حال استخراج دانش می­باشد. اين توزيع شدگی ممکن است به دلايل مختلفی از جمله ارائه شدن مکانيزم استخراج دانش در قالب يک سرويس اينترنتی و يا صرفا ناشی از توزيع شدگی داده­ها باشد. چنين رويکردی به داده­کاوی، برخلاف جهت کلی تحقيقات انجام شده است که به طور عمده به تکنيکهای متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطه­ای) داده­های هدف متکی می­باشند. مسائلی نظير استخراج دانش در حالت عدم دسترسی به تمام داده­های موجود، برقراری ارتباط موثر و بهينه با ساير مکانيزمهای در حال استخراج دانش و نيز تبادل دانش يا اطلاعات ميانی به جای اطلاعات خام، فقط تعدادی از مسائل اوليه داده­کاوی توزيع شده با توجه به تعريف آن می­باشند. بنابراين، داده­کاوی توزيع شده در عين حال که به عنوان راه حلی کليدی برای مشکلات اصلی پيش روی داده­کاوی مطرح می­باشد، خود سرمنشاء چالشها و مسائل متعددی گرديده است؛ حل مؤثر اين مشکلات منجر به استفاده هرچه بيشتر از داده­کاوی و ايجاد امکانات جديد و بهره­برداری از پتانسيلهای موجود در قلمروهائی خواهد شد که عليرغم نياز مبرم به داده­کاوی، استفاده بسيار محدودی از آن به عمل می­آورند. بحث داده­کاوی توزيع شده بطور کلی از دو جهت قابل بررسی می­باشد. اول حالتی که در آن داده­ها بصورت همسان بين پايگاههای مختلف توزيع شده­اند و داده­های هر پايگاه تمام خصوصيات را دارا هستند. در اينحالت داده­ها ممکن است ذاتا توزيع شده باشند و يا اينکه داده­ها متمرکز بدلايل امنيتی يا ... بين پايگاههای مختلف تقسيم شده باشند. اصطلاحا به اين حالت تقسيم شدن، تقسيم شده بصورت افقی (Horizontally Partitioned) نيز گفته می­شود که ما نيز در فاز دوم پروژه گونه­ای از اين نوع توزيع شدگی را خواهيم ديد. حالت دوم حالتی است که در آن داده­های موجود در هر پايگاه داده دارای خصوصيتهای مختلف می­باشند. معمولا در اين موارد داده­ها خود بين پايگاههای مختلف تقسيم گرديده­اند و ذاتا توزيع شده نيستند. از اينرو به اينحالت تقسيم شده عمودی (Vertically Partitioned) نيز گفته می­شود. برای ايجاد ارتباط بين خصوصيتهای مختلفی که در پايگاههای مختلف نگهداری می­شوند اما متعلق به يک داده هستند، معمولا يک خصوصيت مشترک که بعنوان شناسه مورد استفاده قرار می­گيرد، بين تمام پايگاههای مختلف نگهداری می­شود که رکوردهای مختلف را بهم ارتباط می­دهد. در داده­کاوی توزيع شده نيز مساله کشف و استخراج دانش مشابه داده­کاوی عادی در زمينه­های خوشه­بندی توزيع شده، کشف قواعد وابستگی بصورت توزيع شده و طبقه­بندی توزيع شده (که با نام يادگيری توزيع شده طبقه­بند هم از آن نام برده می­شود) مورد تحقيق و بررسی قرار دارد،. ضمن اينکه در بحث داده­کاوی توزيع شده، مساله مربوط به محرمانگی داده­ها (Privacy Preserving) حتما بايد مدنظر قرار گيرد.

منبع
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده است:
mehdinajafinia (۰۴-۲-۱۳۹۰)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online