Artificial Intelligence - هوش مصنوعی

Artificial Intelligence - هوش مصنوعی (http://artificial.ir/intelligence/)
-   داده كاوی(Data mining) (http://artificial.ir/intelligence/forum61.html)
-   -   داده کاوی توزيع شده (http://artificial.ir/intelligence/thread9290.html)

Astaraki ۰۲-۳۰-۱۳۹۰ ۱۰:۵۴ قبل از ظهر

داده کاوی توزيع شده
 
داده کاوی توزيع شده

داده­­کاوی توزيع شده عبارت است از کشف نيمه خودکار الگوهای پنهان موجود در داده­ها، در حالتی که داده­ها و يا مکانيزمهای استنتاج، به صورت توزيع شده باشند. غيرمتمرکز بودن داده­ها بدان معناست که داده­ها به صورت توزيع شده بين دو يا چند سايت بوده و هزينه انتقال تمام يا بخشی از داده­ها به يک سايت مرکزی، قابل صرفنظر نباشد. توزيع شده بودن مکانيزمهای استنتاج، به معنای لزوم لحاظ کردن هزينه ارتباط بين مکانيزمهای مختلف در حال استخراج دانش می­باشد. اين توزيع شدگی ممکن است به دلايل مختلفی از جمله ارائه شدن مکانيزم استخراج دانش در قالب يک سرويس اينترنتی و يا صرفا ناشی از توزيع شدگی داده­ها باشد. چنين رويکردی به داده­کاوی، برخلاف جهت کلی تحقيقات انجام شده است که به طور عمده به تکنيکهای متمرکز پرداخته و نه فقط بر تمرکز، که بر همگونی و ساختار مسطح (در مقابل ساختار رابطه­ای) داده­های هدف متکی می­باشند. مسائلی نظير استخراج دانش در حالت عدم دسترسی به تمام داده­های موجود، برقراری ارتباط موثر و بهينه با ساير مکانيزمهای در حال استخراج دانش و نيز تبادل دانش يا اطلاعات ميانی به جای اطلاعات خام، فقط تعدادی از مسائل اوليه داده­کاوی توزيع شده با توجه به تعريف آن می­باشند. بنابراين، داده­کاوی توزيع شده در عين حال که به عنوان راه حلی کليدی برای مشکلات اصلی پيش روی داده­کاوی مطرح می­باشد، خود سرمنشاء چالشها و مسائل متعددی گرديده است؛ حل مؤثر اين مشکلات منجر به استفاده هرچه بيشتر از داده­کاوی و ايجاد امکانات جديد و بهره­برداری از پتانسيلهای موجود در قلمروهائی خواهد شد که عليرغم نياز مبرم به داده­کاوی، استفاده بسيار محدودی از آن به عمل می­آورند. بحث داده­کاوی توزيع شده بطور کلی از دو جهت قابل بررسی می­باشد. اول حالتی که در آن داده­ها بصورت همسان بين پايگاههای مختلف توزيع شده­اند و داده­های هر پايگاه تمام خصوصيات را دارا هستند. در اينحالت داده­ها ممکن است ذاتا توزيع شده باشند و يا اينکه داده­ها متمرکز بدلايل امنيتی يا ... بين پايگاههای مختلف تقسيم شده باشند. اصطلاحا به اين حالت تقسيم شدن، تقسيم شده بصورت افقی (Horizontally Partitioned) نيز گفته می­شود که ما نيز در فاز دوم پروژه گونه­ای از اين نوع توزيع شدگی را خواهيم ديد. حالت دوم حالتی است که در آن داده­های موجود در هر پايگاه داده دارای خصوصيتهای مختلف می­باشند. معمولا در اين موارد داده­ها خود بين پايگاههای مختلف تقسيم گرديده­اند و ذاتا توزيع شده نيستند. از اينرو به اينحالت تقسيم شده عمودی (Vertically Partitioned) نيز گفته می­شود. برای ايجاد ارتباط بين خصوصيتهای مختلفی که در پايگاههای مختلف نگهداری می­شوند اما متعلق به يک داده هستند، معمولا يک خصوصيت مشترک که بعنوان شناسه مورد استفاده قرار می­گيرد، بين تمام پايگاههای مختلف نگهداری می­شود که رکوردهای مختلف را بهم ارتباط می­دهد. در داده­کاوی توزيع شده نيز مساله کشف و استخراج دانش مشابه داده­کاوی عادی در زمينه­های خوشه­بندی توزيع شده، کشف قواعد وابستگی بصورت توزيع شده و طبقه­بندی توزيع شده (که با نام يادگيری توزيع شده طبقه­بند هم از آن نام برده می­شود) مورد تحقيق و بررسی قرار دارد،. ضمن اينکه در بحث داده­کاوی توزيع شده، مساله مربوط به محرمانگی داده­ها (Privacy Preserving) حتما بايد مدنظر قرار گيرد.

منبع


زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۲:۱۴ قبل از ظهر ميباشد.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.