Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > داده کاوی > داده كاوی(Data mining)


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۲-۳۱-۱۳۹۰, ۱۰:۰۸ قبل از ظهر   #1 (لینک دائم)
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,337 تشكر در 3,127 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Cool تعاريف انبار‌داده

تعاريف انبار‌داده

Bill Inmon: مجموعه اي از داده‌ها ي موضوع گرا، مجتمع، غيرفرار و وابسته به زمان كه براي پشتيباني از تصميم گيري‌ها ي مديريتي مورد استفاده قرار مي گيرد. · نسخه اي از داده‌ها ي چند پايگاه داده، كه به منظور تسهيل پردازش و پرس و جوهاي كاربران طراحي شده است.· يك انبار داده ،داده‌هاي دلخواه را از يك يا چند منبع جمع آوري كرده و آنها را به موضوعاتي با و گروه‌ها‌ي اطلاعاتي تبديل مي كند، سپس آنها را به همراه اطلاعات زمان و تاريخ براي پشتيباني بهتر از تصميم گيري‌ها ذخيره مي كند، اين سيستم‌ها ، ديدهاي متعددي از اطلاعات براي طيف‌ها ي مختلف كاربران فراهم مي كند، قدرت اين مفهوم در آن است كه به كاربران اجازه تحليل‌ها و پرس و جوهاي گوناگون بر روي داده‌ها يي مي دهد كه قبل از آن هيچ ارتباطي با هم نداشتند. · جمع آوري ، پاكسازي انتقال داده از سيستمهاي عملياتي متعدد و آماده كردن اطلاعات حاصل براي تحليل و گزارش گيري كاربران نهايي ، انبار داري داده‌ها ناميده مي شود. · انبار داده پايگاه داده بزرگي است كه براي پاسخگويي به سوالات، ايجاد شده است.متناسب با انبار ، سوالات مذكور هم با هم فرق مي كنند.انبار مي تواند در اندازه‌ها ي بزرگ (در حدود گيگابايت) يا كوچكتر باشد.كاربران انبار ممكن است كاركنان داخلي ، افراد ناشناس شبكه‌ها و يا هر دو باشند.· انبار داده اساس هر سيستم نرم افزاري پشتيبان تصميم گيري است و براي اخذ داده‌ها‌ي DSS و كارايي بهتر پرس و جوها طراحي شده است. · انبار داده يك پايگاه داده موضوع گرا است كه به منظور دسترسي‌ها‌ي گسترده طراحي شده است. و ابزارهايي براي برآوردن نيازهاي اطلاعاتي مديران در همه سطوح سازمان آماده مي كند ، به بيان ديگر يك انبار داده به صورتي طراحي مي شود كه كاربران اطلاعات مورد نياز خود را شناسايي كنند و بتوانند با استفاده از ابزارهاي ساده اي به آن‌ها دسترسي داشته باشند. · يك انبار داده مخزني از اطلاعات مجتمع شده است كه براي انجام پرس و جو و تحليل‌ها آماده مي شود. چهار خصوصيت اصلي انبار دادهبر اساس تعريف Bill Inmon (که او را پدر سيستم‌هاي انبار داده ناميده‌اند) انبار داده، مجموعه اي از داده‌ها‌ي موضوع گرا، مجتمع، غيرفرار و وابسته به زمان است كه براي پشتيباني از تصميم گيري‌ها‌ي مديريتي مورد استفاده قرار مي گيرد. دراين بخش بر اساس اين تعريف، که معمول‌ترين و شناخته شده‌ترين تعريف انبار داده است، چهار خصوصيت اصلي انبار داده را مورد بررسي قرار مي‌دهيم· موضوع‌گرا:هر انبار داده داده‌هاي مرتبط با يک موضوع خاص را در خود نگاه مي‌دارد و اين داده‌ها را به منظور استخراج مفاهيم و نتايج خاصي به شكلي ويژه سازماندهي مي‌کند. بدين ترتيب سرعت جستجو‌ها در انبار بسيار بالا خواهد بود. انبار داده براي پاسخ‌گويي به پرسش‌هاي مختلف در مورد يک موضوع خاص بهينه‌سازي مي‌شود. · مجتمع: در سيستم‌هاي مختلف داده‌ها ممکن است از جنبه‌هاي مختلفي با هم نامتناسب باشند. مثلاً منابع داده در کشورهاي مختلف با زمان و تاريخ‌هاي مختلف ذخيره شده‌اند. و يا منابعي که از ماشين‌هاي مختلف هستند در اعداد، حروف و ديگر فيلدها متناسب با محدوديت‌هاي ماشين، سيستم‌عامل و تطابق با استانداردهاي مختلف متفاوت هستند. با توجه به مختلف بودن منابع انبار‌داده، قبل از ذخيره سازي آن‌ها در انبار داده براي تأمين يکپارچگي تکنيک‌هاي پاکسازي داده‌ها و مجتمع‌سازي به کار مي‌رود. با توجه به اين موضوع که داده‌ها زير نظر مديريت واحدي ذخيره سازي مي‌شوند، داده‌هاي کاملاً سازگاري خواهيم داشت که داشتن چنين سازگاري در ساير سيستم‌ها مثل سيستم‌هاي شبکه‌اي و توزيعي ناممکن است.· متغير با زمان: داده‌ها در انبار‌داده براي تهيه اطلاعات تاريخي( مثلاٌ براي 5 تا 10 سال پيش) به کار مي‌روند. هر ساختار کليدي در انبار داده شامل عنصر زمان يا همان مهر زماني است اين مهر زماني به عنوان کليدي به ساير جداول عمل مي‌کند. سيستم انبار داده داده‌ها هرگز به روز درآوري‌ نمي‌شوند. بلكه داده‌هاي جديد و يا تغيير يافته با مهرهاي زماني جديد به انبار اضافه مي‌شوند.· غير فرار: داده‌هاي انبار‌داده هميشه از لحاظ فيزيكي مجزا هستند ، و هيچگاه نيازي به تغيير و به روز درآوري نخواهند داشت. با توجه به اين موضوع، انبار داده مثل پايگاه داده‌هاي معمولي احتياجي به پردازش تراکنش، بازگرداندن فرايند و مکانيزم کنترل تصادم ندارد. علاوه بر اين نيازي به ايجاد و دسترسي انحصاري به داده‌ها نخواهيم داشت. فقط به دو فعاليت کليدي احتياج داريم : ú بارکردن داده‌ها ú دسترسي به داده‌ها بخش سه: تفاوت انبار داده و پايگاه داده وظيفه اصلي سيستم‌هاي پايگاه‌داده کاربردي بر‌خط ،پشتيباني از تراکنش‌هاي بر‌خط و پردازش کواِري است. اين سيستم‌ها، سيستم پردازش تراکنش بر‌خط(OLTP) ناميده مي‌شوند و بيشتر عمليات روزمره يک سازمان را پوشش مي‌‌دهند. از سوي ديگر انبار‌داده به کاربران يا knowledge workers خدماتي در نقش تحليل‌گر داده و تصميم گير نده ارائه مي‌‌کند. چنين سيستم‌هايي مي‌‌توانند داده را در قالب‌هاي مختلف براي هماهنگ کردن نيازهاي مختلف کاربران مختلف، سازماندهي و ارائه مي‌کند. اين سيستم‌ها با نام سيستم‌هاي پردازش تحليلي بر‌خط (OLAP) شناخته‌مي‌شوند. موارد تفاوت DB و DW· از لحاظ مدل‌هاي داده: پايگاه‌هاي داده براي مدل OLTP بهينه سازي شده‌است. که بر اساس مدل داده رابطه‌اي امکان پردازش تعداد زيادي تراکنش همروند، که اغلب حاوي رکورد‌هاي اندکي هستند را دارد. اما در انبارهاي داده که براي پردازش تحليلي بر خط، طراحي شده‌اند امکان پردازش تعداد کمي‌ کواِري پيچيده بر روي تعداد بسيار زيادي رکورد داده فراهم مي‌شود. سرورهاي OLAP هم مي‌توانند رابطه‌اي باشند ( ROLAP ) وهم مي‌توانند چند‌بعدي باشند (MOLAP ). · از لحاظ کاربران: کاربران پايگاه‌داده کارمندان دفتري و مسؤولان هستند در حالي‌که کاربران انبار‌داده مديران و تصميم‌گيرنده‌ها هستند. · از لحاظ عمليات قابل اجرا بر روي آن‌ها: عملياتي که بر روي پايگاه‌داد‌ها صورت مي‌‌گيرد، عموماٌ شامل عمليات ‌به ‌هنگام‌سازي است در حالي که عمل خواندن از انبار، عمده عمليات قابل اجرا بر روي انبار‌داده را تشکيل‌مي‌دهد.· از لحاظ مقدار داده‌ها: مقدار داده‌هاي يک پايگاه‌داده در حدود چند مگابايت تا چند گيگابايت است در حالي که اين مقدار در انبار داده در حدود چند گيگابايت تا چند ترابايت است.· از لحاظ زمان پرس و جو : انبار داده با استفاده از دو تکنيک خلاصه سازي و سلسله مراتبي کردن فيلدها سرعت انجام پرس‌وجو را بهبود بخشيده است.o فيلدهاي خلاصه سازي: مي‌توان تمام داده‌هاي مشابه را دريک آرايه و يک رديف ، و نه در يک جدول قرار داد. به‌ اين ترتيب، داده‌هاي مشابه به سرعت مي‌توانند خلاصه سازي شوند. اصولاً ساختار بعد اين امکان را فراهم کرده‌است که داده‌ها را بدون تکرار ذخيره نماييم و هر گاه به مشاهده آن‌ها در کنار هم احتياج داشتيم نيز بدون صرف حافظه و زمان قابل توجهي اين امر ميسر باشد.فيلدهاي سلسله مراتبي: ساختار سلسله مراتبي ابعاد در انبار داده‌هاي مبتني بر مدل داده چند‌ بعدي، پياده‌سازي شده است و اين امکان را فراهم آورده است که فيلدها بر اساس يک سلسله مراتب منطقي سازماندهي شوند. اين امر سرعت پرس و جوها را در انبار بسيار افزايش مي‌دهد. سلسله مراتب فيلدهاي يک بعد هميشه خطي نيست.

منبع
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده است:
e.saffar (۰۲-۱۵-۱۳۹۴)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۹:۱۹ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design