تعاريف انبارداده
Bill Inmon: مجموعه اي از دادهها ي موضوع گرا، مجتمع، غيرفرار و وابسته به زمان كه براي پشتيباني از تصميم گيريها ي مديريتي مورد استفاده قرار مي گيرد. · نسخه اي از دادهها ي چند پايگاه داده، كه به منظور تسهيل پردازش و پرس و جوهاي كاربران طراحي شده است.· يك انبار داده ،دادههاي دلخواه را از يك يا چند منبع جمع آوري كرده و آنها را به موضوعاتي با و گروههاي اطلاعاتي تبديل مي كند، سپس آنها را به همراه اطلاعات زمان و تاريخ براي پشتيباني بهتر از تصميم گيريها ذخيره مي كند، اين سيستمها ، ديدهاي متعددي از اطلاعات براي طيفها ي مختلف كاربران فراهم مي كند، قدرت اين مفهوم در آن است كه به كاربران اجازه تحليلها و پرس و جوهاي گوناگون بر روي دادهها يي مي دهد كه قبل از آن هيچ ارتباطي با هم نداشتند. · جمع آوري ، پاكسازي انتقال داده از سيستمهاي عملياتي متعدد و آماده كردن اطلاعات حاصل براي تحليل و گزارش گيري كاربران نهايي ، انبار داري دادهها ناميده مي شود. · انبار داده پايگاه داده بزرگي است كه براي پاسخگويي به سوالات، ايجاد شده است.متناسب با انبار ، سوالات مذكور هم با هم فرق مي كنند.انبار مي تواند در اندازهها ي بزرگ (در حدود گيگابايت) يا كوچكتر باشد.كاربران انبار ممكن است كاركنان داخلي ، افراد ناشناس شبكهها و يا هر دو باشند.· انبار داده اساس هر سيستم نرم افزاري پشتيبان تصميم گيري است و براي اخذ دادههاي DSS و كارايي بهتر پرس و جوها طراحي شده است. · انبار داده يك پايگاه داده موضوع گرا است كه به منظور دسترسيهاي گسترده طراحي شده است. و ابزارهايي براي برآوردن نيازهاي اطلاعاتي مديران در همه سطوح سازمان آماده مي كند ، به بيان ديگر يك انبار داده به صورتي طراحي مي شود كه كاربران اطلاعات مورد نياز خود را شناسايي كنند و بتوانند با استفاده از ابزارهاي ساده اي به آنها دسترسي داشته باشند. · يك انبار داده مخزني از اطلاعات مجتمع شده است كه براي انجام پرس و جو و تحليلها آماده مي شود. چهار خصوصيت اصلي انبار دادهبر اساس تعريف Bill Inmon (که او را پدر سيستمهاي انبار داده ناميدهاند) انبار داده، مجموعه اي از دادههاي موضوع گرا، مجتمع، غيرفرار و وابسته به زمان است كه براي پشتيباني از تصميم گيريهاي مديريتي مورد استفاده قرار مي گيرد. دراين بخش بر اساس اين تعريف، که معمولترين و شناخته شدهترين تعريف انبار داده است، چهار خصوصيت اصلي انبار داده را مورد بررسي قرار ميدهيم· موضوعگرا:هر انبار داده دادههاي مرتبط با يک موضوع خاص را در خود نگاه ميدارد و اين دادهها را به منظور استخراج مفاهيم و نتايج خاصي به شكلي ويژه سازماندهي ميکند. بدين ترتيب سرعت جستجوها در انبار بسيار بالا خواهد بود. انبار داده براي پاسخگويي به پرسشهاي مختلف در مورد يک موضوع خاص بهينهسازي ميشود. · مجتمع: در سيستمهاي مختلف دادهها ممکن است از جنبههاي مختلفي با هم نامتناسب باشند. مثلاً منابع داده در کشورهاي مختلف با زمان و تاريخهاي مختلف ذخيره شدهاند. و يا منابعي که از ماشينهاي مختلف هستند در اعداد، حروف و ديگر فيلدها متناسب با محدوديتهاي ماشين، سيستمعامل و تطابق با استانداردهاي مختلف متفاوت هستند. با توجه به مختلف بودن منابع انبارداده، قبل از ذخيره سازي آنها در انبار داده براي تأمين يکپارچگي تکنيکهاي پاکسازي دادهها و مجتمعسازي به کار ميرود. با توجه به اين موضوع که دادهها زير نظر مديريت واحدي ذخيره سازي ميشوند، دادههاي کاملاً سازگاري خواهيم داشت که داشتن چنين سازگاري در ساير سيستمها مثل سيستمهاي شبکهاي و توزيعي ناممکن است.· متغير با زمان: دادهها در انبارداده براي تهيه اطلاعات تاريخي( مثلاٌ براي 5 تا 10 سال پيش) به کار ميروند. هر ساختار کليدي در انبار داده شامل عنصر زمان يا همان مهر زماني است اين مهر زماني به عنوان کليدي به ساير جداول عمل ميکند. سيستم انبار داده دادهها هرگز به روز درآوري نميشوند. بلكه دادههاي جديد و يا تغيير يافته با مهرهاي زماني جديد به انبار اضافه ميشوند.· غير فرار: دادههاي انبارداده هميشه از لحاظ فيزيكي مجزا هستند ، و هيچگاه نيازي به تغيير و به روز درآوري نخواهند داشت. با توجه به اين موضوع، انبار داده مثل پايگاه دادههاي معمولي احتياجي به پردازش تراکنش، بازگرداندن فرايند و مکانيزم کنترل تصادم ندارد. علاوه بر اين نيازي به ايجاد و دسترسي انحصاري به دادهها نخواهيم داشت. فقط به دو فعاليت کليدي احتياج داريم : ú بارکردن دادهها ú دسترسي به دادهها بخش سه: تفاوت انبار داده و پايگاه داده وظيفه اصلي سيستمهاي پايگاهداده کاربردي برخط ،پشتيباني از تراکنشهاي برخط و پردازش کواِري است. اين سيستمها، سيستم پردازش تراکنش برخط(OLTP) ناميده ميشوند و بيشتر عمليات روزمره يک سازمان را پوشش ميدهند. از سوي ديگر انبارداده به کاربران يا knowledge workers خدماتي در نقش تحليلگر داده و تصميم گير نده ارائه ميکند. چنين سيستمهايي ميتوانند داده را در قالبهاي مختلف براي هماهنگ کردن نيازهاي مختلف کاربران مختلف، سازماندهي و ارائه ميکند. اين سيستمها با نام سيستمهاي پردازش تحليلي برخط (OLAP) شناختهميشوند. موارد تفاوت DB و DW· از لحاظ مدلهاي داده: پايگاههاي داده براي مدل OLTP بهينه سازي شدهاست. که بر اساس مدل داده رابطهاي امکان پردازش تعداد زيادي تراکنش همروند، که اغلب حاوي رکوردهاي اندکي هستند را دارد. اما در انبارهاي داده که براي پردازش تحليلي بر خط، طراحي شدهاند امکان پردازش تعداد کمي کواِري پيچيده بر روي تعداد بسيار زيادي رکورد داده فراهم ميشود. سرورهاي OLAP هم ميتوانند رابطهاي باشند ( ROLAP ) وهم ميتوانند چندبعدي باشند (MOLAP ). · از لحاظ کاربران: کاربران پايگاهداده کارمندان دفتري و مسؤولان هستند در حاليکه کاربران انبارداده مديران و تصميمگيرندهها هستند. · از لحاظ عمليات قابل اجرا بر روي آنها: عملياتي که بر روي پايگاهدادها صورت ميگيرد، عموماٌ شامل عمليات به هنگامسازي است در حالي که عمل خواندن از انبار، عمده عمليات قابل اجرا بر روي انبارداده را تشکيلميدهد.· از لحاظ مقدار دادهها: مقدار دادههاي يک پايگاهداده در حدود چند مگابايت تا چند گيگابايت است در حالي که اين مقدار در انبار داده در حدود چند گيگابايت تا چند ترابايت است.· از لحاظ زمان پرس و جو : انبار داده با استفاده از دو تکنيک خلاصه سازي و سلسله مراتبي کردن فيلدها سرعت انجام پرسوجو را بهبود بخشيده است.o فيلدهاي خلاصه سازي: ميتوان تمام دادههاي مشابه را دريک آرايه و يک رديف ، و نه در يک جدول قرار داد. به اين ترتيب، دادههاي مشابه به سرعت ميتوانند خلاصه سازي شوند. اصولاً ساختار بعد اين امکان را فراهم کردهاست که دادهها را بدون تکرار ذخيره نماييم و هر گاه به مشاهده آنها در کنار هم احتياج داشتيم نيز بدون صرف حافظه و زمان قابل توجهي اين امر ميسر باشد.فيلدهاي سلسله مراتبي: ساختار سلسله مراتبي ابعاد در انبار دادههاي مبتني بر مدل داده چند بعدي، پيادهسازي شده است و اين امکان را فراهم آورده است که فيلدها بر اساس يک سلسله مراتب منطقي سازماندهي شوند. اين امر سرعت پرس و جوها را در انبار بسيار افزايش ميدهد. سلسله مراتب فيلدهاي يک بعد هميشه خطي نيست.
منبع