روشی برای توزين بار جهت افزايش کارايی در داده کاوی موازی
چکيده:
يافتن الگوهاي تكرارشونده در داده كاوي، خصوصاً در مجموعه داده هاي پر حجم، از اهميت بالايي برخوردار است. يكي از الگوريت مهاي متوالي مورد استفاده براي يافتن الگوهاي تكرارشونده FP-Growth م يباشد. اجراي موازي اين الگوريتم به منظور افزايش سرعت و كارايي آن مستلزم داشتن روشي كارا براي توزين بار بين پردازشگرها مي باشد. در اين مقاله روشي جديد به نام "شمارش گره" براي توزين بار پيشنهاد شده، كه بر اساس تعداد گره هاي درخت تراكنش هاي غربا لشده عمل م يكند. اين الگوريتم عناصر تكرارشونده به طول يك را به گونه اي ميان پردازنده ها تقسيم م يكند كه مدت زمان كل كاوش، نزديك به ميانگين زمان كاوش پردازنده هاي مختلف باشد. نتايج شبيه سازي الگوريتم كه با استفاده از داده هاي نمونه تصادفي تهيه و ارايه گرديده، نشان م يدهد كه روش پيشنهادي به طور قابل توجهي باعث افزايش كارايي شده است. در اين شبيه سازي معماري سخت افزاري خاصي لحاظ نشده لذا موضوعات متنوع ذيربط پردازش موازي مي تواند براي كارهاي آينده منظور شود.