یک الگوریتم فازی برای یافتن الگوهای درختی پرتکرار
یک الگوریتم فازی برای یافتن الگوهای درختی پرتکرار
خلاصه مقاله:
يكي از ابزارهاي مهم براي مدل كردن داده ها و ارتباط بين آنها، درختها مي باشن د و مهمترين مسئله در كاوش بانكهاي اطلاعاتي درختي يافتن الگو هاي درختي پر تكر ار اس ت. الگوريتمهاي موجود معمولا تعداد درختهايي كه توليد مي كنند بسيار زياد است كه تعدادي از آنها داراي ارزش زيادي نمي باشن د. اين كم ارزش بودن اغلب به خاطر زيادي فاصله بين گره هاي الگو در درختهاي ورودي مي باشد كه علاوه بر غير قابل استفاده بودن الگو، موجب ك ند شدن الگوريتم نيز مي شود. از طرف ديگر اين الگوريتمها بعضي از درختهاي مفيد را پيدا نمي كنند. اين امر در شرايطي اتفاق مي افتد كه الگوها به جاي اينكه دقيقا همانند يكديگر باشند در حجم بالايي از گره ها و ساختار درختي با يكديگ رمشابهت داشته باشند. در مورد داده هايي كه الگوهاي دقيق آنها بسيار كم است اين الگوهاي تقريبي مي توانند ديد خوبي در مورد محتواي اطلاعات موجود در بانك اطلاعاتي درختي بدهن د. مشكل ديگر الگوريتمهاي موجود، در برخورد با داده هاي عدد ي (صحيح و اعشار ي) مشاهده مي گردد كه مقايسه دقيق اين نوع داده ها بهنگام استخراج الگو صحيح نمي باشد. در اين مقاله سعي خواهيم كرد تا مشكلات مذكور را با استفاده از راه حل هاي فازي برطرف نمائيم
كلمات كليدي:
داده هاي درختي، داده كاوي، الگوهاي درختي پر تكرار، داده هاي xml ، نظريه فازي
|