![]() |
خوشه بندي optics
سلام.دوستان من در وكا ديتاستمو خوشه بندي optics ميكنم اما هيچ نتيجه اي نمياره و دادههم خوشه بندي نميشن كسي ميدونه مشكلش چيه؟ممنون از راهنماييتون.
|
احتمالا همبستگی داده های شما بالا هست.
|
سلام.آخه ديتا ست من از سايت uci استادمون داده خوشه بندي كنيم فك نكنم اين مشكلش باشه يه جا خوندم مال ورژن وكاست از من ورژن3.6 هست امكان داره اين مشكلش باشه.ممنون.
|
مهمترین نکته در خوشه بندی OPTICS این هستش که داده های باید دارای چگالی مناسبی باشند که وقتی سیستم داده ها رو به لیست مرتب تبدیل می کنه مبنا قرار می گیره.
(البته کاربران نرم افزارهایی مثل وکا این موضوع رو نمی بینند و فقط به نتیجه اجرا الگوریتم دسترسی دارند) اگر چگالی داده های شما خیلی زیاد یا خیلی کم باشند به نحوی که داده ها دارای همبستگی خیلی زیاد یا خیلی کمی باشند در خوشه بندی به مشکل می خورید. در مورد فرمایش شما درباره دیتاست های UCI باید عرض کنم، خب این ها داده هستند و ممکنه در همون حالتی که قرار دارند (بدون اعمال فیلتر یا انتقال و نرمال سازی) دارای همبستگی باشند یا با اعمال انواع مختلف عملیات همبستگی داده های نهایی که به الگوریتم وارد کردید شدیدا بالا یا شدیدا پایین رفته باشه!؟! امیدوارم دیتاستی مناسبی انتخاب کرده باشید:دی در مورد ورژن 3.6 باید عرض کنم الگوریتم خوشه بندی OPTICS قدیمی تر از این حرفها هستش که در نرم افزار معروفی مثل وکا که بسیاری از انواع الگوریتم ها رو پشتیبانی میکنه، پیاده نشده باشه! البته دقیقا اطلاع ندارم از چه ورژنی این خوشه بندی درش درج شده. اما نکته ای که به نظرم از همه توضیحات بالا مهمتره اینه که در وکا اگر خروجی OPTICS نمایشی مرتب شده از داده ها بود به شکلی که شما عبارت r_dist:UNDEFINED رو در حداقل یکی از نمونه هاتون دیدید به سربرگ پیشپردازش برید و ستون های (یا همون ویژگی های) مورد نظرتون رو تیک دارد کنید. نتیجه در مواقعی شدیدا تفاوت خواهد کرد. |
سلام.من تمامي نمونه هاي ديتا ستم c_dist: UNDEFINED r_dist: UNDEFINED است و همون كاري كه شما گفتيد را هم انجام دادم يعني در سربرگ پيش پردازش تمامي ويژگيها رو تيكدار كردم ولي بازم ويژگيها تغييري نكرد؟
|
تمام نمونه ها!
البته بنده عرض کردم برید تمام ستون هایی که می خواید رو تیک بزنید نه کل ستون ها رو! سعی کنید ستون به ستون جلو برید و حتی المقدور داده های بی اهمیت یا کم اهمیت رو انتخاب نکنید. ممکن هست داده های شما نیاز به فیلتر داشته باشن یا اساسا چگالی نمونه ها دیتاست شما در فضای حالت مسئله به نحوی باشه که با این الگوریتم نتونید به نتیجه برسید. (یا به نتایج نامطلوبی برسید!) از کدوم دیتا ست استفاده می کنید؟ |
سلام.ممنون از پاسخگوييتون .اسم ديتاست mushroom هست.
|
بایند بنده رو ببخشید. باید اول می پرسیدم. شما رو به راه دوری فرستادم.
موضوع این هست: خوشه بندی دیتاست mushroom با الگوریتم OPTICS با فرض استفاده از داده های اصلی قدیمی و در نظر نگرفتن آپدیت جدیدش - چون دو حالت برای ما فرقی هم نمی کنه فقط احتمالاً مدل اندکی متفاوت میشه. اما اشکال کار اینجا هستش که این دیتاست خودش برمبنای سمی بودن یا خوراکی بودن قارچ ها به دو دسته تقسیم شده و 22 ویژگی یا خصیصه هم ما در اون داریم که با کلاس مورد نظر میشه 23 ستون. نکته قابل عرض هم اینکه کلاس مربوطه در آغاز داده ها هستش و نه در پایان اون. عمل عقلانی در مورد چنین دیتاستی این هست که با یک روش طبقه بندی مثل J48 یا Ridor یک مدل بسازیم. در این مورد این الگوریتم ها فوق العاده سریع و دقیق (با دقت 100 درصد) عمل خواهد کرد. با این مدل میشه بر اساس ویژگی ها یک قارچ سمی رو تشخیص داد. اما خوشه بندی که شما مدنظرتون هست. خوب حالا می می خواهیم داده ها رو برچه مبنایی با الگوریتم OPTICS خوشه بندی کنیم؟ این خیلی مهم هستش چون بر اون اساس یک سری داده هایی رو باید بزاریم تو Ignore List . (مثلاً در همه حالات توصیه می کنم veiltype رو تو لیست Ignore بزارید چون کلاً تغییر نمی کنه و ثابت هستش) خیلی بعید می دونم داده های ما با روش OPTICS قابل خوشه بندی به نحو کارا و کاربردپذیر باشند. |
زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۳:۴۷ بعد از ظهر ميباشد. |
Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.