بایند بنده رو ببخشید. باید اول می پرسیدم. شما رو به راه دوری فرستادم.
موضوع این هست: خوشه بندی دیتاست mushroom با الگوریتم OPTICS با فرض استفاده از داده های اصلی قدیمی و در نظر نگرفتن آپدیت جدیدش - چون دو حالت برای ما فرقی هم نمی کنه فقط احتمالاً مدل اندکی متفاوت میشه.
اما اشکال کار اینجا هستش که این دیتاست خودش برمبنای سمی بودن یا خوراکی بودن قارچ ها به دو دسته تقسیم شده و 22 ویژگی یا خصیصه هم ما در اون داریم که با کلاس مورد نظر میشه 23 ستون. نکته قابل عرض هم اینکه کلاس مربوطه در آغاز داده ها هستش و نه در پایان اون. عمل عقلانی در مورد چنین دیتاستی این هست که با یک روش طبقه بندی مثل J48 یا Ridor یک مدل بسازیم. در این مورد این الگوریتم ها فوق العاده سریع و دقیق (با دقت 100 درصد) عمل خواهد کرد.
با این مدل میشه بر اساس ویژگی ها یک قارچ سمی رو تشخیص داد. اما خوشه بندی که شما مدنظرتون هست. خوب حالا می می خواهیم داده ها رو برچه مبنایی با الگوریتم OPTICS خوشه بندی کنیم؟ این خیلی مهم هستش چون بر اون اساس یک سری داده هایی رو باید بزاریم تو Ignore List .
(مثلاً در همه حالات توصیه می کنم veiltype رو تو لیست Ignore بزارید چون کلاً تغییر نمی کنه و ثابت هستش)
خیلی بعید می دونم داده های ما با روش OPTICS قابل خوشه بندی به نحو کارا و کاربردپذیر باشند.
__________________
یک روز یک ماشین برای انتخابات ریاست جمهوری ثبت نام می کند
چه بخواهیم چه نخواهیم این اتفاق می افتد.
|