نقل قول:
نوشته اصلي بوسيله ttaheri
سلام دوستان
پایان نامه من در مورد داده کاوی تو شاخه ای از پزشکی هست. یه سری داده دارم که تعداد ویژگی ها زیاد هستن. اما من داده ها رو نرمالایز کردم تو محدوده صفر و یک و نویزها هم حذف شدن. هدف این کار موفقیت یا عدم موفقیت این عمل هست. یعنی یه سری داده وجود داره که بیمار در نهایت عملش موفقیت آمیز میشه یا ناموفق. حالا من باید ارتباط بین داده ها رو پیدا کنم. یه سری از ویژگی ها خودشون صفر یا یک هستن. اما بخش زیادی از ویژگی ها از نظر پزشکی تنوعشون زیاده. مثلا سن یا یه سری از ویژگی های تخصصی پزشکی. نمودار 2 به 2 به صورت سه بعدی برای ویژگی ها ترسیم کردم تو متلب اما خوب تحلیلش خیلی سخته. نمی دونم از چه روشی باید استفاده کنم که بفهمم این ویژگی ها چه تاثیری روی همدیگه میذارن و در نهایت چه تاثیری رو نتیجه خواهند گذاشت؟
ممنون میشم اگه راهنماییم کنین.
|
سلام دوست عزیز ...
ظاهراً خیلی وقته که این پست را ارسال کردید و بی پاسخ مانده است. با اینکه نمیدانم تاکنون مشکل شما برطرف شده یا نه پاسخ میدهم شاید مفید واقع شود (حداقل برای دیگران).
تردیدی وجود ندارد که خروجی های بصری، فهم اطلاعات نهفته در داده ها را آسان می کنند؛ اما به شرط اینکه ابعاد و پیچیدگی های موجود در داده ها زیاد نباشند. در مورد داده های شما صرف نظر از اینکه با چه نرم افزاری کار میکنید، باید مدل سازی خوبی انجام دهید تا بتوانید نتیجه خوبی از کارتان بگیرید.
در رابطه با داده کاوی، الگوریتم ها و مجموعه قوانین تولید شده توسط آنها هستند که خروجی مدل را ارائه می کنند و در نهایت تحلیل توسط کارشناس خبره در آن زمینه انجام می شود. در واقع، تحلیل از روی نمودار صرفاً یک کار آماری است نه داده کاوی؛ هر چند که به عملیات داده کاوی کمک می کند اما کار اصلی و هنر داده کاوی چیز دیگری است.
به عنوان یک راهنمایی: برای مدل سازی داده هایتان بهتر است از الگوریتم های درخت تصمیم استفاده کنید. مثلاً الگوریتم CART نتایج خوبی را از داده های با ابعاد زیاد (مثلاً 60 بعد) ارائه میکند. بنده با نرم افزار کلمنتاین کار کرده ام. در صورت استفاده از الگوریتم CART در این نرم افزار، امکان تولید مجموعه قوانین (Rule Set) از خروجی الگوریتم نیز وجود دارد. فعلاً در مورد نرم افزارهای دیگر اطلاعات چندانی ندارم.
موفق باشید...