نقل قول:
نوشته اصلي بوسيله kamran_kenzo
داده x همون داده یست که شما میخواید دسته بندی کنید. مگه مسئله تون دسته بندی نیست؟؟ خب پس باید یکسری داده داشته باشید که بخشی از آن به عنوان داده آموزشی و بخشی به عنوان داده تست استفاده می شود. شما داده x را از داده های تست انتخاب می کنید و فاصله آن را از داده های آموزشی محاسبه می کنید.
در بعضی مسائل داده های تست و آموزش جداگانه وجود دارند و در بعضی دیگر مسائل یک مجموعه داده ارائه شده است که شما باید آن را به داده ی آموزشی و داده ی تست تقسیم کنید. مثلا اگر شما ۵۰۰ تا داده باشید می توانید ۳۰۰ تا را برای آموزش و ۲۰۰ تا برای تست استفاده کنید(نسبت تعداد داده های آموزشی به داده های تست در هر مسئله متفاوت است و اینجا فقط برای روشن شدن مسئله اعداد ۳۰۰ و ۲۰۰ بکار رفته است. ).
موفق باشید
|
بله دسته بندیه
کاملا متوجه شدم یک دنیا ممنون