نقل قول:
نوشته اصلي بوسيله zahra213
این داده x رو باید بر چه اساسی انتخاب کنم؟
یعنی یه سمپل رو در نظر بگیرم فاصلشو با بقیه پیدا کنم و این کارو با یه حلقه برای 1000 تا داده ام انجام بدم؟درست متوجه شدم؟
خیلی ممنون از راهنماییتون مهندس
|
داده x همون داده یست که شما میخواید دسته بندی کنید. مگه مسئله تون دسته بندی نیست؟؟ خب پس باید یکسری داده داشته باشید که بخشی از آن به عنوان داده آموزشی و بخشی به عنوان داده تست استفاده می شود. شما داده x را از داده های تست انتخاب می کنید و فاصله آن را از داده های آموزشی محاسبه می کنید.
در بعضی مسائل داده های تست و آموزش جداگانه وجود دارند و در بعضی دیگر مسائل یک مجموعه داده ارائه شده است که شما باید آن را به داده ی آموزشی و داده ی تست تقسیم کنید. مثلا اگر شما ۵۰۰ تا داده باشید می توانید ۳۰۰ تا را برای آموزش و ۲۰۰ تا برای تست استفاده کنید(نسبت تعداد داده های آموزشی به داده های تست در هر مسئله متفاوت است و اینجا فقط برای روشن شدن مسئله اعداد ۳۰۰ و ۲۰۰ بکار رفته است. ).
موفق باشید