Regression: the output variable takes continuous values.
Classification: the output variable takes class labels.
متغیر خروجی در مسائل رگرسیون، مقادیر پیوسته را میگیرد
اما در مساله دسته بندی، متغیر خروجی مقادیر گسسته(برچسب کلاسها) را میگیرد.
بنابراین مسائل رگرسیون بیشتر برای پیش بینی و برازش کاربرد دارد اما مسائل دسته بندی برای دسته بندی اشیاء!
مثلا شما داده هایی را در اختیار دارید که دارای چند بعد(ویژگی) است مثلا میزان فشار خون و قند خون و ... با این اطلاعات میخواهید ببینید که آیا فردی بیماری دارد یا نه (مثلا دیابت). خوب این مساله دسته بندی است برچسبها (بلی و خیر)
اما مثلا داده هایی را دارید که دارای چند بعد(ویژگی) است و بر اساس آن میخواهید قیمت خانه را تعیین کنید که مقادیر آن دیگر گسسته نیست و میتواند مثلا از 30 میلیون تا 10 میلیارد متغیر باشد.
یا پیش بینی قیمت طلا، نفت و...