يادگيري تقويتي
چکيده:
بشر براي سازگار کردن خود با محيط اطرافش قادر است به يادگيري مهارت هاي جديد بپردازد. اگرچه سازگاري و يادگيري هر دو فرايندهايي پيچيده اند. به اعتقاد روانشناسان هر رفتاري که از ما سر مي زند معلول يادگيري است و انسان براي غلبه بر اين دگرگوني ها ناچار به يادگيري است. به عبارت ديگر يادگيري، توانايي بهبود رفتار بر اساس تجربيات و مشاهدات قبلي است. پس يادگيري ماشين به طور گسترده اي در هوش مصنوعي مطرح شد که سعي بر اين است که با يادگيري بتوان ربات هاي قابل انعطاف تر و هوشمندتر ايجاد کرد. به همين دليل در يادگيري ماشين هدف برنامه ريزي کردن رايانه ها به صورتي که بتوانند از تجربيات گذشته براي حل يک مسئله داده شده استفاده کنند.
به طور معمول يادگيري ماشين به سامانه اي که قادر است به طور خودکار ياد بگيرد و دانش هايش را يکپارچه کند برمي گردد. با مجهز شدن به ابزاري مثل يادگيري، يک سامانه مي تواند به طور پيوسته عملکردش را بهينه کند و کارايي آن بيشتر شود که در اين نوشتار در مورد يادگيري تقويتي که يکي از پرکاربردترين زمينه هاي تحقيقاتي در يادگيري ماشين است، سخن خواهيم گفت ...