Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > یادگیری (Learning) > يادگيري تقويتي(Reinforcement Learning)


 
تبليغات سايت
فیلم های آموزشی
ژنتیک و محاسبات تکاملی
فیلم های آموزشی
شبکه عصبی مصنوعی
فیلم های آموزشی
الگوریتم های فراابتکاری
فیلم های آموزشی
داده کاوی
فیلم های آموزشی
سیستم های فازی
فیلم های آموزشی
آموزش متلب
آموزش الگوریتم TLBO آموزش شبکه عصبی مصنوعی آموزش الگوریتم کرم شب تاب آموزش داده کاوی در متلب آموزش سیستم های فازی آموزش برنامه نویسی متلب
آموزش الگوریتم PSO آموزش شبکه عصبی گازی آموزش الگوریتم مورچگان آموزش آمار و داده کاوی آموزش استنتاج فازی در متلب آموزش رابط گرافیکی در متلب
آموزش ترکیب ژنتیک و PSO آموزش شبکه عصبی رقابتی آموزش الگوریتم علف هرز آموزش وب کاوی آموزش خوشه بندی آموزش شبیه سازی با سیمولینک
آموزش الگوریتم BBO آموزش شبکه عصبی MLP آموزش الگوریتم جهش قورباغه آموزش داده کاوی RapidMiner آموزش نگارش آکادمیک آموزش تحلیل آماری در متلب
آموزش الگوریتم فرهنگی آموزش شبکه عصبی RBF آموزش الگوریتم کرم شب تاب آموزش مبانی داده کاوی تنظیم ضرایب PID در متلب آموزش واقعیت مجازی در متلب
آموزش انتخاب ویژگی آموزش شبکه عصبی LVQ آموزش الگوریتم زنبور ها آموزش کاهش تعداد رنگ تحلیل پوششی داده ها در متلب آموزش محاسبات نمادین در متلب
آموزش الگوریتم ژنتیک آموزش شبکه عصبی GMDH آموزش کلونی زنبور مصنوعی آموزش کاهش ابعاد سیستم فازی عصبی ANFIS آموزش زبان C
الگوریتم رقابت استعماری شبکه عصبی با نروسولوشن آموزش الگوریتم ژنتیک کاوش قواعد وابستگی بهینه سازی مقید در متلب آموزش زبان C++
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۷-۲۳-۱۳۸۸, ۱۲:۰۱ بعد از ظهر   #1 (لینک دائم)
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,464
تشكرها: 754
16,285 تشكر در 3,124 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Exclamation يادگيري تقويتي

یادگیری تقویتی

حیوانات ، انسان ها ، اتومات ها و .. از خود رفتار های مختلفی در محیطی که آن ها را احاطه کرده ، در شرایط مختلف ، از خود نشان می دهند.

آن ها کارهای مختلفی را به عنوان باز خورد در جواب ورودی هایی که از محیط می گیرند انجام می دهند. بعضی از این عامل ها رفتار های خود را در طول زمان عوض می کنند

آن ها ممکن است با دادن ورودی های یکسان ، عمل های متفاوتی نسبت به حرکت های قبلی خود انجام دهند. چنین عاملی یاد می گیرد. شاخه یادگیری ماشین به مطالعه الگوریتم های

یادگیری که مشخص می کند تغییر در ورودی ها چگونه در رفتار عامل تغییر ایجاد می کند می پردازد.

الگوریتم های یادگیری به 3 دسته تقسیم می شوند :

با ناظر

بی ناظر

تقویتی

در یادگیری با ناظر ، عامل با یک سری ورودی و خروجی مشخص آموزش داده می شود

در یادگیری بی ناظر ، عامل از محیط ، هیچ باز خوردی دریافت نمی کند. در مقابل عامل سعی می کند تا وردی ها را به صورت خوشه ها ، طبقه بندی ها یا ... بازسازی کند.

و اعمال خود را بر طبق این طبقه بندی ها و نتیجه گیری ها انجام دهد.

اما در یادگیری تقویتی ...

معرفی یادگیری تقویتی

برنامه نویسی پویا

اجزا یک سیستم یادگیری تقویتی

محیط

تابع پاداش

تابع مقدار

Q-Learning

معرفی

الگوریتم یادگیری

مثالی از یک عامل

مثالی از برج هانوی

اثبات همگرایی

یادگیری Q برای MDP غیرقطعی

روش های مونت کارلو در یادگیری تقویتی

ویژگیها

سیاست first visit MC

کنترل مونت کارلو

همگرایی مونت کارلو

on line policy و off line policy

منابع
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
aimaryam (۰۷-۱۷-۱۳۸۹), ramy_ai (۱۰-۳-۱۳۸۹), Sina.picasso (۰۵-۳۱-۱۳۹۰), ازهار (۱۲-۱۳-۱۳۹۰)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۰۳-۴-۱۳۸۹, ۰۶:۵۶ بعد از ظهر   #2 (لینک دائم)
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,464
تشكرها: 754
16,285 تشكر در 3,124 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Wink مقاله آموزشي

يادگيري تقويتي

چکيده:
بشر براي سازگار کردن خود با محيط اطرافش قادر است به يادگيري مهارت هاي جديد بپردازد. اگرچه سازگاري و يادگيري هر دو فرايندهايي پيچيده اند. به اعتقاد روانشناسان هر رفتاري که از ما سر مي زند معلول يادگيري است و انسان براي غلبه بر اين دگرگوني ها ناچار به يادگيري است. به عبارت ديگر يادگيري، توانايي بهبود رفتار بر اساس تجربيات و مشاهدات قبلي است. پس يادگيري ماشين به طور گسترده اي در هوش مصنوعي مطرح شد که سعي بر اين است که با يادگيري بتوان ربات هاي قابل انعطاف تر و هوشمندتر ايجاد کرد. به همين دليل در يادگيري ماشين هدف برنامه ريزي کردن رايانه ها به صورتي که بتوانند از تجربيات گذشته براي حل يک مسئله داده شده استفاده کنند.
به طور معمول يادگيري ماشين به سامانه اي که قادر است به طور خودکار ياد بگيرد و دانش هايش را يکپارچه کند برمي گردد. با مجهز شدن به ابزاري مثل يادگيري، يک سامانه مي تواند به طور پيوسته عملکردش را بهينه کند و کارايي آن بيشتر شود که در اين نوشتار در مورد يادگيري تقويتي که يکي از پرکاربردترين زمينه هاي تحقيقاتي در يادگيري ماشين است، سخن خواهيم گفت ...
فايل ضميمه
نوع فايل: pdf p0537200060611-WTLZSM.pdf (129.2 كيلو بايت, 1300 نمايش)
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
aimaryam (۰۷-۱۷-۱۳۸۹), behrouz6763 (۰۹-۲-۱۳۹۰), samane_89 (۱۲-۲۱-۱۳۸۹), Sina.picasso (۰۵-۳۱-۱۳۹۰)
قديمي ۱۱-۱۶-۱۳۹۲, ۰۹:۴۳ بعد از ظهر   #3 (لینک دائم)
عضو جدید
 
آواتار ab1356
 
تاريخ عضويت: بهمن ۱۳۹۲
پست ها: 1
تشكرها: 0
0 تشكر در 0 پست
Thumbs up تشکر

ممنون از توضیحات ارائه شده
ab1356 آفلاين است   پاسخ با نقل قول
قديمي ۱۰-۲۰-۱۳۹۳, ۰۷:۳۶ بعد از ظهر   #4 (لینک دائم)
عضو جدید
 
آواتار shima.power
 
تاريخ عضويت: آذر ۱۳۹۳
پست ها: 1
تشكرها: 0
0 تشكر در 0 پست
پيش فرض

فرق یادگیری تقویتی و یادگیری q رو میشه توضیح بدین؟ ممنون میشم
shima.power آفلاين است   پاسخ با نقل قول
قديمي ۰۹-۱۲-۱۳۹۷, ۱۱:۴۵ قبل از ظهر   #5 (لینک دائم)
عضو جدید
 
آواتار soheiltp
 
تاريخ عضويت: آذر ۱۳۹۷
پست ها: 1
تشكرها: 0
0 تشكر در 0 پست
پيش فرض

برای کسب اطلاعات بیشتر در مورد یادگیری تقویتی می تونید از طریق لینک زیر اقدام فرمایید.

یادگیری تقویتی - سایت یادگیری ماشین ایران
soheiltp آفلاين است   پاسخ با نقل قول
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 
ابزارهاي تاپيک
نحوه نمايش

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۱۰:۰۳ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2018, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design