Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > یادگیری (Learning) > يادگيري تقويتي(Reinforcement Learning)


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۶-۲۲-۱۳۹۰, ۰۵:۵۵ بعد از ظهر   #1 (لینک دائم)
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,337 تشكر در 3,127 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Cool یادگیري رفتار در ساختار رفتاري توسط یادگیري تقویتی

یادگیري رفتار در ساختار رفتاري توسط یادگیري تقویتی

چکيده:
مشکل عمده رو شهاي یادگیري مبتنی بر یادگیري تقویتی ، طولانی شدن زمان یادگیري در اثر افزایش ابعاد فضاي مسئله است . یادگیري تقویتی سلسله مر اتبی با تجزیه مسئله به اجزاي کوچ کتر سعی در حل چنین مشکلی دار د. در این مقاله نیز با تجزیه مسئله به اجزاي کوچک تر که آنها را رفتار می نامیم، از ساختارهاي bb به عنوان ساختارهاي سلسله مراتبی براي یادگیري رفتارها استفاده می شود و روشی براي تجدید توابع ارزش و تقسیم پاداش دریافتی پیشنهاد می شو د. در این روش دانش طراح بیشتر در ساختار کد می شود و مزایایی مانند سرعت بالاي همگرایی، روش هاي یادگیري سلسله مراتبی و کاهش فضاي حالت را با مزایاي سیستمهاي bb یکجا جمع می کنیم . به علاوه در چنین ساختاري قابلیت یادگیري خود ساخ تار نیز امکان پذیر است. نتایج شبیه سازي روي مسئله هدایت تاکسی، کارایی روش را بهتر نشان می دهد.
فايل ضميمه
نوع فايل: pdf 349.pdf (299.8 كيلو بايت, 312 نمايش)
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
ayfer.a11 (۰۶-۲۲-۱۳۹۰), fatameh2012 (۰۹-۲۱-۱۳۹۴), samane_89 (۰۷-۱۱-۱۳۹۰)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۱:۱۷ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design