Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > یادگیری (Learning) > يادگيري تقويتي(Reinforcement Learning)


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۳-۱۴-۱۳۹۲, ۰۶:۴۶ بعد از ظهر   #1 (لینک دائم)
عضو فوق فعال
 
آواتار dan1366
 
تاريخ عضويت: ارديبهشت ۱۳۹۲
پست ها: 22
تشكرها: 1
6 تشكر در 5 پست
پيش فرض

ضمناً این برنامه الگوریتم های یادگیری تقویتی رو در برنامه ریزی تولید برای ماشین منفرد پیاده سازی میکنه، و هدف کمینه سازی حداکثر تاخیر برای عامل می باشد.
و در اینجا سه تا قانون برای عامل وجود دارد FIFO، SPT و EDD هستند، که بهترین قانون برای هدف موردنظر ما یعنی کمینه سازی حداکثر تاخیر قانون EDD می باشد ولی عامل ماشین منفرد هیچگونه دانشی نسبت به اینکه کدامیک از این عاملها بهترین هستند رو نداره و ما با استفاده از پارامترهایی که در بالا گفتم باید از بین این سه قانون که به عامل داده ایم، عامل ماشین منفرد بهترین قانون یعنی همون EDD رو مشخص میکنه برامون.
و من درستی این مسئله که در مقاله خارجی اومده بود اثبات کردم ضمن اینکه در مقاله خودم با الگوریتم SARSA که بهتر از Q_Learning عمل میکنه مقایسه کردم.
dan1366 آفلاين است   پاسخ با نقل قول

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۰۳-۱۴-۱۳۹۲, ۰۶:۵۸ بعد از ظهر   #2 (لینک دائم)
عضو جدید
 
آواتار mamooshi
 
تاريخ عضويت: خرداد ۱۳۹۱
پست ها: 3
تشكرها: 0
0 تشكر در 0 پست
پيش فرض درخواست توضیح

ممنون که توضیح دادید ولی من می خوام یه چیزی در حد پروژه بنویسم به همین خاطر فقط نمی خوام اجرا بشه مقاله یا توضیحت مربوط به پیاده سازی یا الگوریتم رو هم لازم دارم بازم ممنون از وقتی که گذاشتید
mamooshi آفلاين است   پاسخ با نقل قول
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۳:۲۷ قبل از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design