![]() |
Q-Learning
1(ها)ضميمه
Q-Learning
l * معرفی * الگوریتم یادگیری * مثالی از یک عامل * مثالی از برج هانوی * اثبات همگرایی * یادگیری Q برای MDP غیر قطعی |
salam! man be sheddat be yek piadesazi az Q learning niaz daram ke bebinam tavabe ash ro chetor bayad nevesht.age komak konin kheili mamnoon misham
|
این برنامه پیاده سازیه روش Q-Learning هست که برای یافتن یک هدف در مکان نا معلوم به وسیله ی یک agent نوشته شده.
در این برنامه ابتدا به وسیله ی این الگوریتم و چندین بار حرکت agent در مسیر ، هزینه هایی برای این مسیر پیدا میشه و در پایان هم بهترین مسیر تا هدف رو انتخاب میکنیم (در این برنامه از الگوریتم Dijkstra برای این کار استفاده شده) به این نکته هم توجه داشت باشین که بهترین مسیر در این روش ، مسیری است که بزرگترین هرینه رو در هر مرحله انتخاب کنه كد:
//Q-Learning |
نقل قول:
کد متلب: كد:
function q=ReinforcementLearning |
سلام ! ممنون از راهنمایی هاتون، راستش من به دو مقاله احتیاج دارم که برای کارم خیلی مفید هستند و الی از طریق google نمی شه pdf اونها رو گرفت. عنوان ایم دو مقاله رو در زیر گذاشتم:
1)“Routing with compression in wireless sensor networks: A Q-learning approach,” 2)“Q-probabilistic routing in wireless sensor networks,” |
زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۱:۵۳ بعد از ظهر ميباشد. |
Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.