نمايش پست تنها
قديمي ۱۰-۲۹-۱۳۹۲, ۱۲:۲۹ بعد از ظهر   #1 (لینک دائم)
EhsanPardaz Male
عضو جدید
 
آواتار EhsanPardaz
 
تاريخ عضويت: دي ۱۳۹۲
پست ها: 1
تشكرها: 12
0 تشكر در 0 پست
پيش فرض مسأله شبکه با روش مارکوف Value Iteration

درود بر دوستان

مسأله شبکه با روش مارکوف Value Iteration

مساله شبکه همانطور که در شکل پیداست ، برای رسیدن به هدف می تواند به شمال و شرق و غرب حرکت کند و یک مانع یا دیوار در وسط دارد و در انتها یک خانه 1+ و 1- که برای پاداش شکست یا پیروزی هستند
ما میخواهیم احتمال رسیدن به هدف یعنی پاداش مثبت را در همه خانه ها بررسی کنیم

میخواهیم با روش Value Iteration تمام خانه های شبکه را پر کنیم
روش بدست آوردن v برای خانه (3و3) را در اسلاید آورده ام.
درشکل زیر در مرحله بعد (تکرار دوم) نیز ، v برای خانه (3و3) محاسبه شده است:


ما به دنبال روش بدست آوردن مقدار v در تکرار ها هستیم.
در یک منبع دیگر ، روش محاسبه مرحله دوم (تکرار دوم) نیز ذکر شده است و همچنین مقادیر تمام حالت ها در تکرار های بعدی نیز محاسبه شده است.
ولی برای تکرار سوم به بعد روش محاسبه v نیامده است.
اسلاید های این منبع را هم در ادامه آورده ام.
ولی سوالاتی پیش آمد که نتوانستم روش محاسبه در مراحل بعد را تشخیص دهم.
سوالات :
1) در محاسبه مرحله اول که حرکت به راست در نظر گرفته شده مقدار 0.8 در محاسبات آمده ، چرا ؟
2) در هر مرحله مقدار v کدام خانه ها در محاسبات موثر است ؟
3) نویز چه تأثیری در محاسبات مراحل اول تا پایان دارد ؟
4) آیا گاما و نویز در تکرار های بعدی نیز ثابت هستند؟ یا تغییر می کنند ؟ اگر تغییر می کنند ، چگونه و بر چه اساسی تغییر می کنند ؟

اسلاید های حل شده از منبعی که گفتم در زیر قابل دانلود می باشد.
دانلود اسلاید مساله شبکه


EhsanPardaz آفلاين است   پاسخ با نقل قول

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online