Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > محاسبات نرم > شبکه های عصبی (Neural Networks)


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۴-۲۰-۱۳۹۲, ۰۹:۵۳ بعد از ظهر   #1 (لینک دائم)
عضو جدید
 
آواتار saaheh
 
تاريخ عضويت: تير ۱۳۸۹
محل سكونت: Iran
پست ها: 3
تشكرها: 5
0 تشكر در 0 پست
My Mood: Mehrabon
Smile آموزشِ شبکه‌ی عصبی به روشِ یادگیریِ تقویت

سلام دوستان
کسی کد یا شبه‌کدی برای آموزش یک شبکه‌ی عصبی با شیوه‌ی یادگیریِ تقویتی سراغ داره؟ نوعِ شبکه‌ی عصبی رو می‌شه شبیه به پرسپترون فرض کرد، با این تفاوت که برخلاف معمول به جای پس‌انتشارِ خطا، از یادگیریِ تقویتی برای آموزشش استفاده بشه. ممنون
saaheh آفلاين است   پاسخ با نقل قول

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۰۴-۲۱-۱۳۹۲, ۰۱:۰۰ بعد از ظهر   #2 (لینک دائم)
عضو فوق فعال
 
آواتار dan1366
 
تاريخ عضويت: ارديبهشت ۱۳۹۲
پست ها: 22
تشكرها: 1
6 تشكر در 5 پست
پيش فرض

با سلام دوست عزیز
من منظور شما رو از آموزش شبکه های عصبی با استفاده از یادگیری تقویتی رو خوب متوجه نشدم!!!
ولی تا اونجایی که من میدونم در یادگیری تقویتی دو روش برای حل مسئله وجود داره 1- جدول ارجاع یا
Look-up Table و 2- تقریب با استفاده از شبکه های عصبی هستش Recurrent Neural Network.
که اولی برای حل مسائل کوچک استفاده میشه که همون جدول Q جدول ارجاع ما هست و دومی که برای مسائل خیلی بزرگ استفاده میشه.
که شبه کد اون برای محبوبترین الگوریتم یادگیری تقویتی (Q_Learning) به شکل زیر هست:

1.Initialize the neural network.
2.Initial cart and pole.
3. Get current state.
4. Obtain for each action by substituting current state and action into the neural network.
5.Determine a action according to equation : .
(action= { left, right} )
6.Push cart and get current state.
7.if fail, reinforcement = -1 and reset cart. Else reinforcement = 0.
8.Generate according to equation :
(5.2)
use to train the network as Fig9. shown.
8.Repeat 3-7, until the agent learns it.

dan1366 آفلاين است   پاسخ با نقل قول
از dan1366 تشكر كرده است:
saaheh (۰۴-۲۵-۱۳۹۲)
قديمي ۰۴-۲۵-۱۳۹۲, ۱۲:۲۲ بعد از ظهر   #3 (لینک دائم)
عضو جدید
 
آواتار saaheh
 
تاريخ عضويت: تير ۱۳۸۹
محل سكونت: Iran
پست ها: 3
تشكرها: 5
0 تشكر در 0 پست
My Mood: Mehrabon
پيش فرض

سلام دوست خوبم
بابت توجه و پاسخت ممنونم. منظورم اینه که در آموزش دادنِ یک شبکه ی عصبی، مثلا ممکنه از پس انتشار خطا (Error Back Propagation) استفاده بشه. اما روش های دیگه ای هم برای آموزش شبکه ی عصبی وجود دارن، که یکیشون همین یادگیری تقویتی هستش، اما چگونگیِ این کار رو من نمیدونم. بابت شبه کدی هم که فرستادی ممنون
saaheh آفلاين است   پاسخ با نقل قول
پاسخ

Tags
شبکه عصبی, یادگیری تقویتی



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۱:۵۴ بعد از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design