نمايش پست تنها
قديمي ۰۶-۴-۱۳۸۹, ۰۴:۲۹ بعد از ظهر   #1 (لینک دائم)
Astaraki Female
Administrator
 
آواتار Astaraki
 
تاريخ عضويت: خرداد ۱۳۸۷
محل سكونت: تهران-کرج!
پست ها: 3,465
تشكرها: 754
16,337 تشكر در 3,127 پست
My Mood: Mehrabon
ارسال پيغام Yahoo به Astaraki
Arrow يادگيري تقويتي و كاربرد آن در بازي تخته نرد

يادگيري تقويتي و كاربرد آن در بازي تخته نرد

خلاصه مقاله:

دراين مقاله يكي از انواع يادگيري ماشين با نام يادگيري تقويتي معرفي شده كاربرد آن در بازي تخته نرد ارايه مي شود. دراين نوع از يادگيري عامل از طريق تعامل با محيط و مشاهده ي نتايج اقداماتش كه بصورت مجازات يا پاداش است از محيط دريافت مي كند سپس عامل ياد مي گيرد چگونه رفتار كند تا پاداش دريافتي اش در طول زمان بيشينه شود در بازيهاي تصادفي راهبردها براي بازيكنان در بازي يكسان نيست. به همين دليل در مسائلي از قبيل اقتصاد و بازار سهام مورد كاربرد قرار ميگيرند. اين مقاله نحوه ي بكارگيري دو الگوريتم به نامهاي يادگيري تفاوت زماني و نوع گسترش يافته ي آن يعني يادگيري كيو را در يكي از مشهورترين بازيهاي تصادفي بيان مي كند

كلمات كليدي:

هوش مصنوعي، يادگيري ماشين، يادگيري تقويتي، يادگيري تي دي، يادگيري كيو، شبكه هاي عصبي مصنوعي
فايل ضميمه
نوع فايل: pdf ISCIT01_052_312371.pdf (284.3 كيلو بايت, 577 نمايش)
Astaraki آفلاين است   پاسخ با نقل قول
از Astaraki تشكر كرده اند:
aimaryam (۰۷-۱۷-۱۳۸۹), f_iris (۰۷-۲۱-۱۳۹۰), Master Boy (۰۸-۲۹-۱۳۸۹), mjalal (۰۶-۴-۱۳۸۹), پروفسور (۰۳-۱۱-۱۳۹۰)

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online