درخواست پروژه برای یادگیری تقویتی - Artificial Intelligence

mamooshi · ۰۳-۱۲-۱۳۹۲, ۰۶:۳۱ بعد از ظهر

با سلام
راستش من یه پروژه نیاز دارم که پیاده سازی یک روش یادگیری تقویتی از روی یک مقاله باشه! اگر کسی هست که بتونه کمک کنه ممنون می شم! خیلی شرایط بحرانیه ! حالا اصلا یه پروژه یادگیری تقویتی باشه فرق نمی کنه!
راستش این ترم هم باید سمینار دفاع کنم هم برای سه تا درس پروژه تحویل بدم اصلا فکر نمی کنم برسم!

dan1366 · ۰۳-۱۲-۱۳۹۲, ۰۷:۲۶ بعد از ظهر

سلام دوست عزیز
من قبلا رو این مبحث کار کردم، و از روی پروژه ای که خودم درست کردم و پیاده سازی دوتا از الگوریتم های یادگیری تقویتی بوده Q_Learning و SARSA تونستم یه مقاله هم بنویسم.
در صورت تمایل میتونید به من ایمیل بزنید @gmail.com

**raha_hakhamanesh** · ۰۳-۱۲-۱۳۹۲, ۰۸:۰۱ بعد از ظهر

نقل قول:

نوشته اصلي بوسيله dan1366

سلام دوست عزیز
من قبلا رو این مبحث کار کردم، و از روی پروژه ای که خودم درست کردم و پیاده سازی دوتا از الگوریتم های یادگیری تقویتی بوده Q_Learning و SARSA تونستم یه مقاله هم بنویسم.
در صورت تمایل میتونید به من ایمیل بزنید @gmail.com

یعنی اگر ایشان یا دیگران به شما ایمیل نزنند شما حاضر نیستید دانش تان را به دیگران انتقال دهید؟
آیا مفهوم انجمن را می دانید؟
آیا برای رسیدن به اینجایی که هستید از هیچ انجمنی کمک نخواسته اید یا آنها هم از شما خواستند بهشان ایمیل بزنید؟

قوانین را رعایت کنید
.

dan1366 · ۰۳-۱۲-۱۳۹۲, ۱۱:۰۲ بعد از ظهر

اولا سلام آقای raha_hakhamanesh
نه عزیزمن اونطوری نیستم، مگه ایمیل زدن به یکی برای کمک بیشتر اشکالی داره!!!!
اتفاقا دوست من، خودم برای یه مورد خاص نه یه بار بلکه سه بار به یکی از اساتید دانشگاه امیرکبیر ایمیل زدم فقط برای دانلود یه پروژه ای که داخل صفحه بیوگرافیش بود و به من اجازه دانلود داده نمیشد ولی ایمیلم بعد از سه بار دیگه بلاک شد.
در حالیکه برای همون پروژه ای که کار میکردم به یکی از اساتید دانشگاه های خارج، که مقاله مربوط به اون میشد ایمیل زدم هر چند شاید نتونسته باشه کمک زیادی بکند ولی مهم این بود که جواب ایمیلم رو داد.
و ایمیلم رو به این دلیل ذکر کردم چون من شاید مثل تو دوست عزیز از اینترنت پرسرعتی استفاده نکنم و هر بار بخوام بقول تو انجمن رو چک کنم... .

**raha_hakhamanesh** · ۰۳-۱۳-۱۳۹۲, ۰۹:۴۳ قبل از ظهر

نقل قول:

نوشته اصلي بوسيله dan1366

اولا سلام آقای raha_hakhamanesh
نه عزیزمن اونطوری نیستم، مگه ایمیل زدن به یکی برای کمک بیشتر اشکالی داره!!!!
.

بله کاربر گرامی مطابق مقررات درج ایمیل در انجمن صریحا اشکال دارد

نقل قول:

نوشته اصلي بوسيله dan1366

اتفاقا دوست من، خودم برای یه مورد خاص نه یه بار بلکه سه بار به یکی از اساتید دانشگاه امیرکبیر ایمیل زدم فقط برای دانلود یه پروژه ای که داخل صفحه بیوگرافیش بود و به من اجازه دانلود داده نمیشد ولی ایمیلم بعد از سه بار دیگه بلاک شد.
در حالیکه برای همون پروژه ای که کار میکردم به یکی از اساتید دانشگاه های خارج، که مقاله مربوط به اون میشد ایمیل زدم هر چند شاید نتونسته باشه کمک زیادی بکند ولی مهم این بود که جواب ایمیلم رو داد.
.

اینکه شما درخواستی را از صفحه خانگی یک شخص داشته باشید با اینکه در انجمن مشارکت داشته باشید متفاوت است، شما هم می توانید یک صفحه شخصی برای خودتان ایجاد کنید و ایمیل هزاران نفری که روزانه برای درخواست پروژه با شما تماس می گیرند را پاسخ دهید نه از طریق انجمن!

نقل قول:

نوشته اصلي بوسيله dan1366

و ایمیلم رو به این دلیل ذکر کردم چون من شاید مثل تو دوست عزیز از اینترنت پرسرعتی استفاده نکنم و هر بار بخوام بقول تو انجمن رو چک کنم... .

اتفاقا یکی از مزایای انجمن، مواجهه با مشکل سرعت اینترنت است، لذا زحمت بکشید صداقت گفتارتان را با آپلود کردن پروژه در یک آپلود سنتر و ارائه راهنمای آن را در انجمن، نشان دهید.

و در نهایت، هدف انجمن یک کاربر نیست بلکه دهها یا صدها کاربری هستند که بعدها به این صفحات مراجعه می کنند.
موفق باشید

dan1366 · ۰۳-۱۳-۱۳۹۲, ۰۷:۵۴ بعد از ظهر

این یکی یادگیری تقویتی در برنامه ریزی تولید
پرشین گیگ - دانلود - RL1.rar

این یکی که در حال حاظر دارم کار میکنم و فقط طراحیش انجام شده یادگیری تقویتی در بازیابی اطلاعات متنی
http://dan1366.persiangig.com/other/RL2.rar

mamooshi · ۰۳-۱۴-۱۳۹۲, ۰۵:۲۸ بعد از ظهر

سلام ممنون که پاسخ دادید اگه ممکنه راجع به پروژه ها می شه توضیح بیشتری بدید هم این که روی بازیابی اطلاعات متنیه هم اونی که گفتید از دو روش استفاده کردید ؟
ممنون که وقت گذاشتید!

dan1366 · ۰۳-۱۴-۱۳۹۲, ۰۶:۲۱ بعد از ظهر

سلام
برنامه بازیابی اطلاعات متنی که گفتم کامل نیست ولی اون یکی برنامه رو میتونی به اینصورت اجرا کنی:
Total Job = 100
Mean Time Between Arrivals = 5
Mean Service Time = 3.5
دکمه اجرای برنامه رو بزن تا مقادیر جدول زمانبندی برات مشخص بشه.
بعد روی یکی از جداول کلیک کن تا جداول به صورت کامل برات نمایش داده بشن
و از اون چهار کلیدی که پایین جدولها قرار دارن از سمت راست به ترتیب
اول RPT که زمان واقعی هر Job رو مشخص میکنه کلیک کن
بعد FIFO تا صف FIFO رو پیاده سازی کنه
بعد SPT تا صف SPT رو پیاده سازی کنه
بعد EDD تا صف EDD رو پیاده سازی کنه
بعد دوباره رو یکی از جداول کلیک کن تا به قسمت قبلی برنامه برگردی
و اونجا هم
Epsilon= 0.1
Gamma= 0.9
اون 5000 هم که به صورت پیشفرض میزان دوره یادگیری رو برا عامل تعیین میکنه
و بعد از پایین سمت چپ صفحه دکمه Reset رو بزن تا مقادیر جدول Q رو به صورت صفر مقداردهی کنه
و بعد از اون دکمه Q_Learning رو بزن تا عامل با الگوریتم Q_learning اجرا بشه

و دوباره Reset رو بزن و بعد با دکمه SARSA عامل رو با الگوریتم SARSA اجرا کن.

dan1366 · ۰۳-۱۴-۱۳۹۲, ۰۶:۴۶ بعد از ظهر

ضمناً این برنامه الگوریتم های یادگیری تقویتی رو در برنامه ریزی تولید برای ماشین منفرد پیاده سازی میکنه، و هدف کمینه سازی حداکثر تاخیر برای عامل می باشد.
و در اینجا سه تا قانون برای عامل وجود دارد FIFO، SPT و EDD هستند، که بهترین قانون برای هدف موردنظر ما یعنی کمینه سازی حداکثر تاخیر قانون EDD می باشد ولی عامل ماشین منفرد هیچگونه دانشی نسبت به اینکه کدامیک از این عاملها بهترین هستند رو نداره و ما با استفاده از پارامترهایی که در بالا گفتم باید از بین این سه قانون که به عامل داده ایم، عامل ماشین منفرد بهترین قانون یعنی همون EDD رو مشخص میکنه برامون.
و من درستی این مسئله که در مقاله خارجی اومده بود اثبات کردم ضمن اینکه در مقاله خودم با الگوریتم SARSA که بهتر از Q_Learning عمل میکنه مقایسه کردم.

mamooshi · ۰۳-۱۴-۱۳۹۲, ۰۶:۵۸ بعد از ظهر

ممنون که توضیح دادید ولی من می خوام یه چیزی در حد پروژه بنویسم به همین خاطر فقط نمی خوام اجرا بشه مقاله یا توضیحت مربوط به پیاده سازی یا الگوریتم رو هم لازم دارم بازم ممنون از وقتی که گذاشتید