Artificial Intelligence - هوش مصنوعی

Artificial Intelligence - هوش مصنوعی (http://artificial.ir/intelligence/)
-   درختان تصميم گيري طبقه بندي و رگرسيوني (http://artificial.ir/intelligence/forum113.html)
-   -   رگرسیون درختی-regresion tree (http://artificial.ir/intelligence/thread1873.html)

arsalan_4421 ۰۲-۲۶-۱۳۸۹ ۱۰:۳۲ بعد از ظهر

رگرسیون درختی-regresion tree
 
پایان نامه من در مورد مدل رگرسیون درختی است متاسفانه هیچ منبعی در این زمینه به زبان فارسی پیدا نکردم می خواستم بدونم نرم افزار این مدل چیه واز کجا میشود آن را پیدا کرد و چگونه می توان آن را برای کار های مختلف توسعه داد؟
ایمیلمarsalan_4421@yahoo.com می باشد

Astaraki ۰۲-۲۸-۱۳۸۹ ۱۰:۰۱ قبل از ظهر

2(ها)ضميمه
دوست عزيز براي پايان نامه مطالب زيادي لازم داريد !پس فقط دنبال مطالب فارسي نباشيد !:1:

تخمين ارتفاع امواج ناشي از باد در نكاء به كمك درختان تصميم رگرسيوني
Classification and Regression Tree Methods

دهقانی ۰۲-۳۰-۱۳۸۹ ۱۰:۰۹ قبل از ظهر

نقل قول:

نوشته اصلي بوسيله arsalan_4421 (پست 5704)
پایان نامه من در مورد مدل رگرسیون درختی است متاسفانه هیچ منبعی در این زمینه به زبان فارسی پیدا نکردم می خواستم بدونم نرم افزار این مدل چیه واز کجا میشود آن را پیدا کرد و چگونه می توان آن را برای کار های مختلف توسعه داد؟
ایمیلمarsalan_4421@yahoo.com می باشد

سلام ،اتفاقامن هم تحقیقی در همین زمینه دارم ،که با توجه به نتایج جستجو در اینترنت مقالات خیلی خوبی به زبان لاتین پیدا کردم و ناچارا روی آنها کار می کنم(به زبان فارسی کم بود)
من اگر در ادامه تحقیقم نتیجه ای پیدا کردم حتما خبرتان می کنم، از شما می خواهم که اگر مطلبی خوب دیدید من را از طریق ایمیلم با خبر کنید .
helya_yas@yahoo.com
با تشکر دهقانی

Astaraki ۰۳-۱-۱۳۸۹ ۰۵:۴۶ قبل از ظهر

1(ها)ضميمه
شناسايي نقاط دورافتاده با استفاده از تقويت درخت هاي رگرسيوني


چکيده:
در اين مقاله روشي براي شناسايي نقاط دورافتاده در مسائل رگرسيوني پيشنهاد شده است. اين روش بر اساس اطلاعاتي است كه با تقويت درخت هاي رگرسيوني به دست مي آيد. ايده ي اصلي اين است كه مشاهده اي را كه بيش از همه در بازنمونه گيري هاي روش تقويت (boosting) ظاهر مي شود، انتخاب و حذف كنيم و سپس اين كار را تكرار كنيم. معيار اين انتخاب، بر اساس نابرابري چبيشوف است كه در مورد ماكسيمم تعداد تكرارهاي تقويت در متوسط تعداد ظهور در نمونه هاي خودگردان ساز (bootstrap) به كار گرفته مي شود. از اين رو، اين روش، بستگي به توزيع نوفه ندارد. اين روش، امكان انتخاب نقاط دورافتاده را كه پيش بيني مشاهدات آن ها بسيار سخت است، فراهم مي سازد. براي نشان دادن ارزش اين روش، مجموعه داده هاي مشهور زيادي در نظر گرفته شده اند و مقايسه اي بين روش پيشنهادي و دو روش رايج صورت گرفته است.

کليدواژگان:
تقويت ، CART ، نقاط دورافتاده رگرسيون

Ahmad-TAUT ۰۳-۳-۱۳۸۹ ۰۸:۰۰ بعد از ظهر

درود به همه ی دوستان. من در حال نگارش مقاله ای در زومینه ی "استفاده از درختان تصمیم برای دسته بندی مشتریان نهاد های مالی" هستم.
به کدهای متلب در این زمینه تقریبا آشنایی دارم. در این باره مخصوصا در زمینه ی کیس استادی خودم، منابع خوبی دارم؛ ولی توقع یافتن منبع فارسی خوب نداشته باشید.
در ضمن در زمینه ی انتخاب level برای هرس و نحوه شمارش subtree های درخت دچار مشکل هستم. خوشحال میشم برای کمک بیشتر به یکدیگر با هم در تماس باشیم.
keyword:
classification tree, credit scoring

saadatmandy ۰۳-۱۶-۱۳۸۹ ۰۱:۲۶ قبل از ظهر

salam
man baiad ta farda ie matn dar morede tarife calssification tafavotesh ba clustering va regresion va tarife k-nn be onvane iek mesal baraie classification eraee bedam ama mataleb kheili ziad va parakande ast manam vaghtam kheili mahdode va hatman baiad kar ro ahvil bedam khahesh mikonam agar matlab kholase'ee darid keh in mozoat ro poshesh bede ba man dar mion bezarid(goftam kholase chon baiad kole in mataleb ro dar 10 safhe kholase tahvil bedam)
iek donia mamnonam

arsalan_4421 ۰۳-۱۶-۱۳۸۹ ۰۲:۴۰ بعد از ظهر

reg tree
 
به دلایل زیر کار بامدل درختی پیشنهاد می شود : 1- این مدل به طور مستقیم با متغیر های پیش بینی کننده مرتبط می باشد بنابراین نتایج مدل برای فهمیدن و شبیه سازی آسان هستند .
2- درخت های تصمیم گیری غیر پارامتریک بوده و هیچ دخالتی از سوی کاربر بر روی آنها صورت نمی گیرد .
3- خروجی مدل از دقت بالای برخوردار است که می توان آن را با سایر مدل ها مقایسه کرد .
درخت تصمیم چیست ؟
یک درخت معمولا از ریشه (root) ، شاخه (beach) ، گره ها (nods) ، برگها (leaf) تشکیل شده است درخت تصمیم هم به طور مشابه از گره ها که با دایره نشان داده می شوند و شاخه ها که نشان دهنده اتصال بین گره ها می باشند ، تشکیل شده است . درخت تصمیم به منظور سادگی در رسم معمولا از چپ به راست و یا از بالا به پایین کشیده می شود به طوری که ریشه (گره اول را ریشه می گویند) در بالا قرار گیرد . انتهای یک زنجیره ریشه ، شاخه، گره را یک برگ می نامند . از هر یک از گره های داخلی (یعنی گره ای که برگ نباشد) دو یا چند شاخه دیگر می توانند منشعب شوند . هر گره مربوط به یک خصوصیت معین است وشاخه ها به معنای بازه ای از مقادیر هستند ، این بازه های مقادیر ، باید بخش های مختلف مجموعه مقادیر معلوم را برای خصوصیت ها به دست دهند . عمل انشعاب توسط یکی از متغیرهای پیش بینی کننده انجام می پذیرد ، بازه های انشعاب طوری انتخاب می شوند که مجموع مجذور انحراف از میانگین داده های هر گره را حداقل کنند .
هنگامي كه خروجي يك درخت، يك مجموعه گسسته از يك مجموعه مقادير ممكن است؛ به آن طبقه بندی درختی گفته مي شود (مثلا مونث یا مذکر،برنده یا بازنده) هنگامي كه بتوان خروجي درخت را يك عدد حقيقي در نظر گرفت آن را، رگرسیون درختی مي نامند ویا به عبارت دیگر اگر متغیر های ما عددی (numerical) باشند از رگرسیون درختی (regression tree) واگر مطلق و قیاسی باشند از طبقه بندی درختی(classification tree) استفاده می کنیم . فرایند انشعاب در هر گره بارها تکرار می شود تا به گره پایانی یا همان برگ برسد که در برگ مجموع مجذور انحراف از میانگین داده ها حدودا به صفر می رسد ، با این کار درخت بزرگی توسعه پیدا خواهد کرد . فرآیند تشکیل دادن رگرسیون درختی شامل 5 مرحله است .
1)- مرحله مقدار دهی اولیه (initialization) : در این مرحله متغیر های پیش بینی کننده انتخاب شده و فرایند پیش پردازی داده ها انجام می گیرد .
2)- ساختن درخت (tree building) : این مرحله با تقسیم شدن گره والد به دو گره فرزند شروع می شود ، در هر گره والد تمام موضوعات و انشعابات ممکن ارزیابی می شود و سر انجام بهترین انشعاب انتخاب می شود


بهترین انشعاب انشعابی است که بیشترین مقدار را داشته باشد . با تکرار پروسه بالا برای هر انشعاب درخت بزرگی شکل می گیرد که به درخت حداکثر (maximal tree ) معروف است که شاخه ها و گره های زیادی دارد و کار با آن سخت می باشد بنابراین برای رسیدن به یک درخت بهینه و کار آمد باید شاخه های اضافی را هرس کرد .
3)- هرس کردن درخت (tree pruning) : دو روش حرص وجود دارد 1- هرس قبل از شکل گیری درخت حداکثر (pre-pruning) 2- هرس بعد از شکل گیری درخت حداکثر (past-pruning)
در روش اول فرایند هرس اجازه نمی دهد شاخه های اضافی تولید شوند ولی در روش دوم ابتدا درخت حداکثر تشکیل می شود و سپس فرآیند هرس انجام می گیرد . در این طرح از یکی از تکنیک های روش دوم به نام هزینه پیچیدگی هرس (cost complexity pruning ) استفاده می شود( بریمان و همکاران 1984).
4)- انتخاب درخت بهینه (optimal tree selection) : درخت بهینه بر اساس حداقل کردن خطای پیش بینی انتخاب می شود که دو روش برای محاسبه خطای پیش بینی وجود دارد 1- آزمون دستگاه مستقل 2- آزمون صحت سنجی که روش اول هنگامی مورد استفاده قرار می گیرد که تعداد داده های زیادی داشته باشیم در غیر آین صورت از روش دوم استفاده می شود .

arsalan_4421 ۰۳-۱۶-۱۳۸۹ ۰۲:۴۸ بعد از ظهر

من این مطالب را تونستم از منابع لاتین در بیاورم اما وقعا اینا را هنوز یاد نگرفتم

skeivany ۰۴-۲۹-۱۳۸۹ ۰۴:۴۶ بعد از ظهر

سلام من در حال نگارش مقاله ای درباره مقایسه روش های داده کاوی (رگرسیون ,ساختار درختی,شبکه های عصبی,سری زمانی )هستم لطفا اگه مطب مرتبطی دارین منا از طریق میلیم با خبر کنید ممنونم
میلمskeivany@yahoo.com

a.bahrami ۰۸-۲-۱۳۸۹ ۰۸:۰۵ بعد از ظهر

آقای ارسلان ممنون از توضیح بسیار خوبی که داده بودید میشه لطفا راجع به آزمون دستگاه مستقل هم یک تو ضیحی بدید.
با تشکر فراوان


زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۱۲:۳۴ قبل از ظهر ميباشد.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.