Artificial Intelligence - هوش مصنوعی

Artificial Intelligence - هوش مصنوعی (http://artificial.ir/intelligence/)
-   فروکاهي داده ها يا(Data Reduction) (http://artificial.ir/intelligence/forum75.html)
-   -   تحليل عاملي(Factor Analysis) (http://artificial.ir/intelligence/thread915.html)

Astaraki ۰۹-۸-۱۳۸۸ ۰۳:۵۹ بعد از ظهر

تحليل عاملي(Factor Analysis)
 
1(ها)ضميمه
مقاله از تحليل عاملي(Factor Analysis)
:rolleyes:

Astaraki ۰۹-۸-۱۳۸۸ ۰۴:۰۰ بعد از ظهر

تحلیل عاملی
 
تحلیل عاملی یک روش آماری عمومی است که به منظور دستیابی به مجموعه کوچکی از متغیرهای مشاهده نشده که به آن متغیرهای نهفته یا عامل نیز می گویند، از طریق کوواریانس بین مجموعه ای وسیع تر از متغیرهای مشاهده شده که آن را متغیرهای آشکار نیز می نامند مورد استفاده قرار می گیرد.

تحلیل عاملی روشی است برای ساده سازی متغیرهای مورد مطالعه بر اساس همبستگی بین آنها.

تحلیل عاملی بسته به هدفی که محقق در استفاده از آن دارد به دو نوع تقسیم می شود:

1- تحلیل عاملی اکتشافی(Exploratory factor analysis (EFA) ): که در آن محقق هیچ طرح و نقشه قبلی برای پیش بینی یا شناسایی تعداد و ماهیت عوامل پنهان در ورای متغیرها را ندارد. در اینجا فرض محقق این است که هر متغیری می تواند در کنار هر متغیر دیگر زیر پوشش یک عامل قرار گیرد. در تحلیل عاملی اکتشافی، هدف محقق اکتشاف الگو یا الگوهایی در درون داده های مورد تحلیل است. این نوع تجزیه و تحلیل از طریق نرم افزارهای SPSS یا SAS قابل محاسبه است.

2- تحلیل عاملی تاییدی(Confirmatory factor analysis (CFA) ): که طی آن محقق انتظار دارد طرح و نقشه خاصی از عوامل پنهان در ماورای متغیرها را بیازماید. در این نوع، انتظار می رود متغیرها چیدمان خاصی داشته باشند. در این روش محقق به آزمون فرضیاتی مربوط به یک ساختار عاملی خاص اقدام می کند. این شکل از تحلیل عاملی از طریق نرم افزارهای Lisrel و Amos محاسبه می شود.
............
تحلیل عاملی
تحليل عاملي اصطلاحي است كلي براي تعدادي از تكنيك هاي رياضي و آماري مختلف اما مرتبط با هم به منظور تحقيق درباره ماهيت روابط بين متغيرهاي يك مجموعه معين. مساله اساسي تعيين اين مطلب است كه آيا يك مجموعه متغير را مي توان برحسب تعدادي از «ابعاد» يا «عامل هاي» كوچكتري نسبت به تعداد متغيرها توصيف نمود و هر يك از ابعاد ( عامل ها ) معرف چه صفت يا ويژگي است.
نخستين كار درباره تحليل عاملي توسط چارلز اسپيرمن (1940) صورت گرفت، كه به گونه كلي « پدر» اين روش شناخته شده است. بعد از او كارل پيرسن (1901)، روش «محورهاي اصلي» را پيشنهاد كرد و هتلينگ (1933) آن را به گونه كاملتري توسعه داد
بسياري از كارهاي نخستين در تحليل عاملي، يعني در طول سال هاي 1900 تا 1930، به كاربرد مدل اسپيرمن در بسياري از مسايل عملي و بررسي شرايط مناسب براي استفاده از آن مدل اختصاص يافته است. در طول اين دوره، علاوه بر خود اسپيرمن، دانشمندان ديگري مانند سيريل برت، كارل هليزينگر، ترومن كلي، كارل پيرسن و گادفري تامسون، كمك هاي شاياني به ادبيات تحليل عاملي كرده اند. در اوايل سال 1930، آشكار شد كه مدل تك عاملي عمومي اسپيرمن براي توصيف روابط بين متغيرهاي يك مجموعه هميشه كافي نيست.
ترستون احتمالا برجسته ترين تحليلگر عاملي نوين بوده و نفوذ قابل ملاحظه اي در توسعه اين روش از سال هاي 1930 تا كنون داشته است. مسئوليت توسعه روش «سانتروئيد» با اوست كه در مقياس گسترده اي قبل از ظهور كامپيوترهاي پر سرعت به كار رفته است. او همچنين مسئول مفهوم ساختار ساده است كه توسط بيشتر تحليلگران به عنوان معرف يك راه حل تحليل عاملي ايده آل در نظر گرفته شده است.
كارهاي اوليه در تحليل عاملي كه توسط دانشمندان ياد شده انجام گرفته ، بيشتر توجيه نظري دارد، هر چند هيچ يك از آن ها آماده براي آزمون هاي آماري فرضيه هاي خاص درباره ساختارهاي عاملي مجموعه هاي معيني از متغيرها نبوده است. اما، وقتي كامپيوترهاي پر سرعت در اختيار قرار گرفت در اواسط تا اواخر سال هاي 1950، حركتي از تئوري گرائي به سوي آنچه تحليل عاملي اكتشافي ناميده مي شود، به وجود آمد. اين حركت به گونه آشكار از طريق تئوري عامل مشترك ترستون تشويق، و از طريق فرمول بندي عمومي هتلينگ (1993)، درباره عمليات رياضي مولفه هاي اصلي كه قبل از آن به دليل محاسبات فوق العاده پيچيده و پرزحمت آن ، به كار نرفته بود تسهيل شد. چنين به نظر مي رسد كه در طول سال هاي 1950 و 1960، تقريبا هر كس، هر چيزي را تحليل عاملي مي كرده است، به اين اميد كه روابط پيچيده ظاهري بين متغيرهاي يك مجموعه را مي توان ساده كرد و به گونه ساده تري تفسير نمود (ليندمن و همكاران، 1980). در طول اين دوره همچنين تعداد روشهاي تحليل عاملي با ابداع تحليل تصوير (گاتمن، 1953)، تحليل عاملي بنيادي (رائو، 1955 و هريس، 1962)، تحليل عاملي آلفا (كيسر و كافري، 1965) و روش كمترين پس ماند (هامن و جونز، 1966)، به گونه قابل توجهي توسعه يافت. با اين وجود، روشهاي تحليل اكتشافي نتوانست آن گونه كه انتظار مي رفت، كمك موثري براي آزمون و پالايش تئوري روان شناختي باشد.
مقاله هتلينگ (1933) درباره تحليل مولفه هاي اصلي نخستين كمك قابل توجه يك آماردان را به تحليل عاملي معرفي كرد، و اين وضعيت تا موقعي ادامه داشت كه مقاله لاولي (1940) درباره روش بيشينه احتمال (ML) منتشر شد. لاولي نشان داد كه تحليل عاملي مي تواند به عنوان يك تكنيك آماري جالب در بسياري از موقعيت هاي پژوهشي كاربرد داشته باشد. واكنش هاي له و عليه اين روشها نيز تا وقتي كه آزمون فرضيه هاي خاص درباره پارامترهاي مدل تحليل عاملي مورد توجه قرار گرفت (مثلا جارزكاگ، 1984)، همچنان ادامه داشت. هر چند كارهاي جارزكاگ اساسا مبتني بر روش ML لاولي بود، اما بسياري از مسايل محاسباتي و تفسيري را كه لاولي با آن مرتبط نبود، روشهاي باك و بارگمن (1966) و جارزكاگ (1984) به سبب تاكيد بر آزمون فرضيه، به عنوان روشهاي تحليل عاملي تاييدي طبقه بندي مي شود. هر چند توليد فرضيه هايي كه بايد آزمون شود اغلب دشوار است، اما اين روشها به وضوح بر تحليل عامل اكتشافي به سبب توسعه و آزمون تئوري مزيت دارد. البته براي تدوين چنين فرضيه هايي مي توان ابتدا تحليل عاملي اكتشافي را اجرا كرد و سپس اين فرضيه ها را از طريق تحليل عاملي تاييدي آزمود.
درك مفهومي تحليل عاملي و كاربرد آن
بنا بر آنچه گفته شد، تحليل عاملي تكنيكي است كه كاهش تعداد زيادي از متغيرهاي وابسته به هم را به صورت تعداد كوچكتري از ابعاد پنهان يا مكنون امكان پذير مي سازد. هدف عمده آن رعايت اصل اقتصاد و صرفه جويي از طريق كاربرد كوچكترين مفاهيم تبيين كننده به منظور تبيين بيشينه مقدار واريانس مشترك در ماتريس همبستگي است. مفروضه اساسي تحليل عاملي اين است كه عامل هاي زيربنايي متغيرها را مي توان براي تبيين پديده هاي پيچيده به كاربرد و همبستگي هاي مشاهده شده بين متغيرها حاصل اشتراك آنها در اين عامل ها است. هدف تحليل عاملي تشخيص اين عامل هاي مشاهده ناپذير بر پايه مجموعه اي از متغيرهاي مشاهده پذير است. عامل، متغير جديدي است كه از طريق تركيب خطي نمره هاي اصلي متغيرهاي مشاهده شده بر پايه فرمول زير برآورد مي شود:
Fj=∑WjiXi=Wj1X1+Wj2X2+…+WjpXp
كه در آن W ها بيانگر ضرايب نمره عاملي و P معرف تعداد متغيرها است. اين عامل ها، في نفسه، سازه هاي فرضي يا نظري هستند كه به تفسير ثبات و هماهنگي در مجموعه داده ها كمك مي كنند. بنابراين ارزش تحليل عاملي اين است كه طرح سازماني مفيدي به دست مي دهد كه مي توان آن را براي تفسير انبوهي از رفتار با بيشترين صرفه جويي در سازه هاي تبيين كننده، به كار برد.
اميد اين است كه تعداد كمي از اين عامل ها (يعني تركيب هاي خطي نمره هاي اصلي متغيرهاي مشاهده شده) بتواند تقريبا همه اطلاعاتي را كه توسط مجموعه بزرگتري از متغيرها به دست مي آيد در برگرفته در نتيجه توصيف ويژگي هاي فرد را ساده سازد. از اين گذشته اميدوار هستيم كه با توسعه صحيح عامل ها، متغيرهايي به وجود آوريم كه دلالت بر يك سازه روشن و با معناي روان شناختي داشته باشد به گونه اي كه توصيف ما از شخص نه فقط ساده تر، بلكه روشن تر و قاطع تر باشد.

didar583 ۰۹-۸-۱۳۸۸ ۰۵:۰۰ بعد از ظهر

merc az lotfetoon
age mishe ye faile power point age mitoonid vasam bezarid ya hadeaghal ye faili ke chand ta mesale adadi dashte bashe
rasi age midoonid narme matlabam chejoori in factor analyses ro anjam mide vasam befresin
mamnoon

Astaraki ۰۹-۸-۱۳۸۸ ۰۵:۳۴ بعد از ظهر

2(ها)ضميمه
يه سري مقالات هست که از اين روش استفاده کرده اند! اميدوارم مطالعه آنها براتون مفيد باشه:)

- تحليل عاملي اكتشافي پرسشنامه هاي عوامل رواني اجتماعي اثر گذار بر فعاليت جسماني در بين دختران نوجوان ايراني

- تحليل عاملي نسخه كوتاه پرسش نامه طرحواره يانگ در نمونه غيرباليني ايراني

Astaraki ۰۹-۸-۱۳۸۸ ۰۵:۳۸ بعد از ظهر

تحلیل عاملی به عنوان روشی آماری به منظور طبقه بندی مشاهدات در دسته های کوچکتر یکی از روش های پرکاربرد در تحقیقات علوم اجتماعی و از جمله مدیریت است. این روش که حدود 100 سال پیش توسط روانشناسی به نام Charles Spearman معرفی شد به دنبال کشف مشخصه های پنهان و ارتباط مشاهدات و دسته های آماری است. در این روش فرض بر اين است که در صورت وجود متغیرهای زیاد در مشاهدات اماری میتوان آنها را بر اساس عوامل تاپیرگذار اصلی در دسته های کوچکتر طبقه بندی کرد.
http://artificial3.persiangig.com/image/Untitled-1.jpg

طرح روبرو نمایی شماتیک از فلسفه این روش را نمایش میدهد. در ادبیات این روش، مشخصه های سطحی، مشخصه هایی هستند که توسط محقق مقادیر آن در نمونه های آماری جمع آوری شده است، هر یک از عوامل و یا فاکتورها که ما در تحلیل عاملی به دنبال آنها هستیم دارای ارتباطی با این مشخصه های اصلی هستند.
تحلیل عاملی در 3 مرحله صورت میگیرد :
تولید ماتریس همبستگی برای تمامی متغیرهای نمونه آماری. ماتریس همبستگی ماتریسی مربعی از ضرایب همبستگی متغیرها با یکدیگر است.
استخراج عوامل یا فاکتورها بر اساس ضرایب همبستگی متغیرها
چرخاندن فاکتورها به منظور بیشینه سازی ارتباط بین متغیرها و برخی از فاکتورها
مثال زیر که از نمونه های از پیش ذخیره شده نرم افزار Minitab است برای آشنایی بیشتر با این روش مناسب است. نمیدانم چرا اکثر محققان ایرانی به SPPS علاقه مند هستند، اما به نظر من به دلیل سادگی بیشتر وعلی الخصوص محبوبیت بیشتر آن در بین مشاوران مدیریت و مهندسان صنایع و همچنین وجود نداشتن مثال مشابه از کاربرد این نرم افزار در تحلیل عاملی ( بنا به اطلاعات بنده ) استفاده از Minitab برای توضیح این روش جالب تر است.
اگر علاقه مند به آشنایی با مبانی ریاضی این روش هستید، بهتر است به وبلاگ دانش آماری مراجعه کنید.

ابتدا فایل حاوی داده ها را از اینجا دانلود کنید. اگر نرم افزار Minitab ندارید ولی اينترنت پر سرعت دارید، اینجا را ببینید!
فايل شامل نظرات جمع آوری شده از 38 فرد مختلف در مورد ويژگی های متفاوت محصول شرکت از جمله رنگ، عطر، بسته بندی، طعم، کیفیت و محل تولید است. هرچه امتیاز بالاتری به هر یک از این ویژگی ها داده شده باشد، نمایانگر اهمیت بیشتر آن در نظر مشتری است. هدف از انجام این تحلیل، پیدا کردن مهمترین عوامل مقبولیت در نظر مشتری و یا به عبارت دیگر کاهش دادن حوزه مطالعه از 7 متغیر به 3
در ابتدا از مسیر زیر آمار توصیفی مربوط به داده ها را توليد کنید:
Stat>Basic Statistics>Display Descriptive Statistics...

http://artificial3.persiangig.com/image/Untitled-4.jpg
خروجی نرم افزار در مورد میانگین و انحراف از معیار داده ها به صورت رو به رو خواهد بود. به وضوح پیداست که عامل کیفیت با میانگین 12.43 مهم ترین و عامل شفافیت با میانگین 0.9 کم اهمیت ترین مشخصه کیفی محصول از نظر مشتریان است. در صورت یکسان بودن میانگین ها، مشخصه ای که انحراف معیار پایین تری داشت دارای اولویت می بود.

http://artificial3.persiangig.com/image/Untitled-5.jpg
برای تولید ماتریس همبستگی متغیرها، مسیر زیر را دنیال کنید:

Stat>Basic Statistics>Correlation...
خروجی نرم افزار عبارت از ماتریسی مربعی خواهد بود که ضریب همبستگی هر یک از متغیرها با یکدیگر را نشان میدهد.

http://artificial3.persiangig.com/image/Untitled-3.jpg


برای تحلیل عاملی کافیست این مسیر را در نرم افزار باز کنید Stat>Multivariate>Factor Analysis
به غير از ستون آخر (Region) همه متغیر ها را در بخش Variable وارد کنید. از متغیر آخر به این دلیل صرفنظر کردیم که ربطی به موضوع مورد تحلیل ما ندارد و به نوعی داده اضافی است. در بخش Graphs، گزینه Scree Plot را هم فعال کنید
ماتریس حاصل، بیانگر تاثیر و اهمیت هر یک از فاکتورها روی متغیرهای تحقیق
است. این میزان که بین 1- تا 1 متغیر است و هرچه به انتهای بازه نزدیک تر باشد نمایانگر تاثیر بیشتر است و برعکس هر چه قدر به صفر نزدیک تر باشد بیانگر اهمیت کمتر آن متغیر است.

http://artificial3.persiangig.com/image/Untitled-6.jpg


با توجه به نتایج حاصله، کیفیت، رنگ و بو بالاترین اهمیت را در بین مشخصه ها دارند. با استفاده از نمودار Scree نیز به نتایج مشابهی خواهیم رسید. شیب نمودار از فاکتور 3 به بعد شروع به کاهش میکند.

http://artificial3.persiangig.com/image/1qo8qc.jpg
پی نوشت 1 : چندی پیش احمد شریفی زمیدانی از تعجب ترس آلود کارشناسی خارجی هنگام شنیدن پیشنهاد استفده از نسخه های کپی نرم افزار AutoCad گفته بود، تصویر زیر، پیشنهادات گوگل است برای واژه Minitab در سوئد، به عنوان یکی از مرفه ترین کشور های دنیا(!؟)،

http://artificial3.persiangig.com/image/4ifx8j.jpg
اگرچه من استفاده از نسخه های کرک را تایید نمیکنم، و قبلاً هم نسبت به ریسک استفاده از این نسخه ها برای کامپیوترهای شخصی و کاربرهای غیر حرفه ای هشار داده بودم، بهتر است بپذیریم که غیر قانونی اعلام کردن استفاده از این نسخه ها راه حلی عقلانی برای جلوگیری از دانلود این نرم افزار ها نیست. به عقیده من اینگونه قوانین به نوعی کم کاری، ناتوانی و حتی سیاست های غلط شرکت های تولید کننده را پوشش میدهند. اگر شرکت تولید کننده نرم افزار، قیمتی را برای محصول خود پیشنهاد میکند که اکثر قریب به اتفاق کاربران عادی قادر به پرداخت آن نیستند و از سوی دیگر با ایجاد نوعی لابی با شرکت های تولید کننده سخت افزار مصرف کننده را مجبور به خرید محصول میکند و یا به عبارت دیگر ایجاد نیاز میکند در حالی که توانایی (؟) ساخت قفل مناسب برای نرم افزار را ندارد، ناخواسته مصرف کنندگان را به سمت استفاده از نسخه های کپی سوق میدهد. این نکته را هم باید اضافه کرد که به نظر من این دانلودهای غیر قانونی و استفاده از نسخه های کرک شده و کپی، ضرر چشمگیری به تولید کننده ها نمیزنند. دستمزد های نجومی و غیر منطقی بازیگران سینما و ستاره های موسیقی ( که محصولاتشان بیش از نرم افزار های تخصصی کپی میشود!) هیچ سنخیتی با ورشکستی این صنایع ندارد. احساس شخصی من این است که این قوانین به نوعی حالت بازاریابی برای این عزیزان دارد. فرض کنید که تمامی کسانی که اکنون از نسخه های کپی ویندوز استفاده میکنند، به دلیل غیر قانونی بودن از استفاده از سیستم عامل خود داری میکردند، در اسنصورت آیا توفیقی این چنینی که حاصل همه گیر شدن ویندوز است نصیب مایکروسافت میشد؟
در پایان باید اضافه کنم که هنوز ایران به قانون حق کپی رایت نپیوسته است و شاید این یکی از معدود مزایای آن در ایران باشد. نوشتن این سطور هرگز به عنوان تایید بنده بر استفاده غیر قانونی از این نرم افزار ها نیست، بلکه فقط توصیف دیده های شخصی از شهروندان دیگر کشورها است و البته تاکید بر این نکته که خود زنی را دوست ندارم.

پی نوشت 2 : به یک روستایی ساده دل گفتند: " از روزی که مدرسه در روستای شما باز شده و بچه هایتان به مدرسه میروند زندگی تان چه تغییری کرده؟ " طرف با عصبانیت جواب داد : " خیلی بدتر شده! قبل از اینکه به پسرم ضرب و تقسیم یاد دهند، توی دو دقیقه همه گوسفندها را دقیق میشمرد، الان میره روی زمین دراز میکشه، پاهای گوسفندها را میشمره، تقسیم بر چهار میکنه! آخرشم اشتباه میکنه!"
از نظر من مهندسی صنایع مجموعی از تکنیک ها و ابزار هاست که هر یک تنها در جای خود میتوانند مفید واقع شوند. استفاده از ابزار های پیچیده و دشوار برای حل هر مساله ای لزوماً بهترین گزینه نیست. تحلیل عاملی نیز یکی از روش های آماری است که از زمان ابداع تا نیمه عمر خود دچار این سوء تفاهم شده بود به گونه ای که در دهه 50 میلادی به دلیل استفاده بیش از اندازه و بی مورد آن توسط روانشناسان و محققان علوم اجتماعی که این روش را تنها روش و کلید حل تمامی رموز تحقیق خود می دانستند تقریباً بی اعتبار شده بود. شناخت محل و نحوه استفاده درست هر یک از این روش ها از نطر من به شناخت چگونگی کارکرد آنها ارجحیت دارد.
دلیل علاقه مندی من به این روش، استفاده ای است که در جریان تحقیقات تزم از آن برای تحلیل نظرات گردآوری شده از کارشناسان مختلف و تبدیل داده های کمی به کیفی به منظور طبقه بندی مهمترین عوامل موفقیت در مدیریت ریسک میکنم. مثالی که ارائه شد، تنها یک مساله بسیار ساده و فقط در جهت روشن کردن کاربرد این روش بود بی تردید روش های بسیار ساده تر و مفید تری را میتوان برای حل مساله ارائه شده پیشنهاد کرد.

منبع:
وبلاگ يادداشت های مديريت ريسک

دوست عزيز(didar583) ميتوانيد از طريق اين وبلاگ با نويسنده اين مطلب تماس بگيريد( چون فايلي که براي دانلود گذاشته بودند از بين رفته!)

bromideh ۱۲-۲۲-۱۳۸۹ ۰۴:۲۴ بعد از ظهر

آقا اين داده را نمي تواني همينجا آپلود كني؟

mahdi053 ۰۲-۲۹-۱۳۹۲ ۱۰:۰۷ بعد از ظهر

سلام
دوستان من یه سئوال دارم: آیا می شه از اطلاعات کلی که در ابتدای پرسشنامه می گیریم مثل جنسیت و سن، بعنوان عامل در تحلیل عاملی سئوالات مطرح شده استفاده کرد؟
آیا شما فایل آموزشی برای انجام اینکار از صفر تا 100 دارید؟
ممنون


زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۱۱:۲۵ بعد از ظهر ميباشد.

Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.