جای خوشحالی داره که می بینم در کشور خودمون دانشجویان رو به سمت تحقیق روی پردازش زبان فارسی جهت می دن. مهندس جان حالا شما که در خصوص مسائل پردازش زبان طبیعی فعالیت می خوای بکنی تو دوره کاردانی درس هوش رو که درس نمیدن، مگر خودت تجربی و غیره فعالیت کرده باشی. در هر حال اگه می خوای روی پروژت کارکنی توصیه می کنم بری سراق تحلیل آماری اخبار. به عنوان مثال rss سایت های خبری کشور رو تحلیل کنی به شکل آماری و تعداد تکرار خبرها و کلمات اونها و تعداد تکرار جفت واژگان و یا وجود یک کلمه در بین خبر و همچنین وجود دو کلمه در متن یک خبر رو تحلیل آماری بکنی. البته بعضی واژه ها مثل "و" یا "به" خب همه جا هستن، شما هم می تونی این ها رو فیلتر کنی. نهایتا می تونی یه لطفی هم بکنی و تنها 3000 کلمه رو انتخاب کنی و مشخصی کنی که مثلا اون کلمه فعل هست یا اسم یا حرف یا هرچی (مثل علامت سوال) و بعد یک گراف از اونها رو ارائه بکنی.
البته این تو چند لحظه به ذهنم رسید، دوستان می تونن بیشتر وارد این بحث بشن.
__________________
یک روز یک ماشین برای انتخابات ریاست جمهوری ثبت نام می کند
چه بخواهیم چه نخواهیم این اتفاق می افتد.
|