پيشرفت هايي در الگوريتم ها و نرم افزار متن كاوي
خلاصه مقاله:
ميزان اطلاعات متني ذخيره شده روي كامپيوترهاي شخصي يا روي وب به سرعت در حال افزايش است. هر كامپيوتر به علت پيشرفتي كه در سخت افزارهاي ذخيره سازي داشته، مي تواند با ميزان حجيمي از داده ها كار كند.جمع آوري اطلاعات آسان است ، يافتن اطلاعات وابسته در مسير تقاضا مي تواند سخت باشد.همچنان كه اندازه اطلاعات سير صعودي را دنبال مي كند، ايجاد ساختارهاي داده(ايندكس ها) براي بازيابي آسان اطلاعات وابسته پيچيده مي شود. توانايي استخراج الگوها يا ويژگي هاي خاص براي يافتن اطلاعات منحصر بفرد مورد نياز، مسئله مهمي در بازيابي اطلاعات مي باشد. در اين مقاله پيشرفتهاي جديد در طراحي نرم افزارهايي براي ايجاد ايندكس هاي حجيم (نرم افزار تجزيه كننده متن عمومي(gtp) )و الگوريتم هايي براي استخراج الگوها از رسانه هاي متني ارائه مي شود.
كلمات كليدي:
داده كاوي ، متن كاوي، شاخص گذاري ، بازيابي اطلاعات ، تجزيه كننده متن عمومي (gtp)