نقل قول:
نوشته اصلي بوسيله tarane khanoom
سلام من میخوام شبکه عصبی را اموزش بدم تا کلمات خاصی که در ایمیل هست را شناسایی کند مشکلم اینه که چطور کلمات را به ماتریس عددی تبدیل کنم ؟
|
سلام دوست عزیز
ماهیت کار شما تشخیص کاراکتر نیست چون نیاز به تشخیص کلمات خاص دارید
در ضمن برای تشخیص کلمات توسط شبکه عصبی باید کلمه ها توسط یک encoding خاص کد گذاری بشن. البته با توجه به متغیر بودن تعداد حروف لغات کار آسونی نیست. در صورتی که کلمات خاص مورد نظر شما محدود باشن میشه این نوع کد گذاری رو اعمال کرد.
این نوع کد گذاری ها در شبکه های عصبی انجمنی استفاده میشن. که معمولا از بردارهای Orthogonal برای این کار استفاده میکنن. همچنین ترتیب قرار گیری الگو ها هم مشخص میشن.
یکسری روش ها در داده کاوی برای کد گذاری متن استفاده میشه که توی این لینک ها توضیح داده شده. امیدوارم کمکت کنه.
Non-negative matrix factorization - Wikipedia, the free encyclopedia
Document-term matrix - Wikipedia, the free encyclopedia
tf–idf - Wikipedia, the free encyclopedia
موفق باشی