Artificial Intelligence - هوش مصنوعی  
انجمن را در گوگل محبوب کنيد :

بازگشت   Artificial Intelligence - هوش مصنوعی > پردازش صوت، گفتار و زبان طبيعی ! > دادگان‌هاي متنی، گفتاری و زباني (Text, Language and Speech Corpora)


 
تبليغات سايت
Iranian Association for the Advancement of Artificial Intelligence
ارسال تاپيک جديد  پاسخ
 
LinkBack ابزارهاي تاپيک نحوه نمايش
قديمي ۰۲-۱۳-۱۳۹۱, ۰۸:۱۲ بعد از ظهر   #1 (لینک دائم)
عضو جدید
 
آواتار h.alizadeh
 
تاريخ عضويت: مهر ۱۳۹۰
پست ها: 7
تشكرها: 15
0 تشكر در 0 پست
Question پایگاه داده ای از کلمات بهمراه تلفظ آنها

سلام،

یک دیکشنری (پایگاه داده منظورمه) از کلمات فارسی می خواستم کوچک و بزرگ بودنش زیاد واسم مهم نیست یعنی جامع بودن زیاد واسم مهم نیست بهمراه طریقه ی تلفظش می خواستم سریع اگر کسی میشناسه لطف کنه بگه ممنون هستم.
h.alizadeh آفلاين است   پاسخ با نقل قول

  #ADS
نشان دهنده تبلیغات
تبليغگر
 
 
 
تاريخ عضويت: -
محل سكونت: -
سن: 2010
پست ها: -
 

نشان دهنده تبلیغات is online  
قديمي ۰۲-۱۳-۱۳۹۱, ۰۸:۱۶ بعد از ظهر   #2 (لینک دائم)
عضو جدید
 
آواتار h.alizadeh
 
تاريخ عضويت: مهر ۱۳۹۰
پست ها: 7
تشكرها: 15
0 تشكر در 0 پست
پيش فرض

البته خودم یکی دارم اما تقریباً همش پیشوند و پسوند هستند تا کلمه. می خواستم توش کلمه باشه.
h.alizadeh آفلاين است   پاسخ با نقل قول
قديمي ۰۲-۱۳-۱۳۹۱, ۰۹:۵۶ بعد از ظهر   #3 (لینک دائم)
عضو جدید
 
آواتار aminfarajian
 
تاريخ عضويت: فروردين ۱۳۹۰
پست ها: 9
تشكرها: 0
25 تشكر در 8 پست
پيش فرض

سلام.
پیشنهاد می کنم یه نگاهی به پروژه «واژگان زایا» انجام شده در شورای عالی اطلاع رسانی بندازید.
یکی از فعالیتهای صورت گرفته در این پروژه، تولید پایگاه داده کلمات فارسی به همراه صورت واجی اونهاست. در ادامه چند مورد از کلمات موجود در این پایگاه داده رو براتون گذاشتم. امیدوارم که براتون مفید باشه.

HTML Code:
"صورت نوشتاری", "صورت واجی"
faxroddowle","فخرالدوله"
faxrol'eslAm","فخرالاسلام"
faxrolmohaqqeqin","فخرالمحققین"
faxrolmuluk","فخرالملوک"
faxrossAdAt","فخرالسادات"
fAxte","فاخته"
faxxAr","فخار"
faxxAri","فخاری"
faxxArmaneS","فخارمنش"
fAybergelAs","فایبرگلاس"
fAyedat","فایدت"
fAyede","فایده"
fAyedemAnd","فایده‌‌مند","
fAyeq","فایق"
aminfarajian آفلاين است   پاسخ با نقل قول
از aminfarajian تشكر كرده اند:
h.alizadeh (۰۲-۱۳-۱۳۹۱), samiran90 (۰۸-۴-۱۳۹۲)
قديمي ۰۲-۱۳-۱۳۹۱, ۱۰:۰۸ بعد از ظهر   #4 (لینک دائم)
عضو جدید
 
آواتار h.alizadeh
 
تاريخ عضويت: مهر ۱۳۹۰
پست ها: 7
تشكرها: 15
0 تشكر در 0 پست
پيش فرض

ممنونم ازتون. من فردا دانلود می کنم فقط یک سوال اینکه لغات در پایگاه داده هست یا فایل pdf?
h.alizadeh آفلاين است   پاسخ با نقل قول
قديمي ۰۲-۱۳-۱۳۹۱, ۱۰:۲۸ بعد از ظهر   #5 (لینک دائم)
عضو جدید
 
آواتار aminfarajian
 
تاريخ عضويت: فروردين ۱۳۹۰
پست ها: 9
تشكرها: 0
25 تشكر در 8 پست
پيش فرض

خواهش میکنم
این پایگاه داده دو نسخه تحت ویندوز و تحت لینوکس داره. نسخه تحت ویندوز یه فایل access هستش و نسخه تحت لینوکس (تا اونجایی که یادمه) برای استفاده در mysql تهیه شده. یه فایل متنیه که با استفاده از اون میتونید به راحتی جداول رو بسازید و داده ها رو در جداول insert کنید. شما اگه بخوای از این فایل استفاده کنی میتونی به راحتی با یک سری پردازش ساده، متون اضافی رو حذف کنی و فقط کلمات و صورت واجی اونها رو نگه داری. اگر هم بخوای از نسخه تحت ویندوز استفاده کنی که دیگه مشکلی نیست و به راحتی قابل استفاده اس.
موفق باشی و در پناه حضرت حق
aminfarajian آفلاين است   پاسخ با نقل قول
از aminfarajian تشكر كرده است:
h.alizadeh (۰۲-۱۳-۱۳۹۱)
قديمي ۰۲-۱۳-۱۳۹۱, ۱۰:۴۶ بعد از ظهر   #6 (لینک دائم)
عضو جدید
 
آواتار h.alizadeh
 
تاريخ عضويت: مهر ۱۳۹۰
پست ها: 7
تشكرها: 15
0 تشكر در 0 پست
پيش فرض

همین لینک هست ؟
پورتال شورای عالی اطلاع رسانی
h.alizadeh آفلاين است   پاسخ با نقل قول
قديمي ۰۲-۱۳-۱۳۹۱, ۱۰:۵۳ بعد از ظهر   #7 (لینک دائم)
عضو جدید
 
آواتار aminfarajian
 
تاريخ عضويت: فروردين ۱۳۹۰
پست ها: 9
تشكرها: 0
25 تشكر در 8 پست
پيش فرض

بله
خودشه. البته این پروژه در حقیقت یک تحلیل گر صرفی (تکواژشناختی) زبان فارسی هم محسوب میشه. به عبارت دیگه یک نرم افزار هم در این پروژه توسعه داده شده که با استفاده از این پایگاه داده، وظیفه تحلیل صرفی کلمات فارسی رو هم انجام میده. شما با دانلود بسته ای که در لینک بالا قرار داره هم به اون نرم افزار دسترسی خواهید داشت و هم به پایگاه داده واژگان (برای هر دو بستر ویندوز و لینوکس).

موفق باشید
aminfarajian آفلاين است   پاسخ با نقل قول
از aminfarajian تشكر كرده است:
h.alizadeh (۰۲-۱۳-۱۳۹۱)
قديمي ۰۲-۱۳-۱۳۹۱, ۱۱:۳۸ بعد از ظهر   #8 (لینک دائم)
عضو جدید
 
آواتار h.alizadeh
 
تاريخ عضويت: مهر ۱۳۹۰
پست ها: 7
تشكرها: 15
0 تشكر در 0 پست
پيش فرض

در مقاله ای که من می خوام پیاده سازی کنم اومده که از Webster's Pocket Dictionary استفاده کرده کسی آشنایی داره بااین دیکشنری ?
در حالیکه ساختار مقاله به گونه ای هست که پایگاه داده کلمات فارسی بهمراه تلفظشونه و گفته از دیکشنری بالا استفاده شده! چطوریه به نظرتون؟
h.alizadeh آفلاين است   پاسخ با نقل قول
قديمي ۰۲-۱۴-۱۳۹۱, ۱۲:۴۹ قبل از ظهر   #9 (لینک دائم)
عضو جدید
 
آواتار h.alizadeh
 
تاريخ عضويت: مهر ۱۳۹۰
پست ها: 7
تشكرها: 15
0 تشكر در 0 پست
پيش فرض

من دانلود کردم و فقط همین پایگاه داده رو دیدم
flexicon.mdb
که پیشوند و پسوند هست اکثرا و خیلی کم توش کلمه ای پیدا میشه! و این کلمات مثالی شما اصلا توش نیست.

نقل قول:
نوشته اصلي بوسيله aminfarajian نمايش پست
سلام.
پیشنهاد می کنم یه نگاهی به پروژه «واژگان زایا» انجام شده در شورای عالی اطلاع رسانی بندازید.
یکی از فعالیتهای صورت گرفته در این پروژه، تولید پایگاه داده کلمات فارسی به همراه صورت واجی اونهاست. در ادامه چند مورد از کلمات موجود در این پایگاه داده رو براتون گذاشتم. امیدوارم که براتون مفید باشه.

HTML Code:
"صورت نوشتاری", "صورت واجی"
faxroddowle","فخرالدوله"
faxrol'eslam","فخرالاسلام"
faxrolmohaqqeqin","فخرالمحققین"
faxrolmuluk","فخرالملوک"
faxrossadat","فخرالسادات"
faxte","فاخته"
faxxar","فخار"
faxxari","فخاری"
faxxarmanes","فخارمنش"
faybergelas","فایبرگلاس"
fayedat","فایدت"
fayede","فایده"
fayedemand","فایده‌‌مند","
fayeq","فایق"
h.alizadeh آفلاين است   پاسخ با نقل قول
قديمي ۰۲-۱۴-۱۳۹۱, ۰۷:۰۵ قبل از ظهر   #10 (لینک دائم)
عضو جدید
 
آواتار aminfarajian
 
تاريخ عضويت: فروردين ۱۳۹۰
پست ها: 9
تشكرها: 0
25 تشكر در 8 پست
پيش فرض

عجیبه.
من همین فایل رو دانلود کردم. توی پوشه source، پوشه Linux یه پوشه هست به اسم ttpdb که دو تا فایل داخل اون هست: Define.txt که برای ساخت جداول و فیلدهای اونها استفاده میشه و فایل Data.txt که تمامی اطلاعات مورد نظر در این فایل هست. یه چیزی در حدود ۵۴ هزار رکورد داره که اولی هاش پسوندها و پیشوندها هستن ولی پایین تر که میرید می بینید سایر کلمات رو هم داره. در ضمن برچسب های نحوی این کلمات رو هم به همراه یه سری اطلاعات مفید دیگه در خصوص هر کلمه میتونید جلوی هر کلمه ببینید. این در خصوص نسخه لینوکسی.
اما با توجه به این که من در حال حاضر دسترسی به ویندوز ندارم متاسفانه نمیتونم محتویات فایل FLEXICON.MDB رو ببینم. اما این رو مطمئنم که توی این فایل چندتا جدول بود که یکیش واسه پسوندها و پیشوندها بود، یکیش واسه اطلاعات و توضیحات برچسبها، یکیش واسه کلمات و چندتا جدول دیگه که من الان یادم نمیاد.
اگر این فایل رو با access باز کنید حتما جدول ها رو میتونید ببینید.

موفق باشید.
aminfarajian آفلاين است   پاسخ با نقل قول
از aminfarajian تشكر كرده اند:
h.alizadeh (۰۲-۱۴-۱۳۹۱), samiran90 (۰۸-۴-۱۳۹۲), tavakoli1984 (۰۴-۱۲-۱۳۹۱)
پاسخ



كاربران در حال ديدن تاپيک: 1 (0 عضو و 1 مهمان)
 

قوانين ارسال
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is فعال
شکلکها فعال است
كد [IMG] فعال است
كدهاي HTML غير فعال است
Trackbacks are فعال
Pingbacks are فعال
Refbacks are فعال




زمان محلي شما با تنظيم GMT +3.5 هم اکنون ۰۶:۳۶ قبل از ظهر ميباشد.


Powered by vBulletin® Version 3.8.3
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Search Engine Friendly URLs by vBSEO 3.1.0 ©2007, Crawlability, Inc.

Teach and Learn at Hexib | Sponsored by www.Syavash.com and Product In Review

استفاده از مطالب انجمن در سایر سایت ها، تنها با ذکر انجمن هوش مصنوعي به عنوان منبع و لینک مستقیم به خود مطلب مجاز است

Inactive Reminders By Icora Web Design