سبد خرید شما

اطلاعات داده

حجم: ۳.۰۶ MB
فرمت: data
وضعیت دریافت: درون سازمانی

واژگان زایای زبان فارسی

معرفی: 

واژگان زایای زبان فارسی واژگانی است شامل حدود ۵۵ هزار مدخل که هر مدخل دارای اطلاعات مربوط به صورت نوشتاری واژه در خط فارسی، ساخت‌واجی، مقولهٔ واژگانی، الگوی تکیه و بسامد واژه می‌باشد. برای تهیهٔ واژگان زایا، یک پیکرهٔ متنی ۱۰ میلیون کلمه‌ای ملاک استخراج واژه‌ها قرار گرفته است. واژگان زایا از حدود ۱۰۰ هزار کلمه با بسامدهای متفاوت تشکیل شده است. بعد از حذف صورت‌های تصریفی از فهرست فوق، حدود ۴۴ هزار واژه به مفهوم علمی آن به دست آمد. در بررسی فهرست واژه‌های حاصل از پیکرهٔ متنی معلوم شد که برخی واژه‌های عامیانه و برخی واژه‌های کاملاً علمی در فهرست ۴۴ هزار مدخلی غایب هستند. برای رفع این کاستی فهرست فوق با فرهنگ فارسی امروز (صدری‌افشار، ۱۳۸۱) مقایسه شد و حدود ۱۱ هزار مدخل جدید به فهرست واژه‌ها اضافه شد و واژگان ۵۵ هزار مدخلی به دست آمد.

*اطلاعات ارجاع: 

اسلامی، م.، شریفی آتشگاه، م.، علیزاده لمجیری، ص.، و زندی، ط. (۱۳۸۳). واژگان زایای زبان فارسی. مجموعه مقالات اولین کارگاه پژوهشی زبان فارسی و رایانه. تهران.

اطلاعات انتشار:

ناشر
دبیرخانهٔ شورای عالی اطلاع‌رسانی
مجوز
تاریخ ثبت در پیکره‌گان
۱۳۹۱-۱۱-۰۵
تاریخ آخرین تغییر
۱۳۹۹-۰۶-۰۲
شناسه
D3911105a
آمار بازدید
۱۱۸۹۲

© ۲۰۱۸ CRCIS All Rights Reserved.‎