سبد خرید شما

اطلاعات داده

حجم: ۳.۰۶ MB
فرمت: data
وضعیت دریافت: درون سازمانی

واژگان زایای زبان فارسی

معرفی: 

واژگان زایای زبان فارسی واژگانی است شامل حدود ۵۵ هزار مدخل که هر مدخل دارای اطلاعات مربوط به صورت نوشتاری واژه در خط فارسی، ساخت‌واجی، مقولهٔ واژگانی، الگوی تکیه و بسامد واژه می‌باشد. برای تهیهٔ واژگان زایا، یک پیکرهٔ متنی ۱۰ میلیون کلمه‌ای ملاک استخراج واژه‌ها قرار گرفته است. واژگان زایا از حدود ۱۰۰ هزار کلمه با بسامدهای متفاوت تشکیل شده است. بعد از حذف صورت‌های تصریفی از فهرست فوق، حدود ۴۴ هزار واژه به مفهوم علمی آن به دست آمد. در بررسی فهرست واژه‌های حاصل از پیکرهٔ متنی معلوم شد که برخی واژه‌های عامیانه و برخی واژه‌های کاملاً علمی در فهرست ۴۴ هزار مدخلی غایب هستند. برای رفع این کاستی فهرست فوق با فرهنگ فارسی امروز (صدری‌افشار، ۱۳۸۱) مقایسه شد و حدود ۱۱ هزار مدخل جدید به فهرست واژه‌ها اضافه شد و واژگان ۵۵ هزار مدخلی به دست آمد.

*اطلاعات ارجاع: 

اسلامی، محرم، شریفی آتشگاه، مسعود، علیزاده لمجیری، صدیقه، و زندی، طاهره. (۱۳۸۳). واژگان زایای زبان فارسی. مجموعه مقالات اولین کارگاه پژوهشی زبان فارسی و رایانه. تهران.

اطلاعات انتشار:

ناشر
دبیرخانه شورای عالی اطلاع‌رسانی
مجوز
بدون مجوز
تاریخ ثبت در پیکره‌گان
۱۳۹۱-۱۱-۰۵
تاریخ آخرین تغییر
۱۳۹۷-۰۵-۰۷
شناسه
D3911105a
آمار بازدید
۵۱۰۶

© ۲۰۱۸ CRCIS All Rights Reserved.‎