سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

پیکره تشخیص خودکار جنسیت

  • قیمت: نامشخص

    دریافت داده
معرفی: 

پیکرهٔ تشخیص خودکار جنسیت شامل دو بخش اصلی است که عبارتند از: ۱- بخش متون رسمی که با مشخص کردن جنسیت نویسندگان متون داستانی موجود در پیکرهٔ بی‌جن‌خان و داستان‌های دیگر برگرفته از اینترنت به دست آمد. برای حذف تأثیر عامل جنسیت مترجم بر روی متن اصلی اثر، تمامی داستان‌ها و رمان‌های غیرفارسی از مجموعه حذف شد. در نهایت در هر دو دسته زن و مرد تعداد مساوی ۲۵۴ داستان در مجموعه قرار داده شد. ۲ - بخش متون غیررسمی. برای تهیه این بخش، از رویکرد وب برای پیکره استفاده شد. مهم‌ترین چالش، شناسایی سایتی فارسی بود که اولاً محتوای متنی آن توسط خود کاربر نوشته شده باشد و ثانیاً نام نویسنده هر متن نیز مشخص شده باشد. برای این منظور از نظرات کاربران در سایت «هلو کیش» استفاده شد. برای استخراج نظرات مرتبط با نظردهندگان زن و مرد، ابتدا لیستی از اسامی فارسی زن و مرد تفکیک‌شده تهیه گشت. سپس نام نویسنده نظر با این لیست اسامی تطبیق داده شد و نظرات برحسب این لیست تفکیک‌شده، در دو دسته زن و مرد قرار گرفت.

*اطلاعات ارجاع: 

مرادی، م.، و بحرانی، م. (۱۳۹۴). تشخیص خودکار جنسیت نویسنده در متون فارسی. پردازش علائم و داده‌ها ۱۲ (۴)، ۸۳-۹۴.

اطلاعات انتشار:

ناشر
پژوهشگر(ان) طرح
شرایط استفاده

برای دریافت داده یا کسب اطلاعات بیشتر با ناشر(ان) تماس حاصل فرمایید.

مجوز
نامشخص
تاریخ ثبت در پیکره‌گان
۱۳۹۵-۰۳-۱۹
تاریخ آخرین تغییر
۱۳۹۷-۱۱-۰۳
شناسه
D3950319
آمار بازدید
۴۱۳۵

© ۲۰۱۸ CRCIS All Rights Reserved.‎