سبد خرید شما

اطلاعات داده

حجم: نامشخص
فرمت: نامشخص
وضعیت دریافت: برون سازمانی

پیکره موجودیت‌های نامدار آرمان‌

معرفی: 

پیکرۀ موجودیت‌های نامدار آرمان‌ (ArmanPersoNER) پیکره‌ای است که به صورت دستی برچسب خورده است و فقط برای کارهای پژوهشی منتشر شده است. این داده شامل ۲۵۰۰۱۵ توکن و ۷۶۸۲ جملۀ فارسی است. هر فایل حاوی یک توکن و برچسب‌های دستی آنها در هر خط است چرا که هر جمله با یک خط جدا شده است. برچسب‌های NER در فرمت IOB هستند. در این پیکره، ۶ نوع موجودیت نامدار (شامل شخص، سازمان، مکان، امکانات، تولیدات، و رویداد) مشخص شده است.

*اطلاعات ارجاع: 
  • Poostchi, H.‎, Zare Borzeshi, E.‎, Abdous, M.‎, and Piccardi, M.‎ (2016)‎.‎ PersoNER: Persian Named-Entity Recognition.‎ In The 26th International Conference on Computational Linguistics ‪(COLING 2016)‬, ۳۳۸۱- ۳۳۸۹. Osaka, Japan.‎
  • Poostchi, H.‎, Zare Borzeshi, E.‎, and Piccardi, M.‎ (2018, May).‎ BiLSTM-CRF for Persian Named-Entity Recognition;‎ ArmanPersoNERCorpus: the First Entity-Annotated Persian Dataset.In The 11th Edition of the Language Resources and Evaluation Conference ‪(LREC)‬, Miyazaki, Japan, ISLRN 399-379-640-828-6, ISLRN 921-509-141-609-6.‎

اطلاعات انتشار:

ناشر
پژوهشگر(ان) طرح
مجوز
بدون مجوز
تاریخ ثبت در پیکره‌گان
۱۳۹۷-۰۸-۰۷
تاریخ آخرین تغییر
۱۳۹۸-۰۲-۲۹
شناسه
P3970807a
آمار بازدید
۳۳۴۷

© ۲۰۱۸ CRCIS All Rights Reserved.‎