قیمت: رایگان
پیکرهٔ چندزبانهٔ رایانامه برای تشخیص ریسمانهای گفتگوی چندزبانه در آزمایشگاه سیستمهای هوشمند اطلاعات دانشگاه تهران تهیه شده است. نام این پیکره «Multilingual-BC3» است که در حقیقت یک پیکرهٔ ساختگی چندزبانه است که حاصل ترجمهٔ بخشی از پیکرۀ تکزبانه BC3، توسط عامل انسانی است. پیکرۀ اولیه BC3 به صورت تکزبانه و در زبان انگلیسی توسط آزمایشگاه هوش محاسباتی در دانشگاه British Columbia ساخته شده است. این پیکره، یک زیرمجموعه از پیکرهٔ W3C است که دارای برچسبهای معنایی، نظیر حالت گفتار در سطح جمله و برچسب خلاصهسازی گفتگوها است. پیکرهٔ ConThread-BC3 یک نسخه از BC3 است که در آن، برچسبهای نشاندهندهٔ ساختار ریسمانهای گفتگو و همچنین اطلاعات مربوط به برچسب متن اصلی و متن نقلقول رایانامهها اضافه شده است. پیکرهٔ Multilingual-BC3، در دو نسخه تهیه شده که نسخهٔ اول، گونهای چندزبانه از نسخهٔ اولیه BC3 و نسخهٔ دوم گونهای چندزبانه از ConThread-BC3 است. قابل ذکر است که اطلاعات برچسبهای موجود در نسخههای تکزبانه، مستقل از زبان بوده و قابل گسترش به Multilingual-BC3 خواهند بود.
Dehghani, M., Shakery, A., Asadpour, M., & Koushkestani, A. (2013). A Learning Approach for Email Conversation Thread Reconstruction. Journal of Information Science (JIS), 39 (6), ۸۴۶-۸۶۳.
اطلاعات انتشار:
ناشر | |
---|---|
مجوز | نامشخص |
تاریخ ثبت در پیکرهگان | ۱۳۹۵-۰۲-۰۴ |
تاریخ آخرین تغییر | ۱۳۹۸-۰۲-۰۳ |
شناسه | D3950204a |
آمار بازدید | ۷۶۸۷ |