رشد فراوان نظرات دیجیتال کاربران در مورد خدمات و محصولات منجر به توسعه روشهای عقیدهکاوی شده است. مدلهای یادگیری ماشین نظارتی در این زمینه به نتایج خوبی دست یافتهاند. هرچند، این روشها نیاز به تعداد کافی دادههای آموزشی برچسب دار دارند که آماده سازی آن ها نیازمند چکیده کامل
رشد فراوان نظرات دیجیتال کاربران در مورد خدمات و محصولات منجر به توسعه روشهای عقیدهکاوی شده است. مدلهای یادگیری ماشین نظارتی در این زمینه به نتایج خوبی دست یافتهاند. هرچند، این روشها نیاز به تعداد کافی دادههای آموزشی برچسب دار دارند که آماده سازی آن ها نیازمند صرف هزینه و زمان زیاد است. در این مقاله یک رویکرد نیمهنظارتی جهت تحلیل نظرات فارسی کاربران پیشنهادشده که از دادههای بدون برچسب فراوان همراه با تعداد کمی دادۀ برچسبدار در مرحله آموزش بهره می گیرد. با توجه به عملکرد مناسب روش ماشین بردار پشتیبان نظارتی جهت عقیدهکاوی، به کارگیری روش نیمهنظارتی ماشین بردار پشتیبان پیشنهاد شده است. این روش در مقایسه با روشهای موجود با چالش تقویت خطا مواجه نبوده و قادر به تخمین قطبیت نظراتی که در مرحله آموزش دیده نشدهاند، نیز است. روش پیشنهادی روی مجموعه داده نظرات دیجیکالا مورد ارزیابی قرارگرفته و با الگوریتم ماشین بردار پشتیبان بر اساس ملاکهای دقت، صحت، بازخوانی و F1 مقایسه شده است. نتایج به دست آمده حاکی از عملکرد بهتر روش نیمهنظارتی در مقایسه با روش نظارتی و نیز روش نیمه نظارتی خودآموزی است.
پرونده مقاله