دسته بندی متون
تاریخ انتشار : 1397/2/29
بازدید : 521

"رده‌بندی" خودکار متون در حوزه پردازش زبان‌های طبیعی از جمله تحلیل‌های پراهمیت می‌باشد. به منظور درک بهتر از رده‌بندی متون می‌توان به روند شناسایی رده یا طبقه یک متن ناشناخته مثال زد. این نرم‌افزار با استفاده از الگوریتم K نزدیک‌ترین همسایه و دو معیار فاصله متون، عملیات خود را انجام می‌دهد.
در این نسخه سه رده بندی اصلی در زمینه "فقه اسلامی" با 9 کلاس، "متون خبری فارسی" با 7 کلاس و "متون خبری فارسی" با 10 کلاس وجود دارد. رده بندی فقه اسلامی شامل کلاس‌های(ابواب) القصاص و الدیات، الحج، المکاسب، المیراث، النکاح، الصلاة، الطهارة و الزکوة می‌باشد. رده بندی متون خبری با 7 کلاس نیز شامل کلاس‌های اقتصادی، اجتماعی، حوادث، خارجی، سیاسی، تکنولوژی و ورزشی می‌باشد. در رده بندی 10 کلاسه متون خبری فارسی نیز کلاس‌های ادبی-هنری، اخبار کوتاه، بورس و بانک، اقتصاد جهانی، اجتماعی، علمی و فرهنگی، اقتصادی، گردش‌گری، گوناگون و حوادث وجود دارند.
کاربردهای این نرم‌افزار عبارتند از:

  • رده‌بندی اتوماتیک مستندات متنی ناشناخته
  • ترجمه ماشینی
  • تبدیل نوشتار به گفتار
  • نویسه‌خوان نوری (OCR)

 

برگرفته از سایت : http://textmining.noorsoft.org

ارسال نظر