دستهبندی اسناد
ظاهر
دسته بندی اسناد یک مفهوم در سیستمهای اطلاعاتی است.در دسته بندی اسناد یک سند را به یک رده بر اساس محتوای آن اختصاص می دهیم.
انواع
[ویرایش]سه نوع دسته بندی برای اطلاعات داریم:
- دسته بندی نظارت شده : از یک منبع خارجی مثل بازخورد کاربر برای تصحیح استفاده می کنیم.
- دسته بندی نظارت نشده : بدون هیچ منبع خارجی دسته بندی را انجام می دهیم.
- دسته بندی شبه نظارت شده : ترکیبی از دو شیوه بالاست که تنها بخشی از اسناد توسط منبع خارجی دسته بندی می شوند.
شیوهها
[ویرایش]دسته بندی انواع زیادی دارند:
- k امین نزدیکترین همسایه (KNN)
- فراوانی وزنی (tf-idf)
- شبکه عصبی مصنوعی
کاربردها
[ویرایش]کاربردهای بسیار متنوعی برای طبقهبندی موضوعی اسناد وجود دارد، مثلاً شناسایی هرزنامهی الکترونیکی، موتورهای جستجو، تحلیل محتوای دیجیتال و ...
جستارهای وابسته
[ویرایش]منابع
[ویرایش]http://en.wikipedia.org/wiki/Document_classification