سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی

بهناز کریمی یزدی; سینا دامی

سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی

محل انتشار: چهارمین همایش ملی توسعه علوم فناوریهای نوین در مدیریت، حسابداری و کامپیوتر

سال انتشار: 1400

نوع سند: مقاله کنفرانسی

زبان: فارسی

مشاهده: 231

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

دریافت فایل کامل مقاله

صدور گواهی نمایه سازی
من نویسنده این مقاله هستم

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

هوش مصنوعی > داده کاوی

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

https://civilica.com/doc/1317408

شناسه ملی سند علمی:

IVCONF04_254

تاریخ نمایه سازی: 25 آبان 1400

چکیده مقاله:

خوشه بندی یکی از محبوب ترین الگوریتم های داده کاوی است و به طور گسترده در زمینه متن مورد مطالعه قرار گرفته است.خوشه بندی وظیفه یافتن گروه هایی از اسناد مشابه در مجموعه ای از اسناد است شباهت با استفاده از یک تابع شباهت محاسبهمی شود خوشه بندی اسناد کاربردهای فراوانی در بسیاری از حوزه های داده کاوی و بازیابی اطلاعات دارد خوشه های اسناد به صورتخودکار از مجموعه اسناد تولید می شوند با آنکه خوشه بندی اسناد، گام مهمی در سازماندهی اسناد متنی است ولی به تنهایی کافینیست چون خوشه های حاصله ملموس نیستند و نیاز است تا با برچسب هایی تفسیر شوند و به این صورت قابل استفاده تر خواهد بود دراین پژوهش روشی برای برچسب زنی اسناد مبتنی بر خوشه بندی به منظور سازماندهی توصیفی اسناد متنی ارایه شد. برای سنجشنتایج حاصله از مقایسه روش پیشنهادی با دو روش دیگر مبتنی بر الگوریتم های EM و DBSCAN استفاده شده است و پنجمجموعه داده از داده های موجود در ODP استفاده شده است نتایج تجربی نشان داد که عملکرد روش پیشنهادی از هر دو روشبطور میانگین بهتر است.

کلیدواژه ها:

داده کاوی ، خوشه بندی ، سازماندهی توصیفی اسناد ، برچسب زنی اسناد متنی

نویسندگان

بهناز کریمی یزدی

دانشجوی ارشد مهندسی فناوری اطلاعات، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران

سینا دامی

استادیار مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران