سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی

بهناز, کریمی یزدی; سینا, دامی

سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی

عنوان مقاله: سازماندهی توصیفی اسناد متنی با استفاده از برچسب زنی مبتنی بر خوشه بندی
شناسه ملی مقاله: IVCONF04_254
منتشر شده در چهارمین همایش ملی توسعه علوم فناوریهای نوین در مدیریت، حسابداری و کامپیوتر در سال 1400

مشخصات نویسندگان مقاله:

بهناز کریمی یزدی - دانشجوی ارشد مهندسی فناوری اطلاعات، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران
سینا دامی - استادیار مهندسی کامپیوتر، واحد تهران غرب، دانشگاه آزاد اسلامی، تهران، ایران

خلاصه مقاله:

خوشه بندی یکی از محبوب ترین الگوریتم های داده کاوی است و به طور گسترده در زمینه متن مورد مطالعه قرار گرفته است.خوشه بندی وظیفه یافتن گروه هایی از اسناد مشابه در مجموعه ای از اسناد است شباهت با استفاده از یک تابع شباهت محاسبهمی شود خوشه بندی اسناد کاربردهای فراوانی در بسیاری از حوزه های داده کاوی و بازیابی اطلاعات دارد خوشه های اسناد به صورتخودکار از مجموعه اسناد تولید می شوند با آنکه خوشه بندی اسناد، گام مهمی در سازماندهی اسناد متنی است ولی به تنهایی کافینیست چون خوشه های حاصله ملموس نیستند و نیاز است تا با برچسب هایی تفسیر شوند و به این صورت قابل استفاده تر خواهد بود دراین پژوهش روشی برای برچسب زنی اسناد مبتنی بر خوشه بندی به منظور سازماندهی توصیفی اسناد متنی ارایه شد. برای سنجشنتایج حاصله از مقایسه روش پیشنهادی با دو روش دیگر مبتنی بر الگوریتم های EM و DBSCAN استفاده شده است و پنجمجموعه داده از داده های موجود در ODP استفاده شده است نتایج تجربی نشان داد که عملکرد روش پیشنهادی از هر دو روشبطور میانگین بهتر است.

کلمات کلیدی:

داده کاوی، خوشه بندی، سازماندهی توصیفی اسناد، برچسب زنی اسناد متنی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/1317408/