CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

ارائه یک روش نیمه اتوماتیک حاشیه نویسی وب

عنوان مقاله: ارائه یک روش نیمه اتوماتیک حاشیه نویسی وب
شناسه ملی مقاله: IDMC04_072
منتشر شده در چهارمین کنفرانس داده کاوی ایران در سال 1389
مشخصات نویسندگان مقاله:

الهام نژآد عباباف - دانشجوی کارشناسی ارشد مهندسی نرم افزار
مهران محسن زاده - استادیار دانشگاه آزاد اسلامی واحد علوم و تحقیقات تهران
محمدحسین یکتایی - استادیار دانشگاه آزاد اسلامی واحد آبادان

خلاصه مقاله:
وب معنایی یکی از مهمترین موضوعات تحقیقاتی در حوزه وب به شمار می رود که پژوهشهای زیادی را در سالهای اخیر به خود اختصاص داده است یکی از اعمال اصلی جهت تحقق وب معنایی ارتقا سطح دانش وب کنونی و افزودن فراداده های معنایی به صفحات وب یا به بیانی دیگر حاشیه نویسی معنایی می باشد با توجه به حجم بسیار زیاد صفحات وب و تنوع موضوعی قابل توجه محتویات موجود در آن می توان دریافت که حاشیه نویسی صفحات وب براساس هستان شناسی های موجود یکی از مهمترین مسائل چالش برانگیز فراروی وب معنایی است حاشیه نویسی معنایی و در راستای آن ایجاد و توسعه هستان شناسی های دامنه بطور متمرکز کاری طاقت فرسا و وقت گیر خواهد بود. این پایان نامه روشی را برای انجم فرایند حاشیه نویسی ارائه میدهد بدین صورت که ابتدا با استفاده از خوشه بندی مجموعه ای از اسناد اموزشی دسته موضوعی اسناد را مشخص می کند سپس با دریافت سند برای حاشیه نویسی ابتدا براساس خوشه بندی صورت گرفته موضوع سند را تشخیص داده و سپس براساس موضوع صفحه را حاشیه نویسی می کند

کلمات کلیدی:
هستان شناسی، حاشیه نویسی معنایی، کاوش متن، خوشه بندی

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/109070/