CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

شناسایی و ردیابی موضوع روی ویدیوهای یوتیوب با یادگیری نیمه نظارتی

عنوان مقاله: شناسایی و ردیابی موضوع روی ویدیوهای یوتیوب با یادگیری نیمه نظارتی
شناسه ملی مقاله: COMCO04_030
منتشر شده در پنجمین کنفرانس بین المللی تحقیقات دانش بنیان در مهندسی کامپیوتر و فناوری اطلاعات در سال 1396
مشخصات نویسندگان مقاله:

سینا دامی - استادیار، دانشگاه آزاد اسلامی واحد تهران غرب، گروه کامپیوتر، تهران، ایران
کامران تاجیک - دانشجوی کارشناسی ارشد، دانشگاه آزاد اسلامی، واحد تهران غرب، گروه کامپیوتر، تهران، ایران

خلاصه مقاله:
با رشد سریع داده های وب، مقدار زیادی از ویدیوهای وب بصورت آنلاین در دسترس هستند. هرچند، چگونگی سازمان دهی آن ها برای سهولت تجربه کاربران و نظارت دولتی، هنوز مسیله ای است که باید بطور جدی بررسی شود. شناسایی و ردیابی موضوع که برای دهه ها موضوع تحقیقاتی داغی بوده است می تواند ویدیوهای وب را در موضوعات مختلفی مطابق با محتوی معنایی آن ها خوشه بندی کند. در این میان، یوتیوب به عنوان بزرگ ترین و معروف ترین وب گاه بارگذاری و تماشای ویدیو شناخته شده است. در این مقاله، چگونگی شناسایی و ردیابی موضوع از ویدیوهای یوتیوب بطور کامل به بحث گذاشته شده است. با در دست داشتن داده های تاریخی شامل داده های برچسب خورده و بسیاری از داده های برچسب نخورده با استفاده از روش یادگیری نیمه نظارتی، ردیابی موضوعات را بدست می آوریم که می تواند موضوعات جدید را نیز از داده های جریان جدید شناسایی کند. برای این منظور، از الگوریتم یادگیری رتبه بندی لاپلاسین SVM بهره گرفته شد. انجام آزمایش ها بر روی مجموعه داده های ویدیوی دانلود شده از یوتیوب برای ارزیابی عملکرد روش پیشنهادی، نتایج سودمندی را برای شناسایی و ردیابی موضوع نشان می دهد.

کلمات کلیدی:
شناسایی و ردیابی موضوع، ویدیوی یوتیوب، یادگیری نیمه نظارتی، رتبه بندی لاپلاسین SVM

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/670773/