استخراج شبکه کلمات همرخداد جهت بهبود پیشنهاددهنده ی جستجو در پایگاه اطلاعات علمی ایران سامانه گنج

سال انتشار: 1399
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 596

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF07_015

تاریخ نمایه سازی: 22 مرداد 1399

چکیده مقاله:

امروزه، با حجم فراوان اطلاعات در وب، یافتن اطلاعات مربوط به یک موضوع خاص، دشوار است. استفاده از سیستمهای جستجو و جستجوی کلید واژه برای جمع آوری سند و داده های مرتبط استفاده میشود. یک نمونه جستجوی جدید، جستجوی فوری است که در آن هر اعمال کلید توسط کاربر یک درخواست جدید برای سرور ایجاد میکند. از کاربردهای جستجوی فوری در پایگاه داده های علمی میتوان نام برد که حجم و تنوع اطلاعات آنها هر روز گسترش می یابد و به عنوان یک مخزن قابل اعتماد از آخرین مطالعات انجام شده توسط محققان در زمینه های مختلف علم مورد استفاده قرار میگیرد. در این میان پایگاه اطلاعات علمی ایران (گنج) با صدها هزار رکورد که بیشتر آنها پایاننامه و رساله هستند دارای هزاران مراجعه و ده ها هزار جستوجو در روز است. در این سامانه با ورود و جستجوی کاربران، لاگهایی ایجاد میشود که شامل اطلاعاتی مانند عبارت جستجو شده هستند. در این پژوهش با بررسی این لاگ ها، همرخدادی کلمات در جستجوها استخراج شده و شبکه ی آنها نمایش داده میشود. این شبکه جهت کمک به جستجوی فوری مورد استفاده قرار میگیرد. جهت انجام این پژوهش دستورالعملهای استخراج متن بر روی داده های لاگ اعمال شده و عبارات کلیدی استخراج شدند. یک مجموعه داده از کلمات کلیدی به عنوان گره و فرکانس تکرار آنها با کلمات متناظرشان به عنوان یال تشکیل گردید و شبکه متناظر آنها ایجاد شد. نتایج نشان میدهد که این شبکه ترتیب رخداد کلمات در جستجوی کاربران را نمایش میدهد که میتواند جهت تقویت موتور جستجو و پیشنهاد کلمات کلیدی به کاربران مورد استفاده قرار گیرد.

کلیدواژه ها:

کلمات همرخداد ، لاگ کاوی ، پایگاه اطلاعات علمی ایران(گنج) ، موتور جستجو

نویسندگان

فرزانه بیات

دانشجوی کارشناسی ارشد گروه کامپیوتر، دانشکده فنی مهندسی، دانشگاه آزاد اسلامی واحد تهران شمال ، تهران، ایران

سمیه فتاحی

استادیار پژوهشکده فناوری اطلاعات، پژوهشگاه علوم و فناوری اطلاعات ایران (ایرانداک)، تهران، ایران