خلاصه سازی اسناد کلان داده با استفاده از ویژگی های معنایی ماتریس فاکتورگیری نامنفی بر پایه پردازش موازی توزیع شده ی هادوپ

سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 477

فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

COMCONF05_695

تاریخ نمایه سازی: 21 اردیبهشت 1397

چکیده مقاله:

در عصر مهبانگ داده و مهبانگ محتوا، خلاصه سازی متن امروزه به ابزار مهمی برای ارزیابی متن و تفسیر وفهم متن تبدیل شده است. و به همین دلیل، به ابزار بسیار مهمی در تصمیم سازیهای خرد و کلان فردی و اجتماعی و نیز تولید اطلاعات و دانش کاربردی و حتی تولید علم تبدیل شده ا ست. خلا صه سازی دستی متون بسیار بزرگ برای انسان کار دشواری است. روشهای سنتی خلاصه سازی اسناد محدود به سایز اسناد هستند و قادر به خلا صه سازی اسناد کلان داده بر روی ابر نیستند. این مقاله، یک متد خلا صه سازی کلان داده پی شنهاد میدهد که از ویژگیهای معنایی استخراج شده از ماتریس فاکتورگیری نامنفی با استفاده از پردازش موازی توزیع شده در هادوپ ا ستخراج شده ا ست. نتایج تجربی به دست آمده این پژوهش نشان میدهد که متد مذبور به خوبی میتواند سایز اسناد کلان داده را با استفاده از پردازش موازی توزیع شده ی هادوپ خلاصه کند و در مقایسه با متدهای خلاصه سازی تک گرهای از ضریب دقت و بازخوانی بهتری برخوردار است.

نویسندگان

امید یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

عطاءالله ابطحی

استادیار گروه مدیریت، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران

محمود البرزی

دانشیار گروه مدیریت ، دانشکده مدیریت، واحد علوم و تحقیقات تهران ، دانشگاه آزاد اسلامی، تهران، ایران

کاوه یوسفیان هاشم آباد

گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران