خلاصه سازی اسناد کلان داده با استفاده از ویژگی های معنایی ماتریس فاکتورگیری نامنفی بر پایه پردازش موازی توزیع شده ی هادوپ
سال انتشار: 1396
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 477
فایل این مقاله در 15 صفحه با فرمت PDF قابل دریافت می باشد
- صدور گواهی نمایه سازی
- من نویسنده این مقاله هستم
استخراج به نرم افزارهای پژوهشی:
شناسه ملی سند علمی:
COMCONF05_695
تاریخ نمایه سازی: 21 اردیبهشت 1397
چکیده مقاله:
در عصر مهبانگ داده و مهبانگ محتوا، خلاصه سازی متن امروزه به ابزار مهمی برای ارزیابی متن و تفسیر وفهم متن تبدیل شده است. و به همین دلیل، به ابزار بسیار مهمی در تصمیم سازیهای خرد و کلان فردی و اجتماعی و نیز تولید اطلاعات و دانش کاربردی و حتی تولید علم تبدیل شده ا ست. خلا صه سازی دستی متون بسیار بزرگ برای انسان کار دشواری است. روشهای سنتی خلاصه سازی اسناد محدود به سایز اسناد هستند و قادر به خلا صه سازی اسناد کلان داده بر روی ابر نیستند. این مقاله، یک متد خلا صه سازی کلان داده پی شنهاد میدهد که از ویژگیهای معنایی استخراج شده از ماتریس فاکتورگیری نامنفی با استفاده از پردازش موازی توزیع شده در هادوپ ا ستخراج شده ا ست. نتایج تجربی به دست آمده این پژوهش نشان میدهد که متد مذبور به خوبی میتواند سایز اسناد کلان داده را با استفاده از پردازش موازی توزیع شده ی هادوپ خلاصه کند و در مقایسه با متدهای خلاصه سازی تک گرهای از ضریب دقت و بازخوانی بهتری برخوردار است.
کلیدواژه ها:
نویسندگان
امید یوسفیان هاشم آباد
گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران
عطاءالله ابطحی
استادیار گروه مدیریت، دانشکده مدیریت، واحد علوم و تحقیقات تهران، دانشگاه آزاد اسلامی، تهران، ایران
محمود البرزی
دانشیار گروه مدیریت ، دانشکده مدیریت، واحد علوم و تحقیقات تهران ، دانشگاه آزاد اسلامی، تهران، ایران
کاوه یوسفیان هاشم آباد
گروه مدیریت فناوری اطلاعات، دانشکده مدیریت، واحد الکترونیکی، دانشگاه آزاد اسلامی، تهران، ایران