مرور اجمالی بر روش های تحلیل عظیم داده و استفاده از روش گرد کردن

سال انتشار: 1398
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 575

فایل این مقاله در 19 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ICNTLS01_006

تاریخ نمایه سازی: 29 بهمن 1398

چکیده مقاله:

امروزه چالش اصلی همه حوزه های شبکه و پایگاه داده، موضوع داده های عظیم است. داده های عظیم مفهومی است که عمر چندان درازی ندارد و بطور کلی به افزایش حجم اطلاعات غیرساختارمند و یکپارچه در کنار ذخیرهسازی و پردازش آنها می پردازد. داده های عظیم اکنون چالش اصلی شبکه های گسترده و شرکت های بزرگ است. این داده ها از تراکنش های برخط (آنلاین)، پست های الکترونیک، ویدئوها، صوت ها، کلیک کردن ها، وقایع ثبت شده و ارسال ها، درخواست های جستجو، یادداشت های درست، تعاملات شبکه های اجتماعی، داده های علمی، سنسورها و تلفن های همراه و برنامه های کاربردی آنها تولید می شوند. آنها بر روی پایگاه داده ها که به شکل حجیم رشد می کنند، ذخیره می شوند و فرآیند ذخیره سازی، شکل دهی، مدیریت، به اشتراک گذاری، تحلیل و نمایش آنها از طریق ابزارهای نوعی نرم افزار پایگاه داده ها، به دشواری انجام می شود. از این رو تحلیل های دقیق بر رویاین داده های عظیم، منجر به تصمیم گیری های با اطمینان بیشتری شده و تصمیمات بهتر، می تواند معنای کارایی بیشتر عملیات، کاهش هزینه ها و کاهش مخاطره ها باشد. لذا به بررسی داده های عظیم و چالش های این نوع داده ها می پردازیم. در این مقاله برای نشان دادن مزایای پارامترهای گردکردن، یک مطالعه شبیه سازی و یک نمونه واقعی داده ها را با استفاده از داده های الکتروانسفالوگرافی ارائه می کنیم.

نویسندگان

کارلو آبنوسیان

دانشجوی دکتری گروه آمار، دانشگاه آزاد اسلامی واحدعلوم و تحقیقات، تهران، ایران.

مریم مرادی

دانشجوی دکتری آمار، دانشگاه علوم پزشکی جندی شاپور اهواز، ایران.

محمد حسن بهزادی

دانشیارگروه آمار، دانشگاه آزاد اسلامی واحدعلوم و تحقیقات، تهران، ایران