استخراج معنایی داده های کلان جغرافیایی از جدول های وب

سال انتشار: 1394
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 1,113

فایل این مقاله در 8 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

AIHE09_205

تاریخ نمایه سازی: 22 مهر 1394

چکیده مقاله:

با افزایش رو به رشد نمایی اطلاعات و حجم بزرگی از آنها که به وجود می آید، روز به روز نیاز به پردازش و تحلیل این داده های حجیم بیشتر و بیشتر می شود. مشکل این دادههای کلان به وجود آمده این است که زمان محدودی برای پردازش آنها داریم که این کار با یک ماشین یا غیرممکن است یا نیاز به زمانی فراتر از زمان انتظار دارد. میلیون ها جدول وب با داده جغرافیایی وجود دارد که مربوط به یکپارچگی داده کلان با دامنه های کاربردی متنوعی است، مانند شبکه های انتقال، سلامت عمومی و غیره که این جدول ها ساختار، مفاهیم و متادیتای ناهمگنی دارند. یکز از چالش های استخراج معنایی داده جغرافیایی برای حل این مشکل ناهمگنی این است که احتیاج است تا سلسله مراتب مفهمی، مفهومی، متادیتای در ارتباط با نمونه ها و اطلاعات جغرافیایی را کشف کند که این ها به ترتیب به آنتولوژی ها، عناصری که ما آنها را ویژگی می نامیم و مقادیر سلولی که می تواند به این منظور استفاده شود که مختصات جغرافیایی را مشخص می کند، مربوط می شوند. در این مقاله، یک معماری یا متدی ارائه می کنیم که 1-جدول های وب با ویژگی غنی را استخراج می کند. 2-ویژگی ها را مشخص می کند. 3-یک schema و نمونه هایی را با استفاده از RDF می سازد. 4-Geocoding که روشی برای تهیه یک صفحه گرافیکی اطلاعات در رابطه با یک ناحیه جغرافیایی است را اجرا می کند. آزمایش های انجام گرفته نشان از این دارد که در تشخیص جدول و نامگذاری ویژگی حتی با مقایسه نسبت به ارزیابی دستی از دقت بالاتری برخوردار می باشد.

نویسندگان

وحید فاضلی نیا

دانشجوی کارشناسی ارشد، کامپیوتر نرم افزار، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران

احمد ابراهیم مقدم

دانشجوی کارشناسی ارشد، کامپیوتر نرم افزار، دانشگاه بین المللی امام رضا (ع)، مشهد، ایران

مهرداد جلالی

عضو هیئت علمی، کامپیوتر نرم افزار، دانشگاه آزاد اسلامی واحد مشهد، ایران

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Big Data For Dummies, 2013 [2] _ _ .apache.2rgل ...
  • "Geographic Information Systems _ an Integrating Technology: Context, Concepts, and ...
  • M. J. Cafarella, A. Halevy, D. Z. Wang, E. Wu, ...
  • _ _ _ pages 221[229. ACM, 2001 ...
  • Weng et.al " A Distributed GIS Model Based On Hadoop", ...
  • _ G. Quercini and C. Reynaud. Entity Discovery and Annotation ...
  • Extending Database Technology (EDBT), pages 693[704. ACM, 2013. ...
  • M. D. Lieberman, H. Samet, J. S ankaran arayanan, and ...
  • S. Auer, S. Dietzold, J. Lehman, S. Hellmann, and D. ...
  • C. Bizer. D2R MAP _ A Database o RDF Mapping ...
  • G. Dennis Jr, B. T. Sherman, D. A. Hosack, J. ...
  • C. A. Knoblock, P. Szekely, J. L. Ambite, A. Goel, ...
  • V. Mulwad, T. Finin, and A. Joshi. A Domain Independent ...
  • Z. Syed, T. Finin, V. Mulwad, and A. Joshi. Exploiting ...
  • _ P. Venetis, A. Halevy, J. Madhavan, M. Pa_sca, W. ...
  • http :/www.j iscinfonet. ac , uk/i nfokits/optimi sation/somew here/open-data/ ...
  • نمایش کامل مراجع