Pre-compression algorithm for link structure of the web

سال انتشار: 1384
نوع سند: مقاله کنفرانسی
زبان: انگلیسی
مشاهده: 1,388

فایل این مقاله در 5 صفحه با فرمت PDF قابل دریافت می باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

ACCSI11_247

تاریخ نمایه سازی: 5 آذر 1390

چکیده مقاله:

We introduce a new algorithm for compressing the link structure of the web graph by means of re-indexing the nodes in some web communities in order to decrease the differences between the numerical values of indices of these nodes. This is especially done for the nodes that participate in the adjacency lists of many nodes. Our algorithm will then partition these nodes into groups, each represented by a group-indicator node. We then remove the edges directed to nodes in one group and replace them with an edge to the group indicator. This algorithm preserves the overall characteristics of the graph and also increases similarity between link adjacency lists of nodes. So it can be used as a preprocessing algorithm to compress the web graph prior to compression by Huffman or other algorithms, as a result the final compression ratio is considerably improved. We will show in the paper that the time complexity of our compression algorithm is O(n2 log n) for each community.

کلیدواژه ها:

نویسندگان

Alireza Mahdian

Computer Engineering Department Sharif University of Technology,

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :