CIVILICA We Respect the Science
(ناشر تخصصی کنفرانسهای کشور / شماره مجوز انتشارات از وزارت فرهنگ و ارشاد اسلامی: ۸۹۷۱)

تدبر در قران مجید به کمک روشهای داده کاوی

عنوان مقاله: تدبر در قران مجید به کمک روشهای داده کاوی
شناسه ملی مقاله: IDMC04_008
منتشر شده در چهارمین کنفرانس داده کاوی ایران در سال 1389
مشخصات نویسندگان مقاله:

شروان عطایی - استادیار دانشکده راه اهن دانشگاه علم و صنعت

خلاصه مقاله:
تدبر در قران کریم همواره مورد توجه صاحبان خرد قرار داشته و دارد رشد علم و فناوری ابزارها و روشهای نوینی در خدمت انسان امروز قرار داده که حوزه قران پژوهش و تدبر قرانی نیز از ان بینصیب نبوده است چنانچه در حال حاضر ابزارهای سودمندی جهت جستجوی کلمات و عبارات قرانی در قالب نرم افزارهای قرانی توسعه داده شده است روشهای داده کاوی می تواند با استخراج بردار ویژگی ایات و سوره ها محاسبه شباهت ایات و فراوانی تکرار کلمات و ریشه ها و موقعیت مکانی آنها جستجوی موضوعی قاعده مند و بطور کلی پردازش زبان قران ابزارهای مناسبی جهت تصویر سازی و سازمان دهی متن قران مجید ارائه دهد. دراین مقاله پیکره متنی قران مجید در قالب تقریبا 8767ه9 کلمه به همراه برچسب شماره سوره، شماره ایه و ترتیب کلمه در آیه تهیه شد و با کد کردن هریک از حروف قران به یک عدد هر کلمه بصورت رشته ای با حداکثر 11 کاراکتر از اعداد درامد. با حذف موارد مشابه تعداد تقریبی کلمات به 13281 کلمه رسید. با محاسبه شباهت بین کلمات از روی فاصله همینگ، کلمات مشابه با پسوند مثل ضمائر متصل یا پیشوند ال تعریف متفاوت شناسایی شد و تعداد کلمات به 7872 رسید. سپس کلمات حرفی و ضمائر حذف شد و کلمات اسمی یا فعلی با فراوانی بیش از 200 بار تکرار شناسایی گردید و نمودار فراوانی تکرار آنها در سوره های قران مجید رسم شد و الگوی تکرار انها در سوره ها استخراج گردید.

کلمات کلیدی:
متن کاوی، ساختار کاوی، استخراج بردار ویژگی متن، پردازش زبان قران، تدبر در قران بکمک روشهای داده کاوی، شناسایی سازمان دهی کلمات قران مجید.

صفحه اختصاصی مقاله و دریافت فایل کامل: https://civilica.com/doc/109006/