بررسی تکوین مباحث مقالات فارسی زبان و زبان شناسی با کمک رایانه

سال انتشار: 1400
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 142

فایل این مقاله در 32 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_LSI-17-33_005

تاریخ نمایه سازی: 17 دی 1401

چکیده مقاله:

از زمان پیدایش اینترنت تاکنون، با حجم زیادی از داده هایی مواجه هستیم که در این بستر قرار گرفته است. این امر سبب شده است تا شیوه مطالعه داده ها و بررسی سیر تحول آنها از روش دستی به خودکار تغییر کند. هدف از انجام این پژوهش، استخراج موضوعات مطرح شده در مقالات رشته زبان شناسی و روندشناسی تحول موضوعات در طول زمان با کمک الگوریتم مدل سازی موضوعی است. برای این هدف از الگوریتم تخصیص پنهان دیریشله استفاده می شود. پیکره این پژوهش ازطریق خزش به دست آمده و پس از پالایش و پیش پردازش داده ها، تعداد ۵، ۱۰ و ۱۵ موضوع از مقالات استخراج شده و براساس واژه های هر موضوع به صورت دستی برچسب گذاری شده است. توزیع مقالات از سال ۱۳۰۶ تا ۱۳۹۹ سبب شد تا این مدت به ۵ مقطع زمانی تقسیم و موضوعات مربوط به هر برش زمانی پس از فرایند برچسب گذاری مشخص شود. رشد و افول موضوعات استخراج شده از مقالات در پردازش های با تعداد ۵، ۱۰ و ۱۵ موضوع در بازه های زمانی قابل مشاهده است. دستاورد کاربردی این پژوهش سیاست گذاری در حوزه علم است که علاوه بر مطرح کردن یک روش شناسی فناورانه کاربردی در پژوهش، می توان موضوعات داغ میان پژوهشگران یک رشته علمی را مشخص کرد و خلاهای موضوعات پژوهشی را یافت و بر متنوع سازی و متوازن سازی موضوعات پژوهشی اهتمام ورزید.

نویسندگان

مسعود قیومی

پژوهشگاه علوم انسانی و مطالعات فرهنگی

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • احدی، حوریه (۱۴۰۰). کاربست علم زبان شناسی در حل مشکلات ...
  • تبیین جایگاه علم و فناوری (بررسی وضعیت ایران و مقایسه آن با سایر کشورها)پیشنیاز اساسی تدوین استراتژی و ترسیم مسیر رشد و بهبود نظام علم و فناوری [مقاله کنفرانسی]
  • آسیب شناسی تولید علم در موسسات و مراکز آموزشی کشور [مقاله کنفرانسی]
  • علایی ابوذر، الهام و همکاران (۱۴۰۰). «معرفی یک پیکره متنی ...
  • قیومی، مسعود (۱۳۹۷). «ارائه یک روش مبتنی بر مدل زبانی ...
  • قیومی، مسعود و مریم موسویان (۱۴۰۱). «کاربرد یادگیری ماشینی مبتنی ...
  • کامیابی گل، عطیه و همکاران (۱۳۹۷). «استخراج اطلاعات از پیکره ...
  • ناصح، محمدامین (۱۳۸۰). فهرست پایان نامه های کارشناسی ارشد و ...
  • ناصح، محمدامین (۱۳۸۳). فهرست پایان نامه های دانشگاهی در زمینه ...
  • ناصح، محمدامین (۱۳۸۶الف). فهرست پایان نامه های دانشگاهی در عرصه ...
  • یارمحمدی، لطف الله، علی محمد حق شناس و رضا نیلی ...
  • یارمحمدی، لطف الله، علی محمد حق شناس و رضا نیلی ...
  • Blei, D. M. et al. (۲۰۰۳). "Latent Dirichlet allocation". Journal ...
  • Blei, D. M. & J. D. Lafferty (۲۰۰۶). “Dynamic topic ...
  • Farahani, M. et al. (۲۰۲۱). "ParsBERT: Transformer-based model for Persian ...
  • Griffiths, T. L. & M. Steyvers (۲۰۰۴). “Finding scientific topics". ...
  • Hofmann, T. (۱۹۹۹). “Probabilistic latent semantic indexing". Proceedings of the ...
  • Hughes, L. (۲۰۱۵). "Digital humanities, big data, and new research ...
  • Minka, T., & J. Lafferty (۲۰۰۲). "Expectation-propagation for the generative ...
  • Papadimitriou, C. et al. (۲۰۰۰). "Latent semantic indexing: A probabilistic ...
  • Sievert, C. & K. Shirley (۲۰۱۴). "LDAvis: A method for ...
  • Wang, C., D. Blei, & D. Heckerman (۲۰۰۸). "Continuous time ...
  • Wang, X. & A. McCallum (۲۰۰۶). "Topics over time: A ...
  • Zhu, M., X. Zhang, & H. Wang (۲۰۱۶). "A LDA ...
  • Zosa, E. & M. Granroth-Wilding (۲۰۱۹). "Multilingual dynamic topic model". ...
  • نمایش کامل مراجع