Application of Computational Linguistics to Predicting Language Proficiency Level of Persian Learners’ Textbooks

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: انگلیسی
مشاهده: 166

فایل این مقاله در 24 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_LGHOR-6-1_002

تاریخ نمایه سازی: 10 خرداد 1401

چکیده مقاله:

One subfield of assessment of language proficiency is predicting language proficiency level.This research aims at proposing a computational linguistic model to predict language proficiency level and to explore the general properties of the levels. To this end, a corpus is developed from Persian learners' textbooks and statistical and linguistic features are extracted from this text corpus to train three classifiers as learners. The performance of the models vary based on the learning algorithm and the feature set(s) used for training the models. For evaluating the models, four standard metrics, namely accuracy, precision, recall, and F-measure were used. Based on the results, the model created by the Random Forest classifier performed the best when statistical features extracted from raw text is used. The Support Vector Machine classifier performed the best by using linguistic features extracted from the automatically annotated corpus. The results determine that enriching the model and providing various kinds of information do not guarantee that a classifier (learner) performs the best.To discover the latent teaching methodology of the textbooks, the general performance of the classifiers with respect to the language level and the linguistic knowledge used for creating the model are studied. Based on the obtained results, the amount of extracted features plays an important role in training a classifier. Furthermore, the average best performance of the classifiers is extending the linguistic knowledge from syntactic patterns at proficiency level A (beginner) to all linguistic information at levels B (intermediate) and C (advanced).

نویسندگان

مسعود قیومی

Assistant Professor, Faculty of Linguistics, Institute for the Humanities and Cultural Studies, Tehran, Iran;

مراجع و منابع این مقاله:

لیست زیر مراجع و منابع استفاده شده در این مقاله را نمایش می دهد. این مراجع به صورت کاملا ماشینی و بر اساس هوش مصنوعی استخراج شده اند و لذا ممکن است دارای اشکالاتی باشند که به مرور زمان دقت استخراج این محتوا افزایش می یابد. مراجعی که مقالات مربوط به آنها در سیویلیکا نمایه شده و پیدا شده اند، به خود مقاله لینک شده اند :
  • Ahmadzadeh, K., Khosravi, A., Arastoopoor, S., & Tahmasebi, R. (۲۰۱۴). ...
  • Bijankhan, M. (۲۰۰۴). The role of corpora in writing a ...
  • Bohnet, (۲۰۰۹). Efficient parsing of syntactic and semantic dependency structures. ...
  • Bush, M., & Terry, R. (۱۹۹۷). Technology-enhanced language learning, National ...
  • Chomsky, N. (۱۹۶۵). Aspects of the Theory of Syntax. The ...
  • Chomsky, N. (۱۹۶۸). Language and Mind. Harcourt Brace Jovanovich ...
  • Chomsky, N. (۱۹۷۵). Reflections on language. Pantheon Books ...
  • Chomsky, N. (۱۹۸۰). Rules and representations. Behavioral and Brain Sciences, ...
  • Doró, K. (۲۰۱۱). English language proficiency and the prediction of ...
  • Ellis, R. (۱۹۹۷). Second language acquisition. Oxford University Press ...
  • Eslami, M., Mosavi Atashgah, M., Alizadeh Lamjiri, S., & Zandi, ...
  • Evans, V. (۲۰۱۴). The language myth: Why language is not ...
  • Ghaderi Moghaddam, M. E., & Sobhaninejad, M. (۲۰۱۶). Validation methods ...
  • Ghaffari, M., Mahmoodi Bakhtiyari, B., & Zolfaghari, H. (۲۰۰۴). Let’s ...
  • Ghayoomi, M. (۲۰۱۳). Word clustering for Persian statistical parsing. In ...
  • Ghayoomi, M. (۲۰۱۹a). Studying issues for automatic processing of the ...
  • Ghayoomi, M. (۲۰۱۹b). Transition from rule-based to statistical lemmatization in ...
  • Ghayoomi, M. (۲۰۲۰). Structuring multilayer linguistic analyses in linguistic corpora. ...
  • Ghayoomi, M., & Kuhn, J. (۲۰۱۴). Converting an HPSG-based treebank ...
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (۲۰۱۳). ...
  • Jung, Y. J., Crossley, S., & McNamara, D. (۲۰۱۹). Predicting ...
  • Luo, D., Minematsu, N., Yamauchi, Y., & Hirose, K. (۲۰۰۸). ...
  • MacWhinney, B. (۲۰۰۵). Item-based constructions and the logical problem. In ...
  • Matusevych, Y., Alishahi, A., & Backus, A. (۲۰۱۳). Computational simulations ...
  • Paribakht, T., & Wesche, M. (۱۹۹۹). Reading and ‘incidental’ L۲ ...
  • Pinker, S. (۱۹۹۶). Language learnability and language development. Harvard University ...
  • Pollard, C. J., & Sag, I. A. (۱۹۹۴). Head-driven phrase ...
  • Poornamdariyan, T. (۱۹۹۴). The Persian lesson for foreign Persian learners ...
  • Postman, L., & Keppel, G. (۱۹۶۹). Verbal learning and memory. ...
  • Prabhu, N. S. (۱۹۸۷). Second language pedagogy. Oxford University Press ...
  • Robinson, P. (۲۰۰۱). Task complexity, cognitive load, and syllabus design. ...
  • Saffar Moghaddam, A. (۲۰۰۳). General Persian: Basic constructions. Council of ...
  • Saffar Moghaddam, A. (۲۰۰۸a). The Persian language (Vol. ۱). Council ...
  • Saffar Moghaddam, A. (۲۰۰۸b). The Persian language (Vol. ۲). Council ...
  • Saffar Moghaddam, A. (۲۰۰۸c). The Persian language. (Vol. ۳). Council ...
  • Saffar Moghaddam, A. (۲۰۰۸d). The Persian language. (Vol. ۴). Council ...
  • Saffran, J., Aslin, R., & Newport, E. (۱۹۹۶). Statistical learning ...
  • Samareh, Y. (۲۰۰۵a). Teaching the Persian language (Vol. ۲). Alhoda ...
  • Samareh, Y. (۲۰۰۵b). Teaching the Persian language. (Vol. ۳). Alhoda ...
  • Samareh, Y. (۲۰۰۵c). Teaching the Persian language. (Vol. ۴). Alhoda ...
  • Sarvi, A., Talebnia, G., Pourzamani, Z., & Jahanshad, A. (۲۰۱۹). ...
  • Sulistyowati, T. (۲۰۱۹). Bottom-up and top-down listening progress within cognitive ...
  • Tomasello, M. (۱۹۹۲). First verbs: A case study of early ...
  • Tomasello, M. (۲۰۰۰). The item-based nature of children’s early syntactic ...
  • Widdowson, H. G. (۱۹۷۸). Teaching language as communication. Oxford University ...
  • Yang, Y., Yu, W., & Lim, H. (۲۰۱۶). Predicting second ...
  • Zarghamiyan, M. (۲۰۰۱a). Series of teaching the Persian language (From ...
  • Zarghamiyan, M. (۲۰۰۱b). Series of teaching the Persian language (From ...
  • Zeinali, V., Haghparast, A., Damerchilou, M., & Vazifehshenas, N. (۲۰۱۹). ...
  • نمایش کامل مراجع