A hybrid multi-scale CNN-LSTM deep learning model for the identification of protein-coding regions in DNA sequences

سال انتشار: 1401
نوع سند: مقاله ژورنالی
زبان: فارسی
مشاهده: 138

فایل این مقاله در 10 صفحه با فرمت PDF قابل دریافت می باشد

این مقاله در بخشهای موضوعی زیر دسته بندی شده است:

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

JR_TJEE-52-2_007

تاریخ نمایه سازی: 7 آبان 1401

چکیده مقاله:

Identification of the exact location of an exon in a DNA sequence is an important research area of bioinformatics. The main issues of the previous signal processing techniques are accuracy and robustness for the exact locating of exons. To address the mentioned issues, in this study, a method has been proposed based on deep learning. The proposed method includes a new preprocessing, a new mapping method, and a multi-scale modified and hybrid deep neural network. The proposed preprocessing method enriches the network to accept and encode genes at any length in a new mapping method. The proposed multi-scale deep neural network uses a combination of an embedding layer, a modified CNN, and an LSTM network. In this study, HMR۱۹۵, BG۵۷۰, and F۵۶F۱۱.۴ datasets have been used to compare this work with previous studies. The accuracies of the proposed method have been ۰.۹۸۲, ۰.۹۶۶, and ۰.۹۶۵ on HMR۱۹۵, BG۵۷۰, and F۵۶F۱۱.۴ databases, respectively. The results reveal the superiority and effectiveness of the proposed hybrid multi-scale CNN-LSTM network.

نویسندگان

عباس درویش

گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی سهند، تبریز، ایران

سینا شامخی

گروه بیوالکتریک، دانشکده مهندسی پزشکی، دانشگاه صنعتی سهند، تبریز، ایران