پیش بینی پروتئینهای متصل شونده به لیپید بر اساس ماشین بردار پشتیبان با استفاده از خصوصیات مربوط به توالیها

سال انتشار: 1391
نوع سند: مقاله کنفرانسی
زبان: فارسی
مشاهده: 700

نسخه کامل این مقاله ارائه نشده است و در دسترس نمی باشد

استخراج به نرم افزارهای پژوهشی:

لینک ثابت به این مقاله:

شناسه ملی سند علمی:

IBIS04_026

تاریخ نمایه سازی: 14 شهریور 1393

چکیده مقاله:

پیش بینی عملکرد پروتئینهای کاندید و جدید یکی از وظایف مهم و پیچیده بعد از دوره پس- ژنومی میباشد. با این حال شناسائی پروتئینهائی با شباهت کم و یا بدون شباهت با پروتئینها یا پپتیدهای با عملکرد شناخته شده یکی از مشکلات بسیار مهم میباشد. روشهای یادگیری ماشین، مانند بردار ماشین پشتیبان (SVM) از روشهای مفید برای پیش بینی چنین پروتئینهایی با توالیهای پروتئینی متنوع میباشد. پروتئینهای متصل شونده به لیپید (LBPs) نقشهایی حیاتی در سلولهای مختلف همانند علامت دهی، عبور و مرور غشائی، تنظیم، پاسخ ایمنی، متابولیسم لیپید و انتقال ایفا میکنند. با توجه به وجودتنوع در توالیهای پروتئینی بین LBPs، برای پیش بینی این پروتئینهای نیاز به روشهائی احساس میشود که بر پایه شباهت بین توالیهای نباشند. در این مطالعه از یک روش بر پایه SVM و استفاده از خصوصیات فیزیک وشیمیائی (مانند خصوصیات خودهمبستگی، ترکیب، انتقال و توزیع، درجه– توالی- کواسی و اسید آمینه کاذب) و ترکیب اسید آمینه های توالیهای پروتئینی به منظور پیش بینی و طبقه بندی LBPs استفاده گردید. مجموعه داده های مورداستفاده در این مطالعه برای آموزش و امتحان مدل از سایت UniProt استخراج گردید. نرم افزار LibSVM (یک نرم افزار برای پیاده سازیSVM ) به منظور طبقه بندی پروتئینهای LBPs استفاده گردید. مجموعه دادههای LBPs شامل 10603 توالی پروتئینی بود که متعلق به 9 گروه شامل تجزیه لیپید ،متابولیسم لیپید، تولید لیپید، انتقال لیپید، اتصال به لیپید، تولید لیپوپلیساکارید، لیپوپروتئین، لیپویل و همه پروتئینهای متصل شونده به لیپید میباشند ونقش مهمی در کنترل اعمال سلولی ایفا میکنند. مجموعه داده مربوط به پروتئینهای غیر مرتبط با non-LBPs) LBPs) حاوی 185628 توالی پروتئینی بود. در این تحقیق از روش طبقه بندی دوتائی برای همه گروهها استفاده گردید. هر کدام از گروههای LBPs شامل یک زیرمجموعه داده مثبت (گروه هایLBPs) و یک زیرمجموعه داده منفی (non-LBPs) بود. شباهت بین توالیهای پروتئینی در همه مجموعه داده ها کمتر از 90% تعیین گردید. پنج زیرمجموعه داده منفی به طور تصادفی از مجموعه دادههای non-LBPs برای بررسی هر گروه به منظور اجتناب از اریب ناشی از انتخاب زیر مجموعه داده-های منفی در نظر گرفته شد. نتایج پیش بینی ها با استفاده از آزمونهای تائید- متقاطع پنج تائی و مجموعه داده مستقل مورد ارزیابی قرار گرفت. این روشLBPs و non-LBPs را با صحت 89.28% بر اساس آزمون تائید- متقاطع پنج تائی طبقه بندی کرد. صحت پیش بینی محاسبه شده بر پایه آزمون تائید- متقاطع پنج تائی برای گروههای شامل تجزیه لیپید، متابولیسم لیپید، تولید لیپید، انتقال لیپید، اتصال به لیپید، تولید لیپوپلیساکارید، لیپوپروتئین و لیپویل به ترتیب برابر با 92.25، 8915.، 94.74، 88.84، 90.61، 93.26، 89.06 و 98.58% برآورد شد. با استفاده از آزمون مجموعه داده مستقل LBPs با صحت89.55% نسبت به non-LBPs شناسائی گردیدند. صحتهای برابر با 90.85، 09، 95.36، 91.06، 3.923، 93.15، 90.10 و 99.55% به ترتیب برای گرو ههای مذکور و بر اساس آزمون مجموعه داده مستقل بدست آمد. در این مطالعه، به علت استفاده از خصوصیات فیزیک و شیمیائی جدید و همچنین روش جدیدایجاد مجموعه دادهها، نتایج بهتری نسبت به مطالعات پیشین بدست آمد. یافته ها حاکی از مفید بودن خصوصیات فیزیکوشیمیائی مربوط به توالیها و ترکیب اسیدهای آمینه در پیشبینی LBPs در گروههای مختلف با استفاده از روش بر پایه SVM میباشد. در مجموع، مدل پیش بینی کننده LBPs که بر اساس روشSVM بدست آمد، بسیار مناسب بوده و میتواند به عنوان یک ابزار پیش بینی عملکرد پروتئین برای شناسائیLBPs نسبت بهnon-LBPs و همچنین یک روش تکمیل کننده برای روشهای هم ردیفی توالیها به کار گرفته شود.

کلیدواژه ها:

پروتئینهای متصل شونده به لیپید ، SVM ، پیش بینی

نویسندگان

محمد رضا بختیار زاده

گروه علوم دامی ،دانشگاه تهران، کرج، ایران: گروه زراعت و اصلاح نباتات، دانشگاه شیراز، شیراز، ایران