آخرین مطالب

ابزاری برای باز کردن قفل “بازی اعداد” داده های بزرگ در تحقیقات بیماری های نادر


ابزاری برای باز کردن قفل

Gang Wu، Ph.D.، و Wenan Chen، Ph.D.، مرکز بیوانفورماتیک کاربردی. اعتبار: بیمارستان تحقیقاتی کودکان سنت جود

دانشمندان محاسباتی در بیمارستان تحقیقاتی کودکان سنت جود ابزاری را برای یافتن ژن ها و انواع ژنتیکی که افراد را مستعد ابتلا به بیماری های نادر می کند ساخته اند. یافتن ژن‌ها و گونه‌های ژنتیکی که به بیماری‌های نادر کمک می‌کنند به دلیل عوامل مخدوش‌کننده که هنگام استفاده از مجموعه داده‌های عمومی بزرگ معرفی می‌شوند، دشوار است. این ابزار راه حلی برای محاسبه عوامل مخدوش کننده و شناسایی نتایج آماری معنی دار ارائه می دهد. شواهد امروز در منتشر شد ارتباطات طبیعت.

شناسایی انواع ژنتیکی که به بیماری‌های نادر کمک می‌کنند ممکن است درک پیشرفت بیماری را افزایش دهد و راه‌های بالقوه جدیدی برای درمان ارائه دهد. محققان از مقادیر زیادی داده از روش‌های توالی‌یابی در حال بهبود برای یافتن این ارتباطات استفاده می‌کنند. فقدان یک روش سیستماتیک برای یافتن نتایج آماری معتبر، یافتن ژن‌های مرتبط با بیماری‌های نادر را چالش برانگیز کرده است.

Gang Wu، نویسنده مرتبط، Ph.D.، مدیر مرکز بیوانفورماتیک کاربردی سنت جود، گفت: “این همه یک بازی اعداد است.” “به طور سنتی، اگر شما یک مطالعه کوهورت کوچک روی 20 تا 50 فرد غیر مرتبط با یک بیماری بسیار نادر داشته باشید، تقریبا هیچ راهی برای یافتن یک نوع ژن جدید که بدون آگاهی قبلی از ژن های کاندید به اهمیت آماری کمک می کند، ندارید. اکنون رویکردی داریم که به طور بالقوه می تواند به یافتن ژن های مستعد بیماری جدید کمک کند.”

او گفت: “برای بیماری هایی مانند اسکلروز جانبی آمیوتروفیک (ALS) یا تومورهای مغزی کودکان، احتمالاً می دانیم که تا 20 درصد از بیماران را می توان با استعداد مولد این بیماری توضیح داد. ابزارهای ما به یافتن وراثت‌پذیری غیرقابل توضیحی که می‌تواند به این بیماری‌ها کمک کند، کمک می‌کند.»

CoCoRV: رام کردن داده های کنترل نشده

برای پرداختن به این مسائل، دانشمندان ابزاری به نام آزمون شمارش خلاصه منسجم مبتنی بر نوع کمیاب بار (CoCoRV) ایجاد کردند. این تیم توانست نشان دهد که CoCoRV می تواند انواع ژنتیکی شناخته شده را پیدا کند که در ایجاد انواع بیماری های نادر، از جمله سرطان های متعدد و ALS نقش دارند. علاوه بر این، برای هر بیماری، محققان انواع ژنتیکی ناشناخته قبلی را شناسایی کردند که ممکن است مستعد ابتلا به آن بیماری باشد.

ونان چن، نویسنده اول، دکترای مرکز بیوانفورماتیک کاربردی، گفت: “CoCoRV بر اساس تجربه ما از کار با مجموعه های بسیار زیادی از داده های توالی در سنت جود ساخته شده است.” “ما اغلب تعیین می کنیم که آیا چیزی یک سیگنال واقعی است یا یک مصنوع فنی. هنگامی که شما مقدار زیادی داده دارید، می توانید از این دانش برای استخراج قوانینی استفاده کنید که به طور سیستماتیک سیگنال واقعی را در مقابل کیفیت بد در مجموعه داده های دیگر طبقه بندی می کند. این تجربه را به ابزاری تبدیل کرد که استفاده از آن برای دیگران مفید باشد.”

نادری باعث بی ثباتی آماری می شود

بیماری‌های نادر، طبیعتاً ناشایع هستند. داده‌های مربوط به افراد به نسبت پراکنده است. علاوه بر این، تعداد کمی از مطالعات داده‌های کافی را از افراد سالم جمع‌آوری می‌کنند که به اندازه کافی شبیه به جمعیتی از بیماران مبتلا به یک بیماری نادر هستند تا به اهمیت آماری دست یابند، مفهومی به نام رسیدن به قدرت آماری.

فقدان کنترل‌های سالم همسان، چالشی را برای دانشمندانی که به دنبال انواع ژنتیکی مرتبط با بیماری‌های نادر هستند، ایجاد می‌کند. با استفاده از پایگاه‌های اطلاعاتی ژنوم انسانی در دسترس عموم، دانشمندان می‌توانند از روش‌های آماری پیشرفته برای ایجاد «گروه‌های کنترل مصنوعی» استفاده کنند. سپس این گروه ها می توانند تضاد بین ژن های بسیاری از افراد سالم و ژن های یک گروه کوچک مبتلا به یک بیماری خاص را برجسته کنند تا به قدرت آماری برسند.

اما پایگاه‌های اطلاعاتی عمومی اغلب با روش‌های مختلف جمع‌آوری می‌شوند، اطلاعات را به روش‌های مختلف ارائه می‌کنند و مقایسه آنها با یکدیگر دشوار است. این زمینه فاقد روشی برای ادغام مداوم اطلاعات از پایگاه های داده عمومی و محاسبه این آمارهای پیشرفته برای ایجاد گروه های کنترل مصنوعی بود. دانشمندان سنت جود CoCoRV را به عنوان یک راه حل ایجاد کردند.

چن گفت: “ابزار ما یک روش منسجم و سیستماتیک برای به حداکثر رساندن قدرت تجزیه و تحلیل و به حداقل رساندن خطر یافتن موارد مثبت کاذب ارائه می دهد. بنابراین کاربران می توانند با اطمینان انواع بیماری زاهای بالقوه را اسکن کنند یا سعی کنند ژن های خطر یک بیماری نادر را شناسایی کنند.”


مطالعه مبتنی بر جمعیت، پیوندهای ژنتیکی قوی با بیماری‌ها و ویژگی‌های متابولیک قلبی متعدد را نشان می‌دهد


اطلاعات بیشتر:
ونان چن و همکاران، یک چارچوب تجزیه و تحلیل گونه نادر با استفاده از شمارش خلاصه ژنوتیپ عمومی برای اولویت بندی ژن های مستعد بیماری، ارتباطات طبیعت (2022). DOI: 10.1038/s41467-022-30248-0

ارائه شده توسط بیمارستان تحقیقاتی کودکان سنت جود

نقل قول: ابزاری برای باز کردن قفل “بازی اعداد” داده های بزرگ در تحقیقات بیماری های نادر (2022، 11 مه) در 11 مه 2022 از https://medicalxpress.com/news/2022-05-tool-game-big-rare- بازیابی شده است. بیماری.html

این برگه یا سند یا نوشته تحت پوشش قانون کپی رایت است. به غیر از هرگونه معامله منصفانه به منظور مطالعه یا تحقیق خصوصی، هیچ بخشی بدون اجازه کتبی قابل تکثیر نیست. محتوای مذکور فقط به هدف اطلاع رسانی ایجاد شده است.