[ad_1]

استفاده از قدرت ژنومیک برای یافتن عوامل خطر برای بیماری های اصلی یا جستجوی خویشاوندان به توانایی پرهزینه و زمان بر برای تجزیه و تحلیل تعداد زیادی از ژنوم ها متکی است. یک تیم به سرپرستی یک دانشمند کامپیوتر دانشگاه جانز هاپکینز با ایجاد یک پلتفرم مبتنی بر ابر که به محققان ژنومیک دسترسی آسان به یکی از بزرگترین پایگاه های داده ژنومیک جهان را می دهد، زمین بازی را هموار کردند.

این پلت فرم جدید که با نام AnVIL (تجزیه و تحلیل علم داده های ژنومی، تجسم و فضای آزمایشگاهی انفورماتیک) شناخته می شود، به هر محققی با اتصال به اینترنت دسترسی به هزاران ابزار تجزیه و تحلیل، سوابق بیمار و بیش از 300000 ژنوم را می دهد. این اثر، پروژه‌ای از موسسه ملی ژنوم انسانی (NHGRI) است که امروز در این مقاله ظاهر می‌شود ژنومیک سلولی.

مایکل شاتز، یکی از رهبران پروژه، پروفسور برجسته علوم کامپیوتر و زیست شناسی بلومبرگ، گفت: «AnVIL مدل به اشتراک گذاری داده های ژنومیک را معکوس می کند، فرصت های جدید بی سابقه ای را برای علم از طریق اتصال محققان و مجموعه داده ها به روش های جدید و نوید دادن به اکتشافات جدید هیجان انگیز ارائه می دهد. در جانز هاپکینز

معمولاً تجزیه و تحلیل ژنومی با بارگیری حجم عظیمی از داده‌ها از انبارهای متمرکز به مراکز داده خود توسط محققان آغاز می‌شود، فرآیندی که نه تنها زمان‌بر، ناکارآمد و پرهزینه است، بلکه همکاری با محققان سایر مؤسسات را نیز دشوار می‌کند.

“AnVIL برای موسسات در هر اندازه، به ویژه موسسات کوچکتر که منابع لازم برای ایجاد مراکز داده خود را ندارند، متحول خواهد شد. امیدواریم که AnVIL زمین بازی را هموار کند، به طوری که همه دسترسی یکسان به اکتشافات داشته باشند.” شاتز گفت.

عوامل خطر ژنتیکی برای بیماری هایی مانند سرطان یا بیماری های قلبی عروقی اغلب بسیار نامحسوس هستند و محققان را ملزم می کند تا ژنوم هزاران بیمار را برای کشف ارتباط های جدید تجزیه و تحلیل کنند. داده‌های خام برای یک ژنوم انسانی منفرد حدود 40 گیگابایت است، بنابراین دانلود هزاران ژنوم می‌تواند چند روز تا چند هفته طول بکشد: یک ژنوم واحد به حدود 10 دی‌وی‌دی به داده نیاز دارد، بنابراین انتقال هزاران به معنای جابجایی «ده‌ها هزار دی‌وی‌دی» است. شاتز گفت.

علاوه بر این، بسیاری از مطالعات نیاز به یکپارچه سازی داده های جمع آوری شده در چندین مؤسسه دارند، به این معنی که هر مؤسسه باید نسخه خود را بارگیری کند و در عین حال اطمینان حاصل شود که امنیت داده های بیمار حفظ می شود. انتظار می رود این چالش در آینده حتی بیشتر شود، زیرا محققان مطالعات بزرگتری را آغاز می کنند که نیاز به تجزیه و تحلیل صدها هزار تا میلیون ها ژنوم در آن واحد دارد.

Schatz می‌گوید: «اتصال به AnVIL از راه دور نیاز به این دانلودهای عظیم را از بین می‌برد و در هزینه‌های اضافی صرفه‌جویی می‌کند. به جای انتقال دردناک داده‌ها به محققان، ما به محققان اجازه می‌دهیم بدون زحمت به داده‌های موجود در فضای ابری منتقل شوند. همچنین اشتراک‌گذاری مجموعه داده‌ها را بسیار آسان‌تر می‌کند تا بتوان داده‌ها را به روش‌های جدیدی برای یافتن ارتباط‌های جدید به هم متصل کرد، و بسیاری از محاسبات را ساده‌تر می‌کند. مسائلی مانند ارائه رمزگذاری قوی و حفظ حریم خصوصی برای مجموعه داده های بیمار.”

AnVIL همچنین چندین ابزار تجزیه و تحلیل اصلی از جمله Galaxy را که تا حدی در Johns Hopkins توسعه یافته است، همراه با سایر ابزارهای محبوب مانند R/Bioconductor، Jupyter notebooks، WDLs، Gen3 و Dockstore برای پشتیبانی از تجزیه و تحلیل تعاملی و دسته ای در مقیاس بزرگ در اختیار محققان قرار می دهد. محاسبه. در مجموع، این ابزارها به محققان این امکان را می‌دهند که حتی بزرگترین مطالعات را بدون نیاز به ساختن محیط‌های محاسباتی خود انجام دهند.

محققان از سراسر جهان در حال حاضر از این پلت فرم برای مطالعه انواع بیماری های ژنتیکی از جمله اختلالات طیف اوتیسم، بیماری های قلبی عروقی و صرع استفاده می کنند. تیم شاتز، بخشی از کنسرسیوم تلومر به تلومر، از آن برای تجزیه و تحلیل مجدد هزاران ژنوم انسانی با ژنوم مرجع جدید برای کشف بیش از 1 میلیون نوع جدید استفاده کرد.

در حال حاضر، تیم AnVIL پتابایت‌ها داده را از چندین پروژه بزرگ NHGRI، از جمله صدها هزار ژنوم از بیان ژنوتیپ بافت (GTEx)، مراکز ژنتیک مندلی (CMG) و مراکز ژنومیک بیماری‌های مشترک (CCDG) جمع‌آوری کرده است. ) پروژه ها، با برنامه ریزی برای میزبانی بسیاری از پروژه های دیگر در آینده نزدیک.

تیم AnVIL شامل محققانی از دانشگاه جان هاپکینز، موسسه برود MIT و هاروارد، دانشگاه هاروارد، دانشگاه واندربیلت، دانشگاه شیکاگو، دانشگاه علوم و بهداشت اورگان، دانشکده پزشکی دانشگاه ییل، دانشگاه کالیفرنیا، سانتا کروز، رازول است. موسسه جامع سرطان پارک، دانشگاه ایالتی پنسیلوانیا، دانشگاه شهر نیویورک، موسسه کارنگی و دانشگاه واشنگتن در سنت لوئیس.

این کار از طریق جوایز قرارداد همکاری از NHGRI، با کمک مالی مشترک از دفتر استراتژی علوم داده مؤسسه ملی بهداشت به مؤسسه براد و دانشگاه جانز هاپکینز پشتیبانی شد.

[ad_2]