[ad_1]
استفاده از قدرت ژنومیک برای یافتن عوامل خطر برای بیماری های اصلی یا جستجوی خویشاوندان به توانایی پرهزینه و زمان بر برای تجزیه و تحلیل تعداد زیادی از ژنوم ها متکی است. یک تیم به سرپرستی یک دانشمند کامپیوتر دانشگاه جانز هاپکینز با ایجاد یک پلتفرم مبتنی بر ابر که به محققان ژنومیک دسترسی آسان به یکی از بزرگترین پایگاه های داده ژنومیک جهان را می دهد، زمین بازی را هموار کردند.
این پلت فرم جدید که با نام AnVIL (تجزیه و تحلیل علم داده های ژنومی، تجسم و فضای آزمایشگاهی انفورماتیک) شناخته می شود، به هر محققی با اتصال به اینترنت دسترسی به هزاران ابزار تجزیه و تحلیل، سوابق بیمار و بیش از 300000 ژنوم را می دهد. این اثر، پروژهای از موسسه ملی ژنوم انسانی (NHGRI) است که امروز در این مقاله ظاهر میشود ژنومیک سلولی.
مایکل شاتز، یکی از رهبران پروژه، پروفسور برجسته علوم کامپیوتر و زیست شناسی بلومبرگ، گفت: «AnVIL مدل به اشتراک گذاری داده های ژنومیک را معکوس می کند، فرصت های جدید بی سابقه ای را برای علم از طریق اتصال محققان و مجموعه داده ها به روش های جدید و نوید دادن به اکتشافات جدید هیجان انگیز ارائه می دهد. در جانز هاپکینز
معمولاً تجزیه و تحلیل ژنومی با بارگیری حجم عظیمی از دادهها از انبارهای متمرکز به مراکز داده خود توسط محققان آغاز میشود، فرآیندی که نه تنها زمانبر، ناکارآمد و پرهزینه است، بلکه همکاری با محققان سایر مؤسسات را نیز دشوار میکند.
“AnVIL برای موسسات در هر اندازه، به ویژه موسسات کوچکتر که منابع لازم برای ایجاد مراکز داده خود را ندارند، متحول خواهد شد. امیدواریم که AnVIL زمین بازی را هموار کند، به طوری که همه دسترسی یکسان به اکتشافات داشته باشند.” شاتز گفت.
عوامل خطر ژنتیکی برای بیماری هایی مانند سرطان یا بیماری های قلبی عروقی اغلب بسیار نامحسوس هستند و محققان را ملزم می کند تا ژنوم هزاران بیمار را برای کشف ارتباط های جدید تجزیه و تحلیل کنند. دادههای خام برای یک ژنوم انسانی منفرد حدود 40 گیگابایت است، بنابراین دانلود هزاران ژنوم میتواند چند روز تا چند هفته طول بکشد: یک ژنوم واحد به حدود 10 دیویدی به داده نیاز دارد، بنابراین انتقال هزاران به معنای جابجایی «دهها هزار دیویدی» است. شاتز گفت.
علاوه بر این، بسیاری از مطالعات نیاز به یکپارچه سازی داده های جمع آوری شده در چندین مؤسسه دارند، به این معنی که هر مؤسسه باید نسخه خود را بارگیری کند و در عین حال اطمینان حاصل شود که امنیت داده های بیمار حفظ می شود. انتظار می رود این چالش در آینده حتی بیشتر شود، زیرا محققان مطالعات بزرگتری را آغاز می کنند که نیاز به تجزیه و تحلیل صدها هزار تا میلیون ها ژنوم در آن واحد دارد.
Schatz میگوید: «اتصال به AnVIL از راه دور نیاز به این دانلودهای عظیم را از بین میبرد و در هزینههای اضافی صرفهجویی میکند. به جای انتقال دردناک دادهها به محققان، ما به محققان اجازه میدهیم بدون زحمت به دادههای موجود در فضای ابری منتقل شوند. همچنین اشتراکگذاری مجموعه دادهها را بسیار آسانتر میکند تا بتوان دادهها را به روشهای جدیدی برای یافتن ارتباطهای جدید به هم متصل کرد، و بسیاری از محاسبات را سادهتر میکند. مسائلی مانند ارائه رمزگذاری قوی و حفظ حریم خصوصی برای مجموعه داده های بیمار.”
AnVIL همچنین چندین ابزار تجزیه و تحلیل اصلی از جمله Galaxy را که تا حدی در Johns Hopkins توسعه یافته است، همراه با سایر ابزارهای محبوب مانند R/Bioconductor، Jupyter notebooks، WDLs، Gen3 و Dockstore برای پشتیبانی از تجزیه و تحلیل تعاملی و دسته ای در مقیاس بزرگ در اختیار محققان قرار می دهد. محاسبه. در مجموع، این ابزارها به محققان این امکان را میدهند که حتی بزرگترین مطالعات را بدون نیاز به ساختن محیطهای محاسباتی خود انجام دهند.
محققان از سراسر جهان در حال حاضر از این پلت فرم برای مطالعه انواع بیماری های ژنتیکی از جمله اختلالات طیف اوتیسم، بیماری های قلبی عروقی و صرع استفاده می کنند. تیم شاتز، بخشی از کنسرسیوم تلومر به تلومر، از آن برای تجزیه و تحلیل مجدد هزاران ژنوم انسانی با ژنوم مرجع جدید برای کشف بیش از 1 میلیون نوع جدید استفاده کرد.
در حال حاضر، تیم AnVIL پتابایتها داده را از چندین پروژه بزرگ NHGRI، از جمله صدها هزار ژنوم از بیان ژنوتیپ بافت (GTEx)، مراکز ژنتیک مندلی (CMG) و مراکز ژنومیک بیماریهای مشترک (CCDG) جمعآوری کرده است. ) پروژه ها، با برنامه ریزی برای میزبانی بسیاری از پروژه های دیگر در آینده نزدیک.
تیم AnVIL شامل محققانی از دانشگاه جان هاپکینز، موسسه برود MIT و هاروارد، دانشگاه هاروارد، دانشگاه واندربیلت، دانشگاه شیکاگو، دانشگاه علوم و بهداشت اورگان، دانشکده پزشکی دانشگاه ییل، دانشگاه کالیفرنیا، سانتا کروز، رازول است. موسسه جامع سرطان پارک، دانشگاه ایالتی پنسیلوانیا، دانشگاه شهر نیویورک، موسسه کارنگی و دانشگاه واشنگتن در سنت لوئیس.
این کار از طریق جوایز قرارداد همکاری از NHGRI، با کمک مالی مشترک از دفتر استراتژی علوم داده مؤسسه ملی بهداشت به مؤسسه براد و دانشگاه جانز هاپکینز پشتیبانی شد.
[ad_2]