Dil Seçin

Turkish

Down Icon

Ülke Seçin

Poland

Down Icon

Viral kaosu organize etmek için Polonya aracı

Viral kaosu organize etmek için Polonya aracı

Polonyalı araştırmacılar, milyonlarca virüs dizisini karşılaştırıp benzerliklerine göre sıralayabilmelerini sağlayan Vclust adlı bir bilgisayar programı geliştirdiler. Geleneksel yöntemleri kullanarak devasa genetik veri kümelerini analiz etmek yıllar alırdı.

"Vclust kullanılarak, 15 milyon diziden oluşan bir setin analizi yaklaşık dört saat sürerken, şimdiye kadar kullanılan en doğru araçlar yaklaşık dört yıl sürecektir. Bu, viroloji ve metagenomiğin gelişimi için önemli bir adımdır, çünkü son yıllarda modern dizileme teknolojileri sayesinde büyük ölçüde keşfedilen yeni virüslerin tanımlanmasını ve sınıflandırılmasını kolaylaştıracaktır," çözümün yaratıcıları PAP ile yaptıkları bir röportajda vurguladılar.

Poznań Adam Mickiewicz Üniversitesi Biyoloji Fakültesi ve Silezya Teknoloji Üniversitesi Otomatik Kontrol, Elektronik ve Bilgisayar Bilimleri Fakültesi'nden bir bilim insanı ekibi, Jena Friedrich Schiller Üniversitesi'nden bir uzmanla işbirliği yaparak Nature Methods dergisinde, bilinen virüsleri yenilerinden ayırt etmeyi ve farklı ortamlardaki çeşitliliklerini analiz etmeyi sağlayan, yeni patojenleri izlemek ve mikrobiyomu araştırmak için hayati önem taşıyan bir aracı açıkladı.

Araştırmacılar, modern mikrobiyolojinin bir veri seliyle boğuştuğunu açıkladı. Her yıl bir milyona kadar yeni virüs keşfediliyor ve bu da o kadar büyük koleksiyonlara yol açıyor ki analizleri ve sınıflandırmaları araştırma ekipleri için giderek daha büyük bir zorluk haline geliyor.

"Bu veri patlaması, belirli bir çevresel örnekte bulunan tüm DNA'nın (örneğin okyanus, toprak veya insan bağırsağından) okunmasına izin veren bir yöntem olan metagenomikten kaynaklanmaktadır. Şimdiye kadar, bu kadar çok sayıda dizinin etkili bir şekilde analiz edilmesine ve gruplandırılmasına izin verecek araçlardan yoksundu. Çok doğru yöntemler vardı, ancak bu kadar büyük bir veri ölçeğini işleyemiyorlardı. Bu nedenle, eşit derecede hassas ancak çok daha verimli ve aynı anda milyonlarca genomu işleyebilecek bir program oluşturmaya karar verdik," diye açıkladı yayının ortak yazarı, Adam Mickiewicz Üniversitesi'nden Dr. Andrzej Zieleziński.

Virüsler neden bu kadar zordur?

Biyolojide organizmaların sınıflandırılması -veya taksonomi- genellikle belirli bir grubun tüm temsilcilerinde bulunan belirli genlerin karşılaştırılmasına dayanır. Bu sayede organizmaların filogenetik ağaçlarını oluşturmak, onları gruplamak, aileleri veya türleri ayırt etmek ve akrabalık derecelerini belirlemek mümkündür. Virüslerde ise durum tamamen farklıdır.

"Örneğin, bakterilerin aksine virüsler karşılaştırılabilecek tek bir ortak gene sahip değildir. Birbirlerinden çok farklıdırlar. Bu yüzden klasik filogenetik yöntemler işe yaramaz. Örneğin kapsidlerin şekli gibi morfolojilerine dayanan yaklaşım da işe yaramadı, çünkü çok yavaş ve çok ölçeklenebilir olmadığı ortaya çıktı. Bu yüzden tek bir şeyle baş başa kaldık - tüm genomların dizilerini harf harf karşılaştırmak," dedi Dr. Hab. Zieleziński.

Milyonlarca böyle genom varken bunu yapmak zordur. Proje yöneticisi, Silezya Teknoloji Üniversitesi'nden Prof. Sebastian Deorowicz'in açıkladığı gibi, bu devasa veri kümelerini gruplandırmaya izin veren araçlar zaten var, ancak bunu günlük araştırma koşullarında tekrarlanması zor olan büyük bir hesaplama maliyetiyle yapıyorlar. "Daha önce hiç kimse bunu yapmamış değil, ancak bu kadar büyük kaynaklar (örneğin süper bilgisayarlar) gerektiriyordu ki bu süreci düzenli olarak tekrarlamak zor olurdu, özellikle de giderek daha büyük veri kümeleriyle uğraştığımızda," diye belirtti.

"Bu yüzden optimizasyona odaklandık, yani mümkün olan en etkili algoritmaları ve en verimli kodu tasarladık, bu da hesaplama süresini birkaç kat azaltmamızı sağladı. Tüm bunlar, hesaplamaları bir süper bilgisayardan sıradan bir iş istasyonuna aktarmak içindi," diye ekledi.

Virüsleri Düzenlemenin Üç Adımı

Vclust üç aşamada çalışır. Birincisi, programın en ufak bir benzerlik bile paylaşan dizi çiftlerini hızla belirlediği bir ön filtredir. Her diziyi birbiriyle karşılaştırmak yerine (bu trilyonlarca olası kombinasyon anlamına gelir) algoritma analizi çok daha küçük bir sayıyla, en umut verici çiftlerin yüz milyonlarca mertebesinde sınırlar.

İkinci aşama, seçilen dizilerin hassas bir şekilde karşılaştırılmasıdır. Burada, ZIP veya RAR formatlarında kullanılan veri sıkıştırma algoritmalarından esinlenen tekniklere dayanan tescilli LZ-ANI algoritması kullanılır. Çalışma prensibi basittir: iki dizi birbirine ne kadar benzerse, birlikte "sıkıştırılmaları" o kadar iyidir, yani işlendikten sonra daha az yer kaplarlar. Bu etki, benzerliğin bir ölçüsü olarak kullanılır.

Son aşama kümelemeyi veya dizileri benzerliklerine göre gruplandırmayı içerir. Genomları birbirine en çok benzeyen virüsler aynı gruba yerleştirilir. Bu, hangilerinin ilişkili olduğunu ve "aileler" oluşturduğunu ve hangilerinin tamamen ayrı olduğunu belirlemeyi kolaylaştırır. Bu, virüslerin çeşitliliğinin ve evrimsel bağlantılarının daha iyi anlaşılmasını sağlar.

"Bu sayede program bilgisayarın gücünü maksimumda kullanıyor. Vclust'ı test eden herkes hızına hayran kaldı," diye vurguladı Dr. Hab. Zieleziński.

Vclust'ın yaratıcıları aracın tamamen ücretsiz ve herkese açık olduğundan emin oldular. Bunu internetten indirebilir ve kendi bilgisayarınızda çalıştırabilirsiniz. Gelişmiş donanıma sahip olmayanlar için bir tarayıcı sürümü hazırlandı: vclust.org.

Araç çok basit bir şekilde çalışır: kullanıcı kendi dizilerini yapıştırabilir, analizi çalıştırabilir ve kısa bir süre sonra sonucu alabilir - oturum açmaya veya kayıt olmaya gerek kalmadan. Şu anda, tarayıcı sürümü aynı anda bin diziye kadar analiz yapılmasına izin veriyor ve bu birçok durumda tamamen yeterli oluyor.

Prof. Deorowicz ve Dr. Hab. Zieleziński projenin geliştirileceğini garanti ediyor. "Daha fazla işlev eklemeyi planlıyoruz ve gelecekte Vclust'ı bakteri genomlarını analiz etme yeteneğiyle de genişletmek istiyoruz," diye duyurdular.

Polonya'da Bilim, Katarzyna Czechowicz (PAP)

kap/ agt/ amac/

naukawpolsce.pl

naukawpolsce.pl

Benzer Haberler

Tüm Haberler
Animated ArrowAnimated ArrowAnimated Arrow