TF2013: Discipline in projekti

“Big Data” v biologiji – Elixir

Prosojnice

Prosojnice

Povečanje računskih in podatkovnih kapacitet pomembno spreminja delo v bilogiji in biomedicini. Razpoložljivost podatkov, medopravilnost različnih javnih servisov in infrastruktur in zmožnost njihove obdelave bistvno spreminja možnosti in perspektive disciplin od biokemije do medicine.

Med najbolj očitnimi napredki je napredek na področju genetike in genetske analize, kjer končno analizirajo in modelirajo postopke prepisov v proteine, ter seveda na področju boja proti raku, kjer je zaradi novih možnosti postala genetska analiza in modeliranje posameznih tumorjev doseglijivo večini raziskovalcev. Napredek pa je prišel tudi do osebne medicine, kjer so postale osebne analize dostopne posameznikom oziroma njihovim zdravnikom.

Biokuratorsvo

Hkrati je nastala disciplina biokuratorstva, ki skrbi za javno dostopne podatke na področju biologije. Podatki iz posameznih javnih virov in projektov ter podatki iz obstoječih, a doslej elektronsko nedosegljivi podatki so preverjeni in prenešeni v javno dostopno elektronsko obliko.

Eksplozija podatkov

Sekvenciranje DNK od porasta v letu 2008 proizvaja še enkrat več podatkov v 6-8 mesecih, kar je problematično, ker se po Moorovem zakonu kapaciteta računalniške opreme podvaja le na 18 mesecev. Biomedicinske discipline bi brez velikih infrastruktur ne zmogle obdelovati svojih podatkov.

Elixir

Dr. Niklas Blomberg, direktor projekta Elixir

Dr. Niklas Blomberg, direktor projekta Elixir

Projekt Elixir skuša z velikimi razšrenimi infrastrukturami reševati ta problem skozi omrežje centrov, ki povezuj ejo uporabnike biomedicinskih podatkov z obstoječimi omrežji in rešujejo organiziacijske probleme. Rešitve v posameznih deželah pa so različne in prilagojene loklanim pogojem. V začetni ali “gradbeni” fazi, kakor pravi dr. Niklas Blomberg, direktor projekta Elixir, pristopajo posamezne države in vzpostavljajo svoj del omrežja. Slovenija je med pristopnicami, zagon projekta pa je bil podrobjeje predstavljen v predavanju “Engagment with the ELIXIR Research Infrastructure“.

Analiza mehanizmov biomolekul

WE-NMR VO

Virtualna organizacija WE-NMR

Sodobni pristopi k analizi mehanizmov biomolekul, predvsem aktivacije in vezave proteinov v soluciji, so računsko izjemno zahtevni. Analizo podatkov magnetne resonance jedra (NMR – nuclear magnetic resonance) pa je mogoče z vzporednimi alogoritmi masivno pospešiti na infrastrukturi grida.

Analiza poteka v lastni virtualni organizaciji  WEN NMR Uporabljajo več programskih paketov. Posebej je bil predsavljen HADDOCK – paket za analizo možnosti lepljenja (docking) proteinov s pomočjo modela na osnovi analize magnetne resonance jedra.

Evropska vesoljska agencija

Evropska vesoljska agencija

Največji evropski observatoriji in eZnanost

Za upravljanje vedno večjih priprav Evropskega južnega observatorija in Evropske vesoljske agencije, za zapisovanje podatkov, ki jih zajemajo in obdelovanje podatkov, ki segajo v velikostni red petabytov, je potrebna velika razpršena informacijsko-tehnološka infrastruktura, zato so vsi veliki evropski  observatoriji  veliki uporabniki razpršenih računskih infrastruktur. Takšni primeri so VLT (Very Large Telescope, Zelo velik teleskop) Evropske vesoljske agencije, ki je danes največji in najnaprednješi optični astronomski instrument na Zemlji (ter seveda njegov nasledik  E-ELT ali Izjemno velik teleskop), ALMA (mednarodni radijski teleskop in največji astronomski instrument doslej) ter GAIA (globalna vesoljska telemetrična odprava, katere sonda pošilja neznanske količine astrotelemetričnih podatkov, ki bodo omogočili bistven napredek na področju galaktične kartografije).

Logo Projekta sonde GAIA

Projekt sonde GAIA

Podobno velika naloga je kuratorstvo in arhiviranje astronomskih podatkov po standardih Virtualnega observatorija, ki so običajno eno leto rezervirani za raziskovalno skupino, ki jih je pridobila, potem pa postanejo javno dobro. V to področjo sodijo protokoli, formati in orodja, ki omogočajo standardizirano arhiviranje. Podvig zahteva koordinacijo. ki jo zagotavlja organizacija Evropski virtualni observatorij, in danes vsi resni observatoriji svoje podatke shranjujejo na takšen način.

Predstavitve uspehov v različnih disciplinah

Na konferencah EGI tradicionalno izpostavijo nekaj področij, kjer je v zadnjih mesecih prišlo do zanimivega napredka na področju tehnologije, integracije med infrastrukturo in obstoječo tehnologijo na posameznem področju, še najraje pa si ogledamo velike znanstvene dosežke, ki jih je omogočila razpršena računska in podatkovna infrastruktura.

Nekaj takšnih primerov je bilo predstavljenih v Delavnici virtualnih raziskovalnih skupnosti. Med njimi so raziskovalni projekti na področju strukturne biologije, nanocompozitov (v sodelovanju s PRACE), hidrometeoroloških raziskav ter digitalizacije in obdelave kulturnega izročila (eno prednostnih področij  v prihodnjem finančnem obdobju).

Nekatere uspešne primere v EGI analiziramo in predstavimo kot uspešne primere uporabe (EGI Use Case Studies), da se lahko raziskovalci in upravljalci infrastrukturnih centrov zgledujejo po uspešnih predhodnikih. (Drug pomemben vir podatkov za nove uprabnike je seveda register programske opreme in disciplin EGI).

ESO - European Southern Observatory and ESA - European Space Agency, drive a very significant part of the scientific activity in astronomy around the world. I will present ESO's programme, including existing (VLT, ALMA) and future (E-ELT)