FORSKNINGENS FÖRUTSÄTTNINGAR. För att förenkla övervakningen av covid-19 i samhället och bevaka spridningen av mutationer av viruset, startas nu en unik databas vid Göteborgs universitet. Här ska stora mängder data om viruset samordnas och delas mellan sjukhus och lärosäten i hela Sverige, och med Folkhälsomyndigheten.
– Vi kommer kunna följa utvecklingen nationellt och i närtid under tiden som spridningen pågår, berättar Per Sikora, koordinator på Genomiskt Medicincentrum Väst, som är ett samarbete mellan Sahlgrenska akademin, SciLifeLab och Sahlgrenska Universitetssjukhuset.
Datadriven approach
Information så som ålder, kön, geografisk plats och provtagningstidpunkt i kombination med uppgifter från labbsvar ska samlas i en så kallad datasjö med hög serverkapacitet. Genom att kombinera data, där även uppgifter om hur starkt ett positivt resultat är och vilken subtyp av viruset det handlar om finns, kan virusets vägar genom samhället spåras effektivt. Uppgifter kan dock inte kopplas till enskilda personer.
– Metoden blir en datadriven approach där du inte strukturerar data i förväg, utan tar hjälp av den stora mängden information som datasjön erbjuder för att göra sökningar och visualiseringar, och därifrån kunna dra slutsatser och få svar. Du kommer troligen kunna besvara frågor som du inte visste att du hade, med data du inte visste att du behövde, säger Per.
Data tillgängliggörs kontinuerligt med start i april 2021.
Unik lösning inom medicin
Så vitt Per vet så finns det inte någon sådan lösning i Sverige inom diagnostik, sjukvård eller translationell forskning. Men han lyfter fram Helsingfors universitetssjukhus och Genomics England som två platser där liknande infrastruktur har byggts. Det som får den svenska satsningen att sticka ut är att databasen sammankopplar regioner och nationella aktörer.
– Att vi skapar det här nationella, kraftfulla verktyget inom genomikfältet kommer att ge stora möjligheter framöver, inte bara för covid-forskningen men också för att kunna övervaka utvecklingen av multiresistenta bakterier. På sikt kommer plattformen ligga till grund för att sjukhus ska kunna dela och aggregera data för diagnostik, berättar Per.
Core Facilities är navet
Core Facilities vid Göteborgs universitet köper in och förvaltar servrarna på uppdrag av Genomic Medicine Sweden (GMS), Sveriges precisionsmedicinprojekt.
– Både inom Göteborgs universitet och Västra Götalandsregionen har vi ett särskilt nationellt uppdrag att utveckla informatik och IT-infrastruktur inom genomik. På Core Facilities har vi särskild kompetens inom området och kommer vara navet i arbetet, säger Per Sikora, som även har rollen som Chair för informatik och infrastruktur för Genomic Medicine Sweden.
FAKTA
Vem får tillgång till innehållet?
Regioner som ingår i samarbetet och som kommer ha tillgång till datan är regionerna i Västra Götaland, Östergötland, Skåne, Örebro, Stockholm, Uppsala, Västerbotten. Data kommer även delas med Folkhälsomyndigheten.
Hur är servern uppbyggd och hur används den?
All data kommer finnas på en samling av servrar med stora mängder minne. Extremt snabba switchar binder samman dem och datalagret. Miljoner filer och mängder med metadata om covid-19 kommer finnas lagrade ostrukturerat i datasjön, men redo att ”fiskas upp” så att forskare, smittskyddsläkare och kliniska mikrobiologiska labb ska kunna vaska fram svar på frågor. Uppgifterna kan inte kopplas till någon enskild person.
Inom fordonsindustrin och bankvärlden används denna teknik för att hitta trender i stora mängder data, för maskininlärning och för att hålla koll på transaktioner. Men inom medicinsk forskning och hälso- och sjukvård är detta unikt i Sverige, menar Per Sikora.
Core Facilities vid Göteborgs universitet köper in och förvaltar infrastrukturen på uppdrag av Genomic Medicine Sweden (GMS), som är en del av SciLifeLab. Både GU och VGR har ett nationellt uppdrag via GMS att utveckla informatik och IT-infrastruktur inom genomic.
Databasen är första steget för att bygga upp nästa generation infrastruktur för translationell forskning och diagnsotik. Detta är en grundbult som kan byggas vidare på oändligt och kommer kunna stödja nästan alla genomikdata som genereras i hela Sverige i framtiden.
AV: CHARBEL SADER