Introduction to next generation sequencing technologies
Štimac, I., F. Martinković
Iva ŠTIMAC, dr. med. vet., Zagreb, dr. sc. Franjo MARTINKOVIĆ, dr. med. vet., docent, Zavod za parazitologiju i invazijske bolesti s klinikom, Veterinarski fakultet Sveučilišta u Zagrebu, Dopisni autor: fmartinkovic@vef.hr
SažetakAbstractUvodSekvenceri druge generacijeSekvenceri treće generacijeSekvenceri četvrte generacijeZaključakLiteratura
Sažetak
S ekvenciranje genoma važan je korak u određivanju korelacije između genotipa i obilježja fenotipa. Tehnologije sekvenciranja važne su u mnogim područjima prirodnih i biomedicinskih znanosti. Razdoblje razvoja sekvenciranja podijeljeno je na četiri generacije. Sekvenciranje prve generacije uključuje sekvenciranje sintezom (Sangerovo sekvenciranje) i sekvenciranje cijepanjem (Maxam-Gilbertovo sekvenciranje). Sangerovo sekvenciranje omogućilo je potpuno određivanje sekvencija različitih genoma, uključujući i ljudski, te je pružilo temelj razvoju tehnologija druge, treće i četvrte generacije, poznatih pod zajedničkim nazivom sekvenciranja novih generacija, pomoću kojih su prevladana određena ograničenja Sangerove metode. No unatoč mnogim prednostima poput brzine, cijene i paralelnosti, točnost i duljina očitanja Sangerova sekvenciranja i dalje ih nadmašuje te im ograničava upotrebu najčešće na postupak resekvenciranja. Zbog toga se pojavljuje stalna potreba za razvojem poboljšanih tehnologija sekvenciranja u stvarnom vremenu. Slijedom bibliografskih izvora dani su podaci u ovom radu kratak povijesni pregled razvoja tehnologija sekvenciranja novih generacija (engl. next generation sequencing, NGS).
Ključne riječi: sekvenciranja novih generacija, sekvenceri druge generacije, sekvenceri treće generacije, sekvenceri četvrte generacije.
Abstract
Genome sequencing is a significant step in determining the correlation between genotype and phenotype traits. Sequencing technologies are important in many fields in the life and biomedical sciences. The era of sequencing development is divided into four generations. First generation sequencing includes sequencing by synthesis (Sanger sequencing) and sequencing by cleavage (Maxam-Gilbert sequencing). Sanger sequencing enabled the complete sequencing of various genomes, including human, and provided the foundation for the development of second, third and fourth-generation technologies, collectively known as “new-generation sequencing,” that overcame certain limitations of Sanger method. But despite many advantages in terms of speed, cost and parallelism, the accuracy and read length of Sanger sequencing still surpasses them and limits their use mainly to resequencing procedure. Consequently, there is a constant need to develop improved real time sequencing technologies. Following the bibliographic sources, the data given in this paper are a brief historical overview of the development of next generation sequencing technologies (NGS).
Key words: Next generation sequencing, Second-generation sequencers, Third-generation sequencers, Fourth-generation sequencers.
Uvod
Dalje su u radu opisane pojedine metode sekvenciranja s naglaskom na njihove prednosti i nedostatke te je dan pregled naprednih tehnika sekvenciranja razvijenih u posljednja dva desetljeća.
Dvije vrlo različite metode sekvenciranja DNA objavljene su 1977. godine: Maxam-Gilbertova metoda kemijskog cijepanja (Maxam i Gilbert, 1977.) i Sangerova dideoksi-metoda (Sanger i sur., 1977.).
Metodu sekvenciranja prve generacije poznatu pod nazivom Sangerova metoda sekvenciranja (engl. Sanger’s method; dideoxy sequencing; chain termination) razvio je F. Sanger 1977. godine u suradnji sa svojim kolegama te objavio sekvenciju virusnoga genoma od preko 5000 parova baza (Sanger i sur., 1977.; Heather i Chain, 2016.). U dideoksi-metodi se rabe DNA uzorak, početnica za sekvenciranje, DNA polimeraza, nukleotidi (engl. deoxynucleotide triphosphates; dNTPs), dideoksinukleotidi (engl. dideoxynucleotide triphosphates; ddNTPs) i reakcijski pufer. Postavljaju se četiri zasebne reakcije sa radioaktivno obilježenim nukleotidima i dideoksinukleotidima. DNA polimeraza u svakom koraku produživanja lanca DNA dodaje dNTP ili odgovarajući ddNTP.
Vezanje dNTP (A, C, G ili T) za 3′- kraj DNA lanca omogućuje daljnje produljenje, no uslijed vezanja ddNTP-a (ddA, ddC, ddG ili ddT) biva zaustavljeno.
Dideoksi sekvenciranje rezultira stvaranjem lanaca (fragmenata) različitih duljina koji na 3′- kraju završavaju dideoksinukleotidima. Dobiveni fragmenti se razdvajaju elektroforezom s obzirom na njihovu veličinu, u razlučivosti jedne baze (Anonimus, 2009).
Tijekom niza godina Sangerova metoda doživjela je brojna poboljšanja. Prije svega, obilježavanje radioaktivnim izotopima zamijenjeno je određivanjem temeljenim na fluorimetriji, a elektroforeza na poliakrilamidnom gelu s kapilarnom elektroforezom.
Te su promjene pridonijele razvoju automatiziranih strojeva za DNA sekvenciranje, a u konačnici i njihove komercijalizacije te primjene u sekvenciranju sve složenijih genoma (Heather i Chain, 2016.).
Automatizirana Sangerova metoda smatra se tehnologijom prve generacije (engl. first generation sequencing, FGS), a novije tehnologije sekvenciranja onima nove generacije (engl. next generation sequencing, NGS) (Metzker, 2010).
Sekvenceri druge generacije
Osnovne značajke i prednosti tehnologije sekvenciranja druge generacije su: (1) paralelno čitanje više milijuna odsječaka, (2) veća brzina postupka, (3) niski troškovi i (4) izravno prepoznavanje ili dokazivanje izlazne sekvencije bez upotrebe elektroforeze (Kchouk i sur., 2017.).
S obzirom na to da je priprema knjižnice DNA presudan korak, kod NGS tehnologije nije potrebno klonirati DNA fragmente za sekvenciranje (Choudhuri, 2014.).
Nedostaci su relativno kratka očitanja što otežava i vremenski produljuje sastavljanje genoma (engl. genome assembly). Kako bi se očitala ili vizualizirala cijela sekvencija, očitani fragmenti moraju biti poredani pravilnim redoslijedom i u ispravnom broju kopija te podvrgnuti računalnoj obradi, čime na važnosti dobiva razvoj učinkovitih programa za sastavljanje genoma (engl. assemblers) (van Dijk i sur., 2014.).
Sve NGS tehnologije o kojima je riječ u nastavku primjenjuju sljedeće korake: (1) priprema knjižnice DNA (stvaranje ili kreiranje zbirke fragmenata za sekvenciranje), (2) imobilizacija fragmenata knjižnicena solidnu potporu, (3) umnožavanje fragmenata, (4) masovno paralelno sekvenciranje fragmenata i (5) računalno sastavljanje sekvencije.
Pristupi (načela) sekvenciranja kratkih očitanja (engl. short-read sequencing) podijeljeni su u dvije široke kategorije: sekvenciranje ligacijom (engl. sequencing by ligation, SBL) i sekvenciranje sintezom (engl. sequencing by synthesis, SBS) koji su najčešće svrstani u tri glavne tehnologije: (1) Roche / 454 predstavljena 2005. godine, (2) Illumina / Solexa 2006. godine i (3) ABI / SOLiD tehnolohija 2007. godine (Goodwin i sur., 2016.; Kchouk i sur., 2017.).
Kod SBL pristupa sekvencija probe vezane za fluorofor najprije se hibridizira s DNA fragmentom te zatim ligira za susjedni oligonukleotid da bi se omogućio postupak skeniranja. Emisijski spektar fluorofora otkriva vrstu baze ili više baza komplementarnih specifičnim pozicijama unutar probe.
Kod SBS pristupa primjenjuje se polimeraza i signal (poput fluorofora ili promjene u koncentraciji iona) koji prepoznaje dodavanje nukleotida u lanac koji se produžuje (elongira). U većini SBL i SBS pristupa klonsko amplificiranje DNA izvodi se na čvrstoj podlozi. Nekoliko tisuća kopija fragmenata smještenih na točno određenim mjestima osigurava emitiranje ili proizvodnju dovoljno jakog signala koji se može jasno razlikovati od pozadinskog šuma (Goodwin i sur., 2016).
Roche 454
Oko 20 godina nakon razvoja Sangerove dideoksi metode, P. Nyrén objavljuje tehniku pirosekvenciranja (engl. pyrosequencing) koja utire put razvoju i komercijalizaciji visokoprotočnog i masivno paralelnog sekvenciranja velikih razmjera, danas poznatog pod nazivom tehnologije sekvenciranja novih generacija ili sekvenciranja novih generacija (engl. next generation sequencing, NGS) (Choudhuri, 2014).
Prva NGS tehnologija koja se pojavila na tržištu 2005. godine bila je metoda 454 pirosekvenciranja biotehnološke tvrtke 454 Life Sciences (sada Roche). Sekvencer genoma 454 (Roche / 454) stvorio je u samom početku oko 200 000 (~ 20 Mb) sekvencija dužine očitanja 110 parova baza (engl. base pair, bp) (van Dijk i sur., 2014.). Pokrivenost sekvencije iznosila je 10 puta (10 x). Pokrivenost ili dubina očitanja (engl. coverage) označuje koliko je puta ponovljeno sekvenciranje baza genoma (ciljne sekvencije). Visoka pokrivenost osigurava veću točnost u postupku sekvenciranja. Do 2013. godine prosječna dužina očitanja povećana je na 700 – 800 bp. Razvojem tehnologije povećava se i prosječna duljina očitanja.
Pirosekvenciranje se temelji na načelu SBS-a. Svaki put kada DNA polimeraza produži lanac DNA, oslobodi se molekula pirofosfata (PPi), a svaka oslobođena molekula pokreće niz reakcija koje će naposljetku stvoriti dokazivu energiju u obliku svjetla.
Broj emitiranih fotona u svakom predlošku jednak je broju nastalih pirofosfata. Prema tome ova tehnika omogućuje otkrivanje sekvencije gena u realnom vremenu i stoga je prihvatljiva za brzo otkrivanje točkastih mutacija u sekvenciji, genotipizaciji mononukleotidnog polimorfizma (engl. single-nucleotide polymorphism; SNP), uključujući genotipizaciju mikroorganizama.
U postupku pirosekvenciranja DNA predložak (uzorak) koji treba sekvencirati najprije se umnoži lančanom reakcijom polimeraze (engl. polymerase chain reaction, PCR). Dužina amplikona (produkt umnožavanja fragmenta DNA, PCR produkt) obično je manja od 200 bp za učinkovito pirosekvenciranje, no može biti i veća. Broj ciklusa u redovitom PCR-u iznosi oko 30, a u onom namijenjenom pirosekvenciranju oko 50, što osigurava najveću moguću iskorištenost početnica i slobodnih nukleotida (Choudhuri, 2014.). PCR početnice (engl. PCR primers) jesu kratki fragmenti jednolančane DNA (engl. single-stran- DNA; ssDNA) koji odgovaraju sekvencijama na krajevima ciljnog segmenta DNA, a potrebni su za pokretanje sinteze DNA u PCR-u (Clark i Pazdernik, 2013.). Jedna od dvije PCR početnice biotinilirana je na 5’-kraju lanca. PCR produkt s biotiniliranim krajem uhvaćen je na zrnce sefaroze obložene streptavidinom (bakterijski protein s visokim afinitetom vezanja za biotin). Biotinilirani lanac služi kao predložak za pirosekvenciranje te se prije samog postupka denaturira lužinom i pročisti. Pirosekvenciranje se izvodi na pločama s određenim brojem jažica i započinje nakon dodavanja početnice za pirosekvenciranje (treće početnice) koja se postupno veže na biotinilirani pročišćeni predložak u prisutnosti četiri enzima – DNA polimeraze, ATP sulfurilaze, luciferaze i apiraze te dva supstrata – adenozin 5’-fosfosulfat (APS) i luciferina, ali bez deoksinukleotid-trifosfata (dNTPs). Zatim se pojedinačni dNTP-ovi dodaju reakciji, uzastopno prema točno određenom redoslijedu koji je prethodno programiran. Od četiri dNTP-a, umjesto deoksiadenozin-trifosfata (dATP) dodaje se deoksiadenozin alfa-tio trifosfat (dATPαS). Ako je dodani dNTP komplementaran s bazom na uzorku DNA, polimeraza će ga povezati pri čemu će se osloboditi pirofosfat (PPi). ATP sulfurilaza koristi ovaj PPi i APS za generiranje ATP-a koji je potreban luciferaziza oksidiranje luciferina u oksiluciferin uz istodobnu emisiju svjetlosti koja se bilježi CCD senzorom (engl. charge-coupled device; CCD) u obliku vršne vrijednosti signala (engl. peak; peak value). Zbog stehiometrije kemijske reakcije visina vršne vrijednosti signala izravno je proporcionalna broju ugrađenih nukleotida, što znači da će se prilikom uzastopnog ugrađivanja dviju jednakih baza visina vršne vrijednosti signala udvostručiti, odnosno signal neće nastati u slučaju da dodani dNTP ne nadopunjuje bazu predloška, a spomenuti će dNTP biti razgrađen djelovanjem apiraze. Vrlo je važno zadržati reakciju apiraze da bi razina pozadinskog signala bila niska. Graf koji se dobiva kao rezultat pirosekvenciranja naziva se pirogram (Choudhuri, 2014.).
Tehnologija 454 NGS jest poboljšanje standardnog postupka pirosekvenciranja u obliku vezanja samo jednog fragmenta na jedno zrnce, odnosno formiranja tzv. monoklonskih zrnaca. Knjižnica sekvencija povećava se pomoću emulzijskog PCR-a (em-PCR) kod kojeg se jedna molekula DNA predloška klonski amplificira u emulziji tipa voda u ulju (V/U), a sekvenciranje fragmenata izvodi metodom pirosekvenciranja.
Ukratko, tehnologija obuhvaća sljedeće korake: (1) priprema knjižnice DNA (fragmentiranje DNA + ligacija adaptora), (2) formiranje kompleksa jedan fragment – jedno zrnce, (3) umnožavanje fragmenata em-PCR metodom, (4) pročišćavanje i (5) sekvenciranje sintezom (slika 1.) (Choudhuri, 2014).
Proces započinje cijepanjem velikih DNA molekula na fragmente dužine oko 800 do 1000 bp. Kod navedenih dvolančanih fragmenata DNA (engl. double stranded DNA, dsDNA) oba lanca završavaju parom nukleotidnih baza (tzv. tupi ili polirani kraj). Tupi krajevi (završeci) ligirani su univerzalnim adaptorima (A i B). Navedeni adaptori pružaju početne sekvencijeza a mplifikaciju i sekvenciranje. Fragmenti dsDNA povezani s A i B adaptorima izdvojeni su primjenom streptavidin-biotin postupka pročišćivanja, denaturirani lužinom u jednolančane molekule i uhvaćeni na zrnca mikrometarske veličine u omjeru 1 : 1 DNA / zrnca (bez viška DNA kako bi se osiguralo stvaranje monoklonskih zrnaca). Površina zrnaca nosi oligonukleotide komplementarne sekvencijama adaptora knjižnice fragmenata. DNA fragmenti, zrnca i PCR reagensi spajaju se unutar vodene smjese koja se potom miješa sa sintetičkim uljem i snažno protrese.
Trešnja rezultira stvaranjem V/U emulzije, odnosno emulzijskih kapljica (tzv. mikroreaktora). Većina kapljica sadržava samo jedno zrnce i jedan fragment DNA okružen vodenim slojem, oko kojega se nalazi sloj ulja. U svakoj kapljici fragment se PCR-om klonski amplificira. Ovaj postupak PCR-a naziva se emulzijskim PCR-om (em-PCR). Tako će svako zrnce na svojoj površini nositi PCR produkte amplificirane od samo jedne molekule iz knjižnice predložaka. Iz tog se razloga navedena zrnca nazivaju monoklonskim zrncima. Nakon ispiranja hibridiziranih fragmenata na površini zrnaca ostat će uhvaćeni samo spomenuti jednolančani fragmenti DNA. Slijedi pročišćivanje zrnaca od sloja ulja i nanošenje amplificiranih fragmenata DNA knjižnice na ploču za pirosekvenciranje (engl. picotiter plate, PTP) koja sadržava 1,6 milijuna plitica promjera oko 44 µm i zapremnine 75 pikolitra (pL). U svaku se pliticu dodaje samo jedno zrnce i reaktivna smjesa za pirosekvenciranje. PTP se zatim stavlja u platformu za automatsko pirosekvenciranje, poput Roche 454 GS-FLX1 sustava, u kojoj su DNA fragmenti izloženi masovnom paralelnom pirosekvenciranju. Zrnca bez DNA fragmenata bivaju eliminirana, a ona s više različitih tipova fragmenata (tzv. poliklonalna zrnca) filtrirana tijekom obrade dobivenih rezultata pirosekvenciranja odnosno pirograma (Choudhuri, 2014.).
Illumina Solexa
Illumina tehnologiju sekvenciranja (engl. Illumina dye sequencing) razvili su S. Balasubramanian i D. Klenerman sa Sveučilišta u Cambridgeu i nakon toga osnovali tvrtku Solexa, poslije kupljenu od strane tvrtke Illumina (Bharagava i sur., 2019). Prvi Solexa sekvencer (Genome Analyzer) predstavljen je 2006. godine. U početku je mogao generirati 1 Gb sekvencija u jednom očitanju (do 2011. godine količina se povećala na 600 Gb), pokrivenosti 30x. Do 2013. godine vrijeme sekvenciranja HiSeq Platforme 2000/2500 trajalo je 11 dana za redoviti ili dva dana za brzi način rada, a prosječna duljina očitanja iznosila je ~100 bp. Kao što je već navedeno vrijednosti su proizvoljne jer se s vremenom nastavljaju poboljšavati (Choudhuri, 2014.). Tehnologija se temelji na primjeni reverzibilnih obojenih (obilježenih fluorescentnom bojom) terminacijskih nukleotida koji omogućuju prepoznavanje pojedinih baza nakon dodavanja u lance DNA (Bharagava i sur., 2019).
Glavni su koraci u Illumina (Solexa) tehnologiji sljedeći: (1) priprema knjižnice DNA (fragmentiranje DNA + ligacija adaptora), (2) vezanje pojedinačnih molekula DNA za površinu protočnih članaka, (3) umnožavanje mostova, (4) stvaranje klastera i (5) sekvenciranje sintezom.
Za pripremu knjižnice DNA sekvencija dugački lanac DNA nasumično je fragmentiran ultrazvukom pri čemu nastaju fragmenti tupih krajeva na koje se zatim ligiraju adaptori. Ligirani fragmenti odabrani su s obzirom na dužinu (250 – 350 bp) i podvrgnuti kratkom broju ciklusa PCR (10 – 15) radi njihova umnožavanja, što se potvrđuje elektroforezom u gelu. Nakon denaturacije fragmenata dsDNA dobiveni jednolančani fragmenti vezat će se za površinu protočnih članaka na kojima se nalaze oligonukleotidne početnice. Navedene početnice imobiliziraju fragmente vežući se za adaptore. Sljedeći je korak stvaranje gustih nakupina fragmenata, tzv. klastera.
Najprije su imobilizirani fragmenti podvrgnuti standardnom PCR umnožavanju radi proizvodnje velikog broja kopija izvornog fragmenta koje su zatim lokalizirane u tijesnom klasteru. Dvolančani PCR produkti u klasteru su denaturirani, a izvorni fragmenti (hibridizirani na oligonukleotidne početnice koje služe kao uzorak za amplifikaciju) isprani su ostavljajući površinski usidrene novosintetizirane lance. Novosintetizirani lanci hibridiziraju se s najbližom početnicom tvoreći pritom formu mosta. Polimeraza u PCR smjesi produljuje hibridiziranu početnicu tvoreći dvolančani most. Ovakav postupak PCR amplifikacije naziva se premoščujući PCR (engl. bridge polymerase chain reaction; bridge PCR; bridge amplification; surface PCR; Illumina sequencing). Nakon denaturacije dvolančanog mosta dobivaju se dvije jednolančane molekule, obje vezane za površinu. Ciklusi premošćujućeg PCR-a ponavljaju se radi dobivanja klastera jednolančanih produkata. Početni klasteri sastoje se od nakupina orginalnih i komplementarnih lanaca. Nakon odvajanja i ispiranja komplementarnih lanaca na površini ostaju vezani samo orginalni lanci (slika 2.) (Choudhuri, 2014.).
Prvi ciklus sekvenciranja pokrenut je dodavanjem sva četiri reverzibilna terminacijska nukleotida – od kojih je svaki obilježen različitim fluoroforom (engl. fluorophore), početnica za sekvenciranje i DNA polimeraze protočnim člancima. Polimeraza može produžiti lanac vežući samo po jednu bazu (ugradnjom baza komplementarnih bazama predloška), a elongacija će biti zaustavljena nakon inkorporacije baze s blokiranim 3’-krajem. Baze koje nisu ugrađene uklanjaju se dok se ugrađene izlažu laserskom pobuđivanju pri čemu se emitirana fluorescencija snima CCD (engl. charge-coupled device) kamerom.
Na taj se način dobiva slika prve baze, odnosno kod svakog se fragmenta bilježi i snima prva baza. Nakon toga se s prve baze kemijskim postupkom ukloni fluorofor i blokirani 3’-OH kraj omogućujući tako odvijanje sljedećeg ciklusa. Ciklus se ponavlja kako bi se odredio redoslijed baza u svakom fragmentu, određivanjem jedne baze po ciklusu. Sekvencija se sastavlja pomoću računalnog softvera pri čemu se koristi referentni genom (engl. reference genome; reference assembly). Ako referentni genom nije poznat i sekvencija je nova, primjenjuje se postupak de novo sastavljanja genoma (Choudhuri, 2014.).
ABI SOLiD
Applied Biosystems (sada dio tvrtke Life Tehnologies) komercijalizirali su svoju SOLiD tehnologiju 2008. godine. Skraćenica SOLiD ima sljedeće značenje – sekvenciranje ligacijom oligonukleotida i detekcijom (engl. sequencing by oligonucleotide ligation and detection). Za razliku od tehnologije 454 i Solexa koje koriste SBS, SOLiD tehnologija upotrebljava SBL pristup (Choudhuri, 2014). Jedina je molekularna tehnologija koja se koristi SBL pristupom te pokazuje visoku točnost i brzinu. Unapređuje i znatno smanjuje stope pogrešaka u usporedbi sa sekvenciranjem baziranim na aktivnosti polimeraze SBS pristupa (Bharagava i sur., 2019.). Najnovije SOLiD platforme poput SOLiD 4 sustava mogu proizvesti 80 – 100 Gb sekvencija DNA po čitanju, pokrivenosti 30x. Do 2013. godine prosječna duljina očitanja iznosila je ~ 50 bp. Navedene vrijednosti (brojevi) nisu konačne jer se s vremenom stalno poboljšavaju (Choudhuri, 2014.).
Ukratko, tehnologija obuhvaća sljedeće korake: (1) priprema knjižnice DNA (fragmentiranje DNA + ligacija adaptora), (2) formiranje kompleksa jedan fragment – jedno zrnce, (3) umnožavanje fragmenata em-PCR metodom, (4) pročišćivanje, (5) imobilizacija zrnaca na staklenu površinu i (6) sekvenciranje ligacijom.
Priprema knjižnice za SOLiD sustav sekvenciranja uključuje fragmentiranje velikih molekula DNA na fragmente duljine 400 – 600 bp. Na popravljene krajeve fragmenata ligirani su adaptori koji su zatim imobilizirani na paramagnetska zrnca. Postupak razrjeđivanja i učvršćivanja osigurava vezanje samo jednog fragmenta po lokaciji. Fragmenti na zrncima umnoženi su em-PCR metodom. Zrnca s produljenim fragmentima odvojena su od neželjenih zrnaca, a produženi fragmenti modificirani na 3’-kraju nakon čega su zrnca imobilizirana na staklenu površinu.
Sekvenciranje ligacijom ABI SOLiD tehnologije bazira se na primjeni sustava od dvije baze za određivanje sekvence te fluorescentnih boja za dokazivanje. Ovaj je postupak poznat i kao dekodiranje s dvije baze (engl. two-base encoding) (slika 3.).
Sustav rabi četiri fluorescentne boje za ispitivanje šesnaest mogućih kombinacija s dvije baze i određeni broj proba (engl. probe) (Choudhuri, 2014.).
Svaka je proba u ovom postupku duljine osam nukleotida (tzv. oktamer), prve dvije baze na 3’-kraju probe imaju jedinstvenu kombinaciju, a fluorofor je vezan za njezin 5’-kraj. Postupak započinje kad se početnica za sekvenciranje hibridizira s univerzalnim adaptorom (engl. adaptor). Zatim se proba koja sadržava kombinaciju dviju nukleotidnih baza komplementarnih dvjema bazama na 5’-kraju fragmenta (odmah do adaptora) hibridizira. Spajanje komplementarnih baza rezultira ligacijom oktamera za početnicu pomoću enzima DNA ligaze, čime se početnica produljuje. Slijedi detekcija fluorescencije i određivanje baza (engl. base-calling). Zatim se u koraku regeneracije uklanjaju tri baze s 5’-kraja ligiranog oktamera (uključujući fluorescentnu skupinu) što priprema produljenu početnicu za sljedeći ciklus ligacije. Ovaj se postupak ponavlja dok se ne postigne određena duljina očitanja. Nakon toga se produljena hibridizirana sekvencija denaturira, a postupak ponavlja s novim oktamerima (engl. primer reset) (Choudhuri, 2014.).
Sekvenceri treće generacije
Za otklanjanje navedenih problema znanstvenici su razvili novu tehnologiju sekvenciranja, tzv. tehnologiju sekvenciranja treće generacije (engl. third generation sequencing, TGS). Odlike treće generacije jesu niski troškovi sekvenciranja, jednostavna priprema uzoraka bez potrebe za PCR amplifikacijom i veća brzina izvođenja postupaka od SGS tehnologija.
Osim toga, TGS mogu proizvesti duga očitanja (engl. long-read sequencing) koja premašuju nekoliko kilobaza u svrhu rješavanja problema sklapanja i ponavljajućih područja prisutnih kod kompleksnih genoma (Kchouk i sur., 2017).
PacBio
Početkom 2011. godine američka biotehnološka tvrtka Pacific Biosciences (PacBio) komercijalizirala je PacBio RS tehnologiju koja primjenjuje tehniku sekvenciranja pojedinih molekula u stvarnom vremenu (engl. single-molecule real-time sequencing, SMRT) (van Dijk i sur., 2018). Tehnologija se koristi pristupom sekvenciranja sintezom. Počeci SMRT-a pojavljuju se sredinom 90-tih godina dvadesetog stoljeća kad fizičar S. Turner i biokemičar J. Korlach sa Sveučilišta Cornell hipotetiziraju o metodi promatrajući ugradnju fluorescentnih nukleotida u stvarnom vremenu u rastuće lance DNA djelovanjem polimeraze kao alternativnom načinu brzog sekvenciranja (Ozsolak, 2012.).
U odnosu na SGS PacBio tehnologija ima nekoliko prednosti. Priprema uzorka vrlo je brza, potrebno je 4 – 6 sati umjesto više dana. Osim toga, duljine dugih očitanja iznose ~ 10 kbp pojedinačna vrlo duga očitanja mogu iznositi i do 60 kbp, što je više nego u bilo kojoj SGS tehnologiji. No PacBio tehnologija za sekvenciranje ima visoku stopu pogreške koja iznosi oko 13 %, pri čemu prevladavaju greške insercije (umetanja) i delecije (brisanja) koje su nasumično raspoređene duž dugog očitanja (Kchouk i sur., 2017.).
SMRT se razlikuje od ostalih tehnologija na dva načina: (1) umjesto samih nukleotidnih baza obilježava se samo njihov fosfatni kraj (različito za sve četiri baze), (2) reakcija se odvija u nanofotonskim komorama za vizualizaciju, tzv. valovodovima s nultim načinom rada (engl. zero-mode waveguides, ZMW) (Verma i sur., 2017.).
Instrument upotrebljava specijalizirane protočne članke s više tisuća pojedinačnih pikolitarskih bazena s prozirnim dnom – spomenute valovode s nultim načinom rada (ZMW), dok SBS tehnologije kratkih očitanja vežu DNA i time omogućuju kretanje polimeraze duž DNA predloška, PacBio pričvršćuje polimerazu za dno bazena i omogućuje elongaciju DNA predloška unutar ZMW-a. Zahvaljujući stacioniranom enzimu sustav se može usredotočiti na jednu molekulu. Ugrađivanje deoksinukleotid-trifosfata (dNTP) na svaki jednomolekularni predložak po bazenu kontinuirano se vizualizira pomoću sustava lasera i kamere koji određuju boju i duljinu trajanja emitirane svjetlosti u vrijeme kad obilježeni nukleotid na trenutak zastaje tijekom ugradnje na dnu ZMW-a. Prilikom ugradnje polimeraza cijepa fluorofor vezan za dNTP dopuštajući mu difuziju dalje od područja senzora prije ugradnje sljedećeg obilježenog dNTP. SMRT tehnologija koristi i jedinstveni kružni predložak koji omogućuje sekvenciranje svakog predloška u više navrata jer polimeraza uzastopno prolazi kružnom molekulom (slika 4.) (Goodwin i sur., 2016.).
HeliScope
Potraga za izravnim sekvenciranjem pojedinačnih lanaca DNA desetljećima je bila izazov. Sve tradicionalne tehnologije nove generacije sekvenciranja zahtijevaju višestruko umnožavanje uzoraka DNA kako bi se dobile brojne kopije izvornih molekula koje se tek tada mogu detektirati i sekvencirati. Stoga bi eliminiranje koraka umnožavanja reduciralo troškove i složenost pripreme uzorka te osiguralo izbjegavanje pogrešaka i otklona (odstupanja od rezultata) svojstvenih procesu amplifikacije i analizi dobivenih rezultata, proizvodeći pritom podatke koji bliže odražavaju stvarnu biologiju proučavanih uzoraka.
HeliScope™ Single Molecule sekvencer jest komercijalizirana tehnologija proizvedena od strane tvrtke Helicos BioSciences koja primjenjuje tehnologiju jednomolekularnog sekvenciranja u stvarnom vremenu (engl. true single-molecule sequencing, tSMS). Navedena tehnologija upotrebljava pristup sekvenciranja sintezom, a istodobno može sekvencirati milijarde pojedinačnih molekula DNA. Osmišljena je za obradu i isporuku jedinstvenih podataka o sekvenciji kao i izravnu analizu nativnih uzoraka DNA (Kahvejian i Kellett, 2008.). Helicos BioSciences tSMS tehnologija pruža jedinstveni pogled na biologiju genoma putem izravnog sekvenciranja staničnih nukleinskih kiselina na nepristran način, osiguravajući točnu kvantifikaciju i informaciju o sekvenciji.
Priprema uzorka pritom ne zahtijeva ligaciju ili PCR amplifikaciju izbjegavajući tako otklone zbog gvanin-citozin sadržaja (engl. GC-content; guanine-cytosine content) i količine, a koji su primjećeni u drugim tehnologijama (Thompson i Steinmann, 2010.).
U tSMS tehnologiji uzorci DNA su fragmentirani i uhvaćeni za specijaliziranu površinu unutar protočnog članka gdje potom služe kao jednomolekularni predlošci za reakcije sekvenciranja sintezom. Fluorescentno obilježeni nukleotidi dodaju se jedan po jedan, a sekvencer bilježi svaku pojedinu ugradnju kako bi odredio sekvenciju pojedinačnih DNA lanaca (Kahvejian i Kellett, 2008.).
Glavni koraci Helicos BioSciences tSMS tehnologije su:
- (1) priprema uzorka – fragmentiranje i denaturacija dsDNA u ssDNA te obilježavanje 3’-kraja poli (A) repom i terminalnim fluorescentnim adenozinom te hibridizacija za površinu protočnog članka pomoću poli (T) oligonukleotidnih početnica koje služe i za pokretanje reakcije sekvenciranja
- (2) detektiranje DNA predložaka – snimanje uhvaćenih predložaka radi utvrđivanja njihove lokacije te uklanjanje fluorescentnih biljega
- (3) sekvenciranje sintezom – dodavanje fluorescentno obilježenih nukleotida (C, G, T, ili A) – jedne baze po ciklusu i ugradnja u komplementarni lanac (ovisno o predlošku); ispiranje neugrađenih nukleotida te iluminacija i snimanje lanaca radi određivanja ugrađenih baza i sekvence DNA; ispiranje fluorescentnih biljega i dodavanje sljedeće baze za nastavak ciklusa (slika 5.).
U svakom koraku procesa sekvenciranja sintezom HeliScope sekvencer bilježi ugradnju fluorescentno obilježenih nukleotida u rastuće lance DNA.
Instrument maksimizira učinkovitost obrađujući u isto vrijeme dva 25-kanalna protočna članka, izvodeći sintezu lanaca u jednom uz istodobno snimanje u drugom protočnom članku. Kako bi navedeni proces bio ostvariv, razvijen je niz tehničkih i tvorničkih poboljšanja platforme. Primjena kvalitetnih reagensa – visokokvalitetne DNA polimeraze u kombinaciji s Virtual Terminator™ fluorescentno obilježenim nukleotidima omogućuje brzu i preciznu sintezu komplementarnog lanca (engl. base-by-base synthesis).
Razvijen je i reagens kojim je povećan intenzitet emisije i dokazivanja fluorofora, pojačan signalni šum te smanjeno fotobijeljenje i „treptanje“ fluorofora.
Zajedno, navedeni specijalizirani reagensi osiguravaju točan i precizan kemijski postupak jednomolekularnog sekvenciranja. Budući da sekvencer može dokazati prisutnost pojedinačnih fluorofora, iznimno je važno smanjiti sve nespecifične izvore emisije jer bi mogli proizvesti pogreške u sekvenciji. Pravilan odabir reagensa i površinskih materijala u kombinaciji s pažljivim rukovanjem protočnim člancima tijekom proizvodnje i skladištenja uz primjenu optimiziranih protokola površinskog ispiranja omogućit će dobivanje optimalnih rezultata, gotovo slobodnih od lažnih ugradnja (Kahvejian i Kellett, 2008.).
Sekvenceri četvrte generacije
Tehnologije temeljene na primjeni nanopora proizašle su iz Coulter-ovog brojača (Coulter, 1953) i ionskih kanala (Cornell i sur., 1997). Uz primjenu vanjskog napona, kroz pore nanometarskih dimenzija prolaze čestice nešto manje od samih pora koje su ugrađene u biološku membranu ili su formirane u čvrstom filmu. Membrane ili filmovi razdvajaju spremnike ispunjene elektrolitima na cis i trans odjeljke. U svaki je odjeljak uronjena elektroda. Pod određenim naponom ioni elektrolita iz otopine prolaze kroz pore djelovanjem električnog polja (elektroforezom) generirajući pritom signal ionske struje. Kad su pore blokirane od strane analita, kao što je negativno nabijena molekula DNA dodana u cis komoru, prolaz iona bit će zaustavljen i signal prekinut. Fizička i kemijska svojstva ciljnih molekula mogu se izračunati statističkom analizom amplitude i duljine trajanja prekida signala kao posljedice izmjena mjesta (slika 6.) (Feng i sur., 2015.).
Tehnologije za uporabu nanopora mogu se široko podijeliti na dvije kategorije: biološke i čvrste. Postoji velik broj dostupnih nanopora iz obiju kategorija koje se mogu rabiti u postupku DNA sekvenciranja.
Biološke nanopore ili transmembranski proteinski kanali obično se ugrađuju u supstrat kao što je dvoslojna lipidna membrana, liposomi ili drugi polimerni filmovi. Prednosti bioloških nanopora jesu dobro definirana i lako reproducibilna veličina i struktura. Što je još važnije, lako se mogu modificiratimode rnim tehnikama molekularne biologije poputmutiranja nukleotidne sekvencije da bi se promijenili aminokiselinski ostaci na određenom mjestu. Pokazale su vrlo dobre eksperimentalne rezultate u sekvenciranju ssDNA.
Čvrste nanopore imaju velik broj prednosti u odnosu na biološke, poput kemijske, termičke i mehaničke stabilnosti te prilagodljivosti veličine i integracije (ugradnje). Osim toga ispravno funkcioniraju u različitim eksperimentalnim uvjetima i mogu biti proizvedene u velikom broju primjenom jednostavnih poluvodičkih procesa. Posljednjih su godina primijenjene kao nova metoda u različitim područjima uključujući sekvenciranje DNA, dokazivanje proteina, postupak translokacije molekula i dijagnostiku bolesti (Feng i sur., 2015.).
Oxford Nanopore
Tvrtku Oxford Nanopore Technologies (ONT) osnovali su 2005. godine H. Bayley i G. Sanghera. Tvrtka razvija sustave sekvenciranja DNA koji se temelje na primjeni nanopora za komercijalnu upotrebu (Feng i sur., 2015.).
Uređaj Oxford Nanopore Technologies MinION TM je prvi ONT-ov komercijalizirani sekvencer s tehnologijom temeljenom na primjeni bioloških nanopora.
Najmanji je trenutačno dostupan sekvencer, dimenzija 10 × 3 × 2 cm i težine samo 90 g. Može se priključiti izravno u standardni USB3 ulaz na računalo s malim potrebama hardvera i jednostavnom konfiguracijom. Za sekvenciranje je potrebno računalo s operativnim sustavom Windows 7 ili 8, solid-state pogonom (SSD), više od 8 GB RAM-a i više od 128 GBpros tora na tvrdom disku (iako se preporučuje 1 TB).
Nužan je i specijalni softver pod nazivom MinKNOW koji obavlja nekoliko temeljnih zadataka – prikuplja i analizira podatke u pravom vremenu, daje povratne informacije, uz protok podataka omogućuje i kontrolu rada uređaja (odabir različitih postavki) te identifikaciju i praćenje uzoraka čime se osigurava pravilno odvijanje kemijskih procesa platforme i precizna obrada uzoraka (Lu i sur., 2016).
Prosječna duljina očitanja pomoću MinION-a iznosi približno 5,4 do 10 kb, što je znatno više od prosječne duljine očitanja drugih tehnologija sekvenci-rnja DNA koje se kreću u stotinama baznih parova.
No u određenim genomskim istraživanjima stopa pogrešaka bila je veća od 90 %. Iako je MinION još uvijek daleko od širokog raspona upotrebe, dobiveni rezultati vrlo su ohrabrujući za budućnost tehnologija sekvenciranja temeljenih na nanoporama (Feng i sur., 2015.). Protočni članci MinION imaju 2048 jažica (s umetnutim nanoporana) – četiri za svaki od 512 kanala. Na početku rada jažice u svakom kanalu testiraju se postupkom pod nazivom Mux te se tijekom ovog procesa rangiraju prema aktivnosti. Prilikom sekvenciranja svaki kanal daje podatke obrađujući jednu po jednu jažicu pri čemu broj očitanja između pojedinih kanala varira jer su kod nekih nanopore aktivnije (Lu i sur., 2016.).
Slično SGS tehnologiji, priprema knjižnice nužna je za različite aplikacije MinION-a. Potrebno je rabiti dugu molekulu dsDNA radi mogućnosti sekvenciranja obaju lanaca. Postupak pripreme knjižnice sastoji se od sljedećih koraka: (1) fragmentiranje genomske DNA primjenom Covaris g-TUBE, (2) alternativni PreCR korak za popravak oštećene DNA, (3) popravak krajeva na odsječcima DNA i PCR fragmentima radi formiranja tupih, (4) dodavanje A-nukleotidne baze na 3’-kraj fragmenta (engl. dA-tailing), (5) ligacija adaptora te (6) His-bead-pročišćivanje radi uklanjanja nukleotida i enzima.
Knjižnica obično sadržava dva adaptora – vodeći (Y) i adaptor u obliku ukosnice (HP), svaki vezan za jedan kraj dsDNA. Sekvenciranje započinje na 5’-kraju jednolančanog Y-adaptora, slijedi vodeći lanac DNA (predložak), zatim HP-adaptor, a završava s komplementarnim lancem DNA. Kad se približi prekretnici komplementarne regije Y-adaptora, motorni protein započinje razdvajati lance dsDNA. U tom se trenutku prvi lanac (predložak) prenosi u nanoporu brzinom određenom motornim proteinom. Jednom kad je dostignut HP-adaptor, drugi protein, tzv. Beta-ukosnica (engl. hairpin protein, HP-protein) na sličan način omogućuje prolazak komplementarnog lanca DNA kroz nanoporu nakon čega je moguće odrediti baze očitanih uređajem za sekvenciranje. Upotrebom informacija dobivenih sekvenciranjem jednog lanca očitanje će biti jednodimenzionalno (1D), dok će dvodimenzionalno (2D) nastati iz informacija o sekvenciji obaju lanaca što na kraju rezultira većom kvalitetom dobivenog rezultata (Lu i sur., 2016.).
Solid-state nanopore
Čvrste nanopore (engl. solid-state nanopores) pojavile su se kao svestrana varijanta ili opcija biološkim nanoporama zbog svojih jedinstvenih svojstava, uključujući dobro osmišljenu geometriju i dimenzije, mehaničku robusnost, jednostavnost mijenjanja i kompatibilnost s različitim elektroničkim ili optičkim tehnikama mjerenja. Promjer im može biti precizno kontroliran u rasponu veličina manjih od nanometra do više stotina nanometara s obzirom na eksperimentalne zahtjeve. Općenito u dielektričnim materijalima kao što je SiN pokazuju vrhunsku kemijsku i toplinsku stabilnost u odnosu na lipidne membrane.
No stabilnost čvrstih nanopora ovisi o uvjetima koji su rabljeni za njihovo formiranje. Kod nanopora na bazi grafena kemijska i toplinska stabilnost nisu dokazane, međutim zbog jedinstvenih električnih svojstava imaju veliku prednost nad biološkim nanoporama. Posljednjih je godina primjena čvrstih nanopora otvorila vrata širokom rasponu mogućih primjena u sekvenciranju DNA, praćenju međudjelovanja proteina, kontroliranju molekularnog transporta te izradi nanofluidnih uređaja. Do danas su razvijene različite vrste tehnologija proizvodnje čvrstih nanopora poput anodne oksidacije aluminija, oblikovanja nanopora ionskim zrakama i elektronskim zrakama u tankim sintetičkim membranama itd. (Haque i sur., 2013).
Unatoč velikom broju prednosti u odnosu na biološke nanopore, elektronički sustav otkrivanja čvrstih nanopora ne postiže razlučivost pojedinih baza DNA molekule, prije svega zbog prevelike debljine membrane (10 – 20 nm) što omogućuje istodobnu prisutnost 30 – 50 baza unutar jedne nanopore te zbog velike brzine kojom molekula DNA prolazi kroz poru pod utjecajem električnog polja (Ansorge i sur., 2017.). Začepljenje pora potaknuto ili prouzročeno nespecifičnom adsorpcijom biomolekula tijekom odvijanja eksperimenata također je jedan od nedostataka koji mora biti riješen. Nova otkrića i razvoj tehnologije čvrstih nanopora u bliskoj budućnosti pridonijet će komercijalnoj upotrebi ove tehnologije kao preciznom, brzom i pouzdanom biomolekularnom senzoru (Lee i sur., 2018.).
Zaključak
Literatura [… prikaži]
Vezano (NGS, sekvenciranje):
- Učinkovitost sljedeće generacije sekvenciranja u dijagnostici bakterijskih zoonoza
- Hrvatski veterinarski institut otvorio novu jedinicu za molekularnu dijagnostiku i istraživanje virusnih infekcija
- Nova generacija sekvenciranja u veterinarskoj medicini – pregled II. dio
- Nova generacija sekvenciranja u veterinarskoj medicini – pregled I. dio
- Zoonotski potencijal rotavirusa