https://frosthead.com

Kuidas Margaret Dayhoff tõi kaasaegse infotehnoloogia bioloogiasse

1984. aastal käivitas Riiklik Biomeditsiiniliste Uuringute Sihtasutus tasuta veebiandmebaasi, mis sisaldab üle 283 000 valgujärjestuse. Tänapäeval võimaldab valkude teabeallikas kogu maailmas teadlastel võtta tundmatut valku, võrrelda seda tuhandete teadaolevate valkudega andmebaasis ja teha kindlaks, kuidas see on sarnane ja erinev. Nendest andmetest saavad nad kiiresti ja täpselt järeldada valgu evolutsiooniajaloo ja selle seose erinevate eluvormidega.

Selle tohutu veebiandmebaasi alandlik päritolu algab ammu enne Internetti. Kõik sai alguse valgujärjestuse ja -struktuuri atlasest, 1965. aastal trükitud raamatust, mis sisaldas 65 tollal tuntud valgujärjestust, mille koostas naine nimega Margaret Dayhoff. Oma Atlase loomiseks rakendas Dayhoff tipptasemel arvutitehnoloogiaid, et leida lahendusi bioloogilistele küsimustele, aidates käivitada uue valdkonna, mida nüüd kutsume bioinformaatikaks. Algselt keemik, Dayhoff kasutas Teise maailmasõja järgse infotehnoloogia ajastul uusi ja arenevaid tehnoloogiaid pioneeririistadeks, mida keemikud, bioloogid ja astronoomid võiksid kasutada Maal elava elu altide distsiplinaarses uurimisel.

Dayhoff (siis Margaret Oakley) sündis Philadelphias 11. märtsil 1925 keskkooli matemaatikaõpetaja Ruth Clarki ja väikeettevõtte omaniku Kenneth Oakley poolt. Kümneaastaselt kolis tema pere New Yorki. Seal osales ta riigikoolides, saades lõpuks 1942. aastal Bayside Highi koolitajaks. Ta õppis New Yorgi ülikooli Washingtoni Square'i kolledžis stipendiumi, lõpetades matemaatika magna cum laude vaid kolm aastat hiljem, 1945. aastal.

Samal aastal astus Dayhoff Columbia ülikooli, et saada doktorikraad kvantkeemia alal silmapaistva keemiku ja Teise maailmasõja operatsioonide uurija George Kimballi juhendamisel. Tema aktsepteerimine oli selle aja jaoks haruldus. Pärast II maailmasõda asus teadustesse rohkem mehi ja keemia muutus veelgi meeste domineerivamaks kui eelmisel kümnendil: keemia doktorikraadi omandanud doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga doktorikraadiga oli doktorikraadiga doktorikraadi omandanud vaid viis protsenti naistest, kaheksa protsendini.

Dayhoffi ülikooliajal oli Columbia infotehnoloogia levinud. See uhkustas mõnega esimestest USAs asuvatest arvutilaboritest ja sai 1945. aastal astronoomi WJ Eckerti juhitud IBM Watsoni teaduslabori. Watsoni labor oli II maailmasõja lõpukuudel esmakordselt liitlaste arvutikeskus. Pärast sõda sai sellest mõnede esimeste superarvutite, sealhulgas selektiivse järjestuse elektroonilise kalkulaatori (SSEC) väljatöötamise sait, mida Eckert hiljem arvutas Apollo missioonide jaoks Kuu orbiitide arvutamiseks.

Selle tehnoloogiaga käe-jala juures ühendas Dayhoff oma huvi keemia vastu arvutikasutusele perfokaardimasinate abil - sisuliselt varajaste digitaalsete arvutite abil. Masinad võimaldasid Dayhoffil tema arvutusi automatiseerida, salvestades algoritmi ühte kaardikomplekti ja andmeid teise. Masinat kasutades suutis ta arvutusi töödelda palju kiiremini ja täpsemini kui käsitsi.

Dayhoffi eriti huvipakkuv teema oli polütsüklilised orgaanilised ühendid, mis on molekulid, mis koosnevad kolmest või enamast aatomist, mis on tihedalt ühendatud. Ta kasutas perfokaardimasinaid molekulide resonantsenergiate arvutamiseks (molekuli konkreetse oleku potentsiaalse energia ja keskmise oleku erinevus) arvutuste tegemiseks, et määrata molekulaarsete sidemete ja sidemete vahekauguste tõenäosus.

Dayhoff lõpetas kvantkeemia doktorikraadi kõigest kolme aastaga. Teadustöö, mille ta asus õppima kraadiõppurina, avaldati koos Kimballiga kaasautorina 1949. aastal ajakirjas Journal of Chemical Physics lihtsa pealkirjaga Resonantsenergia arvutamine perfokaardiga.

Samuti abiellus Dayhoff 1948. aastal eksperimentaalfüüsika tudengi Edward Dayhoffiga, kellega ta oli Columbias kohtunud. Aastal 1952 kolis paar Washingtoni DC-sse, kus Edward asus ametisse Riiklikus Standardibüroos ja Dayhoff sünnitas oma esimese kahest tütrest Ruthist. Dayhoff lahkus peagi teadustööst, et saada Ruthile ja tema nooremale tütrele Judithile koduseks emaks, välja arvatud kaheaastane järeldoktorikraad Marylandi ülikoolis.

Kui naine naasis teadusuuringute juurde ja hakkas 1962. aastal taotlema toetusi oma töö rahastamiseks, tabas teda šokk. Riiklikud tervishoiuinstituudid lükkasid tagasi toetusetaotluse, milles nimetati Dayhoff peamiseks uurijaks, selgitusega, et “[Dayhoff] on juba mõnda aega olnud tõeliselt intiimsetest suhetest selle keeruka ja kiiresti areneva alaga, ” nagu kirjutab ajaloolane Bruno Strasser ajakirjas tema peatselt ilmuv raamat Collecting Experiments: Making Big Data Biology . Naiste jaoks, kes on laste kasvatamiseks aja maha võtnud, on selline tõus ülesmäge vaid üks viis, kuidas teadusasutused naiste edasiminekut takistasid ja jätkuvalt takistavad.

Hoolimata NIH toetuse puudumisest, jõudis Dayhoff oma karjääri kõige järeldusrikkamale kümnendile. 1960. aastal võttis ta vastu teedrajava biofüüsiku Robert Ledley saatusliku kutse, kellega ta kohtus oma abikaasa kaudu, ühineda temaga Marylandis Silver Springis asuvas Riiklikus Biomeditsiiniliste Uuringute Sihtasutuses. Ledley teadis, et Dayhoffi arvutioskused on fondi eesmärgi jaoks ühendada informaatika, bioloogia ja meditsiin. Ta oli 21 aastat tema abidirektor.

Maryhlandis sai Dayhoff kasutada Georgetowni ülikooli uhiuue IBM 7090 suurarvuti kasutamist. IBM-i süsteem oli mõeldud keerukate rakenduste käsitlemiseks, arvutuskiirusega võrreldes kuus korda kiiremini kui varasemates mudelites. See kiirus saavutati asendades aeglasem, mahukam vaakumtorude tehnoloogia kiiremate ja tõhusamate transistoridega (komponendid, mis toodavad arvutite 1 ja 0). Suurarvutit kasutades hakkasid Dayhoff ja Ledley otsima ja võrdlema peptiidijärjestusi FORTRANi programmidega, mille nad olid ise kirjutanud, püüdes koondada osalised järjestused täielikuks valguks.

IBM 7090 IBM 7090 operaatori konsool NASA Amesi uurimiskeskuses 1961. aastal koos kahe panniga IBM 729 magnetlindiseadmetega. (NASA)

Dayhoffi ja Ledley pühendumus arvutianalüüsi rakendamisel bioloogia ja keemia alal oli ebatavaline. “Statistilise analüüsi kultuur, rääkimata digitaalsest arvutusest, oli enamikule [biokeemikutele] täiesti võõras, ” selgitas Strasser intervjuus Smithsonian.com-le . "Mõni uhkustas isegi sellega, et ei olnud" teoreetikud ", nii mõistsid nad matemaatiliste mudelite abil andmete analüüsi."

Üks teaduslik distsipliin, kus Dayhoffi arvutikasutust hinnati rohkem, oli aga astronoomia. See huvi arvuti vastu oli osaliselt tänu WJ Eckhartile, kes oli 1940. aastal planeedi orbiitide ennustamiseks kasutanud IBM perfokaardimasinaid. Ja 1960ndatel oli ameeriklaste huvi kosmoseuuringute vastu täies hoos, mis tähendas NASA rahastamist. Marylandi ülikoolis kohtus Dayhoff spektroskoobi Ellis Lippincottiga, kes viis ta 1961. aastal kuueaastasesse koostöösse Carl Saganiga Harvardis. Kolm neist töötasid välja aine keemilise meigikoguse termodünaamilised mudelid ja Dayhoff töötas välja arvutiprogrammi, mis võiks arvutada gaaside tasakaalukontsentratsiooni planeedi atmosfääris.

Dayhoffi programmi abil said tema, Lippincott ja Sagan valida analüüsitava elemendi, võimaldades neil uurida paljusid erinevaid atmosfääri koostisi. Lõppkokkuvõttes töötasid nad välja atmosfääri mudelid Veenuse, Jupiteri, Marsi ja isegi Maa ürgse atmosfääri jaoks.

Taeva uurides võttis Dayhoff üles ka küsimuse, mida teadlased olid uurinud vähemalt alates 1950. aastatest: mis on valkude funktsioon? Valkude sekveneerimine oli vastuse saamise vahend, kuid üksikute valkude sekveneerimine oli väga ebaefektiivne. Dayhoff ja Ledley suhtusid erinevalt. Valkude eraldatud analüüsimise asemel võrdlesid nad erinevatest taime- ja loomaliikidest saadud valke. "Kui võrrelda erinevates liikides sama valgu järjestusi, võiks jälgida, millised järjestuse osad olid kõigil liikidel alati ühesugused, mis on hea märk sellest, et selle järjestuse osa oli valgu hüvanguks ülioluline, " räägib Strasser.

Dayhoff sondeeris sügavamalt, uurides valkude ühist ajalugu. Ta analüüsis mitte ainult nende osade osas, mis olid kõigil liikidel ühesugused, vaid ka nende variatsioone. "Nad võtsid neid erinevusi liikide vahelise evolutsioonilise vahemaa mõõtmiseks, mis võimaldas neil fülogeneetilisi puid rekonstrueerida, " selgitab Strasser.

Dayhoff, kes on alati valmis kasutama uut tehnoloogiat, töötas välja valgujärjestuste määramiseks arvutipõhised meetodid. Ta viis läbi väga paljude liikide valkude arvutianalüüsi, alates seenest kandist kuni vaalani. Siis kasutas ta nende erinevusi oma esivanemate suhete kindlaksmääramiseks. 1966. aastal lõi Dayhoff Richard Ecki abiga fülogeneetilise puu esimese rekonstrueerimise.

Ameerika 1969. aasta teaduslikus artiklis “Valgu evolutsiooni arvutianalüüs” tutvustas Dayhoff avalikkusele ühte neist puudest koos oma uurimistööga, milles kasutati valkude sekveneerimiseks arvuteid. "Iga loodud valgujärjestus, iga valgustatud evolutsioonimehhanism, iga avalikustatud fülogeneetilise ajaloo oluline uuendus parandab meie arusaamist elu ajaloost, " kirjutas ta. Ta üritas näidata bioteaduste kogukonnale arvutipõhiste mudelite potentsiaali.

Tema järgmine eesmärk oli koguda kõik teadaolevad valgud ühte kohta, kust uurijad saaksid järjestusi leida ja neid teistega võrrelda. Erinevalt tänapäevast, kui lihtsalt märksõnaga elektroonilises andmebaasis on allikaid üles kutsuda, pidi Dayhoff otsitavate valkude leidmiseks füüsilisi ajakirju üles otsima. Paljudel juhtudel tähendas see kaasteadlase töö vigade kontrollimist. Jadade kogumine ja kataloogimine nõudis isegi arvuti abil palju aega ja tähelepanelikku teadussilma.

Kõik ei näinud oma tegevuses väärtust. Teistele uurijatele sarnanes Dayhoffi töö pigem 19. sajandi loodusloo kogumise ja kataloogimisega kui 20. sajandi teadlase eksperimentaalse tööga. “Looduslike asjade kogumine, võrdlemine ja klassifitseerimine tundus 20. sajandi teisel poolel paljudele eksperimentaalbioloogidele vanamoodne, ” räägib Stasser. Ta nimetab Dayhoffi kui „autsaiderit“. „Ta andis oma panuse valdkonda, mida ei eksisteerinud ja millel polnud seega ametialast tunnustust, “ ütleb ta.

1965. aastal avaldas Dayhoff esmakordselt oma andmebaasi trükitud versioonis valgujärjestuse ja struktuuri atlasis 65 teadaolevat valku. Lõpuks viidi andmed magnetilindile ja nüüd elab Internetis, kus teadlased kasutavad tema andmeid tuhandete valkude leidmiseks. Teiste biomeditsiiniliste andmebaasidega on ühinenud, sealhulgas Protein Data Bank, valkude ja nukleiinhapete ühiskogum, mis käivitati 1971. aastal, ja GenBank, 1982. aastal käivitatud geenijärjestuste andmebaas. Dayhoff alustas teaduslikku revolutsiooni.

"Täna sisaldab iga eksperimentaalbioloogia väljaanne uute eksperimentaalsete andmete kombinatsiooni ja järeldusi, mis on saadud võrdluste teel muude avalikus andmebaasis kättesaadavate andmetega - lähenemisviisiga, mida Dayhoff alustas pool sajandit tagasi, " räägib Strasser.

Bioinformaatika kasvades langesid kogumise ja arvutamise ülesanded suuresti naistele. Dayhoffi kaastöötajad atlases olid kõik naised, välja arvatud Ledley. Nagu NASA 1960. aastate naiste “arvutid” ja II maailmasõja naissoost kaitselülitajad, lükati need naised peagi teadusliku praktika piiridesse. Viidates esimesele digitaalsele, üldotstarbelisele arvutile programmeerinud “ENIAC tüdrukutele”, kirjutab arvutusteadlase ajaloolane Jennifer Light, et “naised tegid enneolematu töö just täpselt selliste madala staatusega ametialaste klassifikaatorite piirides”.

Tema juures Atlase kallal töötanud Lois T. Hunt kirjutas oma Dayhoffi eluloolises visandis, et Dayhoff uskus, et tema uurimine Maa ürgse atmosfääri kohta võib anda talle “elu moodustamiseks vajalikud ühendid”. Seda võib-olla isegi rohkem kui infotehnoloogia, seob Dayhoffi teadusuuringute lahutamatuid osi omavahel. Alates pisikesest valgust kuni tohutu atmosfäärini otsis Dayhoff sellel planeedil elu tekkimise saladusi. Ehkki ta ei lukustanud neid kõiki, andis ta tänapäevasele teadusele tööriistad ja meetodid otsingu jätkamiseks.

Kuidas Margaret Dayhoff tõi kaasaegse infotehnoloogia bioloogiasse