Încă de la începutul secolului XX, oamenii de știință și fizicienii au fost împovărați să explice cum și de ce Universul pare să se extindă într-un ritm accelerat. Pe lângă faptul că este responsabil pentru accelerarea cosmică, această energie include, de asemenea, 68,3% din masa ne vizibilă a universului.
La fel ca materia întunecată, existența acestei forțe invizibile se bazează pe fenomene observabile și pentru că se întâmplă să se potrivească cu modelele noastre actuale de cosmologie și nu cu dovezi directe. În schimb, oamenii de știință trebuie să se bazeze pe observații indirecte, urmărind cât de repede obiectele cosmice (în special supernovele de tip Ia) se retrag de la noi pe măsură ce universul se extinde.
Acest proces ar fi extrem de obositor pentru oamenii de știință - precum cei care lucrează pentru Dark Energy Survey (DES) - dacă nu ar fi fost pentru noii algoritmi dezvoltați în colaborare de cercetătorii de la Lawrence Berkeley National Laboratory și UC Berkeley.
"Algoritmul nostru poate clasifica detectarea unui candidat la supernova în aproximativ 0,01 secunde, în timp ce un scaner uman experimentat poate dura câteva secunde", a spus Danny Goldstein, un student absolvent al UC Berkeley, care a dezvoltat codul pentru a automatiza procesul de descoperire a supernovei pe imaginile DES .
În prezent, în cel de-al doilea sezon, DES face imagini nocturne cu Southern Sky cu DECam - o cameră de 570 de megapixeli care este montată pe telescopul Victor M. Blanco de la Cerro Tololo Interamerican Observatory (CTIO) din Anii Chile. În fiecare seară, aparatul foto generează între 100 Gigabytes (GB) și 1 Terabyte (TB) de date imagistice, care este trimis Centrului Național pentru Aplicații de Supercomputing (NCSA) și Fermilab DOE din Illinois pentru prelucrare inițială și arhivare.
Programe de recunoaștere a obiectelor dezvoltate la Centrul Național de Calcul Științific pentru Cercetări Energetice (NERSC) și implementate la NCSA, apoi pieptene prin imagini în căutarea posibilelor detectări ale supernovelor de tip Ia. Aceste explozii puternice apar în sistemele de stele binare în care o stea este o pitică albă, care accelerează materialul de la o stea însoțitoare până când ajunge la o masă critică și explodează într-o supernova de tip Ia.
„Aceste explozii sunt remarcabile, deoarece pot fi folosite ca indicatori de distanță cosmică cu o precizie de 3-10%”, spune Goldstein.
Distanța este importantă, deoarece un obiect este mai îndepărtat în spațiu, cu atât este mai departe în timp. Urmărind supernovele de tip Ia la distanțe diferite, cercetătorii pot măsura expansiunea cosmică de-a lungul istoriei universului. Acest lucru le permite să pună restricții cu privire la cât de rapid se extinde universul și poate chiar să ofere și alte indicii despre natura energiei întunecate.
„Științific, este un moment cu adevărat interesant, deoarece mai multe grupuri din întreaga lume încearcă să măsoare cu exactitate supernovele de tip Ia pentru a constrânge și înțelege energia întunecată care conduce la extinderea accelerată a universului”, spune Goldstein, care este și student. cercetător în Centrul de Cosmologie Computațională Berkeley Lab (C3).
DES își începe căutarea pentru explozii de tip Ia descoperind schimbări în cerul nopții, de unde vine conducta de scădere a imaginii dezvoltată și implementată de cercetătorii din grupul de lucru al supernovei. Conducta scade imagini care conțin obiecte cosmice cunoscute din imagini noi care sunt expuse noaptea la CTIO.
În fiecare noapte, conducta produce între 10.000 și câteva sute de mii de detectări de candidați la supernove care trebuie validate.
„Din punct de vedere istoric, astronomii pregătiți s-ar așeza la computer ore întregi, s-ar uita la aceste puncte și ar oferi opinii despre dacă au caracteristicile unei supernove sau dacă au fost cauzate de efecte spuroase care se maschează ca supernove în date. Acest proces pare simplu, până când îți dai seama că numărul de candidați care trebuie clasificați în fiecare seară este prohibitiv de mare și doar unul din câteva sute este o adevărată supernovă de orice tip ”, spune Goldstein. „Acest proces este extrem de obositor și consumă foarte mult timp. De asemenea, aceasta exercită o presiune mare asupra grupului de lucru al supernovei pentru a procesa și scana rapid datele, ceea ce este o muncă grea. "
Pentru a simplifica sarcina de a verifica candidații, Goldstein a dezvoltat un cod care utilizează tehnica de învățare automată „Random Forest” pentru a detecta în mod automat și în timp real detectarea candidaților la supernove pentru a-i optimiza pentru DES. Tehnica folosește un ansamblu de arbori de decizie pentru a pune automat tipurile de întrebări pe care astronomii le-ar lua în mod obișnuit la clasificarea candidaților la supernove.
La sfârșitul procesului, fiecărei detectări a unui candidat i se acordă un scor bazat pe fracția de arbori de decizie care considera că are caracteristicile unei detectări a unei supernove. Cu cât scorul de clasificare este mai aproape de unul, cu atât candidatul este mai puternic. Goldstein observă că, în testele preliminare, conducta de clasificare a obținut o precizie generală de 96%.
„Când faceți o scădere singură, aveți prea multe„ fals-pozitive ”- artefacte instrumentale sau software care se prezintă ca potențiali candidați la supernove - pentru ca oamenii să poată trece prin gânduri”, spune Rollin Thomas, de la C3 al Berkeley Lab, care a fost colaboratorul lui Goldstein.
El observă că, odată cu clasificatorul, cercetătorii pot strânge rapid și cu exactitate artefactele de la candidații la supernove. „Asta înseamnă că, în loc să aveți 20 de oameni de știință din grupul de lucru al supernovei, care să cernă în permanență mii de candidați în fiecare seară, puteți numi o persoană care să se uite la câteva sute de candidați puternici”, spune Thomas. „Acest lucru accelerează semnificativ fluxul de lucru și ne permite să identificăm supernovele în timp real, ceea ce este crucial pentru efectuarea de observații de urmărire.”
„Folosind aproximativ 60 de nuclee pe un supercomputer, putem clasifica 200.000 de detectări în aproximativ 20 de minute, inclusiv timp pentru interacțiunea bazei de date și extragerea funcțiilor.” spune Goldstein.
Goldstein și Thomas remarcă faptul că următorul pas în această lucrare este să adăugați la conductă un al doilea nivel de învățare mașină pentru a îmbunătăți precizia clasificării. Acest nivel suplimentar ar ține cont de modul în care obiectul a fost clasificat în observațiile anterioare, deoarece determină probabilitatea ca candidatul să fie „real”. Cercetătorii și colegii lor lucrează în prezent la diferite abordări pentru a atinge această capacitate.