Novo istraživanje Social Network Analysis and Mining otkriva da internet pretrage mogu tačno da predvide regionalni porast i pad infekcije covid 19. Naime, određene vrste Google pretraga otkrivaju aktivnosti kojima ljudi planiraju da se bave. Ukupan obim internet pretrage tih aktivnosti koje se odvijaju van doma, u odnosu na one koje podrazumevaju boravak kod kuće, predviđa broj novih covid 19 dijagnoza, i to već za 10 do 14 dana kasnije, nakon „guglanja“.
Studija istraživača sa New York University’s Courant Institute of Mathematical Sciences analizom internet pretraga opisuje moguće načine za uočavanje budućih infekcija, pre nego što se one uopšte dogode. Naučnici su otkrili korelaciju između naleta pretraživanja koji se odnose na aktivnosti van kuće – aktivnosti koje bi mogle dovesti ljude u rizik od zaražavanja infekcijom SARS-CoV-2 – i porasta broja covid 19 slučajeva za dve nedelje nakon pretrage. Uočeno je, na primer, da broj infekcija pada kada dolazi do povećanja broja pretraga u vezi sa aktivnostima koje se odvijaju kod kuće.
Autor studije Anasse Bari, docent na Institutu Courant, primećuje da su stručnjaci već uspešno koristili pretragu podataka u oblasti finansija i ulaganja, poput proučavanja satelitskih snimaka automobila na parkiralištima kako bi se predvidela zarada preduzeća.
– Naše istraživanje pokazuje da bi se iste tehnike mogle primeniti u borbi protiv pandemije, uočavanjem gde će verovatno doći do izbijanja epidemije, pre nego što se zaista desi – objašnjava autorka Megan Coffee sa Odeljenja za infektivne bolesti i imunologiju na New York University Grossman School of Medicine. Preciznije identifikovanje ponašanja ljudi koje proizvodi skokove u broju inficiranih može da pomogne epidemiolozima i kreatorima zdravstvene politike da efikasnije oblikuju javnu politiku u vezi sa „zatvaranjem“ stanovništva. Sistem opisan u ovoj studiji izbegava pitanja privatnosti tako što uključuje samo velike klastere anonimnih podataka.
Prvi korak istraživača bio je razvijanje kategorija na osnovu fraza u pretrazi ili ključnih reči, koje su zatim mogli da prate. Dve ključne kategorije koje su pratili nazvali su indeks mobilnosti i indeks izolacije. U „indeks mobilnosti“ naučnici su, na primer, svrstali određene pretrage kao što su „pozorište u blizini“, „avionske karte“, „radno vreme“ i druge upite o aktivnostima koje podrazumevaju da će neko napustiti kuću i fizički biti u blizini drugih. Kako kaže Anasse Bari, „kada neko pretražuje vreme zatvaranja lokalnog kafea ili restorana ili traži uputstva za lokalnu teretanu, on na taj način daje uvid u buduće rizike koje može da imati.“ Za trag „indeksa izolacije“, istraživači su prikupili upite za pretragu kao što su „joga kod kuće“, „TV program“ ili „dostava hrane“… koji su ukazivali na nameru ljudi da ostanu kod kuće, izolovani.
Istraživači su svoju kategorizaciju ključnih reči zasnovali na istraživanju Fonda za demokratiju + UCLA Nationscape – studiji u kojoj su ispitanici naveli stvari koje bi radili da su „ukinuta ograničenja“. Analiza je pokazala da su tri glavne aktivnosti koje su ljudi propustili, a kojih su se najviše uželeli, bili „odlazak na stadion/koncert“, „odlazak u bioskop“ i „prisustvo sportskom događaju“. Naučnici smatraju da je ovo otkriće prvi korak ka izgradnji alata koji može da pomogne u predviđanju skokova slučaja obolelih od covid 19 praćenjem podataka o aktivnostima za koje postoji interesovanje ljudi, a koje donose veći rizik zaražavanja.
Istraživači su prikupili podatke o pretrazi od marta do juna 2020. godine, iz svih 50 država Sjedinjenih Američkih Država. Koristili su Google Trends za praćenje trendova u pretrazi podataka, što im je omogućilo da razvijaju indekse mobilnosti i izolacije. Takođe je kreiran i „indeks neto kretanja“ kako bi ukazali na vezu između dva indeksa – mobilnosti i izolacije. Autori studije ističu da teoretski očekuju da bi nagli pad neto kretanja (više ljudi koji ostaju kod kuće) odgovarao smanjenju širenja covid 19 zaraze. U 42. od 50 država SAD, na primer, svaki porast neto kretanja tačno je predvideo porast broja inficiranih nakon 10 do 14 dana kasnije. Na primer, praćena je veza između indeksa mobilnosti i stope infekcije nakon relaksiranja, popuštanja zaštitnih mera u pet država: Arizoni, Kaliforniji, Floridi, Njujorku i Teksasu. Kada je ljudima bilo najavljeno da će moći da napuste kuću i bave se nekim drugim aktivnosti, toj najavi je uvek prethodio nagli porast pretraga tipa mobilnosti, nakon čega je ubrzo usledio porast broja prijavljenih infekcija u junu 2020. godine. U slučajevima kada su mere javne zaštite bile pooštrene i uvođene razne blokade, indeks mobilnosti se značajno smanjio, što se blisko odrazilo i na smanjen broja infekcija. Na osnovu ovog istraživanja, naučnici smatraju da će sada biti lakše izgraditi bazu podataka i pretpostavki o promeni ljudskog ponašanja, na osnovu alternativnih podataka tokom života u za vreme pandemije, kako bi računarski programi mogli da predvide ponašanje ljudi u nekim budućim epidemijama.