Paaiškino, kodėl „Google“ rodomi lietuviški COVID-19 duomenys taip skiriasi nuo skelbiamų Lietuvoje

Savaitės pradžioje Statistikos departamento prižiūrimas Valstybės duomenų analitikos projektas savo „Facebook“ paskyroje paskelbė pranešimą, kuriame atkreipiamas dėmesys, kad šių metų birželio 27-ąją „Google“ paskelbta Lietuvos COVID-19 statistika atrodo itin nekaip – beveik 100 tūkst. atvejų per Joninių šeštadienį. Vis dėlto, anot Statistikos departamento, neverta pergyventi, nes tai – duomenų artefaktas.

 Birželio 28-ąją „Google“ skelbiama Lietuvos COVID-19 statistika atrodo itin nekaip – beveik 100 tūkst. atvejų per Joninių šeštadienį.<br> 123rf iliustr.
 Birželio 28-ąją „Google“ skelbiama Lietuvos COVID-19 statistika atrodo itin nekaip – beveik 100 tūkst. atvejų per Joninių šeštadienį.<br> 123rf iliustr.
 Ekspertai mano, kad ši problema pasikartos ir ateityje.<br> Valstybės duomenų analitikos ekrano nuotr.
 Ekspertai mano, kad ši problema pasikartos ir ateityje.<br> Valstybės duomenų analitikos ekrano nuotr.
Daugiau nuotraukų (2)

Lrytas.lt

Jun 28, 2022, 1:56 PM, atnaujinta Jun 28, 2022, 3:03 PM

„Google" duomenis ima iš Johnso Hopkinso universiteto (JHU) švieslenčių, o JHU CSSE duomenų komanda tylomis tuos duomenis „scrapina“ (automatiškai surenka) iš mūsų lietuviškų švieslenčių (nežinodami, kad turime labai patogius atvirų duomenų failus). Kadangi neseniai keitėme švieslenčių struktūrą, jų „scrapinimo“ algoritmai nusimušė“, – rašoma Valstybės duomenų analitikos „Facebook“ paskyroje.

Bet, anot ekpertų, tai tik viena problemos dalis. Kita dalis – skirtingos abiejų pusių naudojamos datos priskyrimo įvykiui metodikos.

„Mes įvykiui priskiriame tą datą, kai tas įvykis įvyko (logiška, ar ne?). Tačiau JHU CSSE komanda įvykiui priskiria tą datą, kada jie apie tą įvykį sužinojo. Kai mes pradėjome skelbti naują rodiklį, įtraukiantį ir pirminius, ir antrinius, ir tretinius užsikrėtimus, JHU CSSE nusprendė naudoti būtent tą rodiklį, tačiau pagal savo metodiką visus istorinius pakartotinius užsikrėtimus (kurių yra beveik 100 tūkst.) priskyrė šeštadieniui“.

Ekspertų teigimu, dar šeštadienį dėl iškilusių nesklandumų pavyko susisiekti su JHU komanda ir surasti sprendimą – buvo nusiųstas sutvarkytas visų istorinių įvykių (užsikrėtimų, mirčių) archyvas, kurio pagrindu duomenys turi būti atnujinti. Deja, ekspertai mano, kad ši problema pasikartos ir ateityje.

„Toks yra jų pasirinkto datos priskyrimo įvykiui metodo trūkumas: visi duomenų papildymai „atgaline data“ priskiriami papildymo datai. Tačiau dabar bus daug lengviau viską ištaisyti, nes jau susipažinome“, – rašoma Valstybės duomenų analitikos „Facebook“ paskyroje.

UAB „Lrytas“,
A. Goštauto g. 12A, LT-01108, Vilnius.

Įm. kodas: 300781534
Įregistruota LR įmonių registre, registro tvarkytojas:
Valstybės įmonė Registrų centras

lrytas.lt redakcija news@lrytas.lt
Pranešimai apie techninius nesklandumus pagalba@lrytas.lt

Atsisiųskite mobiliąją lrytas.lt programėlę

Apple App Store Google Play Store

Sekite mus:

Visos teisės saugomos. © 2024 UAB „Lrytas“. Kopijuoti, dauginti, platinti galima tik gavus raštišką UAB „Lrytas“ sutikimą.
„Lietuva tiesiogiai“: Irano ataka – kaip atsakys Izraelis?