title | subtitle | author | lang | theme | colorscheme | fonttheme | hash | ||
---|---|---|---|---|---|---|---|---|---|
Zaraźliwość koronawirusa |
Analiza rozprzestrzeniania się koronawirusa w początkowym okresie pandemii |
|
pl |
solarized |
orchid |
professionalfonts |
true |
::: notes
- Inżynieria i analiza danych
- Robione w ramach nowo założonego koła (Hackathon) :::
Znalezienie reguł kierujących rozwojem pandemii
::: notes
- Znalezienie:
- reguł asocjacyjnych
- ciekawych zależności
- Lepsze zrozumienie rozprzestrzeniania się wirusa
- Przewidywanie liczby zachorowań :::
Do głównych źródeł danych zaliczyć możemy:
- IHME
- koronawirusunas.pl
- policja.pl
::: notes
- Znaleźliśmy dane udostępniane przez pasjonatów
- Sprawdzenie korelacji między interwencjami policji, a mobilnością
- Było <500 zachorowań/dzień
- Marzec-Maj 2020
- Brak codziennych aktualizacji
- Dane z healthdata.org
- publikowane były jako raporty z danymi :::
Dwa główne problemy:
- Na stronie ministerstwa publikowane były wyłącznie dane z danego dnia.
- Publicznie dostępne dane dotyczące wielu krajów nie zawierały podziału na województwa.
::: notes
- Dane jedynie za dzień poprzedni
- Brak granularności w danych (jedynie per kraj) :::
::: notes
- Kiepskie
- Dostępne jedynie za poprzedni dzień
- Niereguralnie publikowane :::
::: notes
- Python jako język główny
- Głównie web scraping (BS4)
- istnienie innych frameworków, np. scrapy
- wspomnienie, że bardziej znamy bs4 :::
::: notes
- Dane były dostępne w API
- Dane pogodowe
- Aktualizacja API meteostatu
- Potrzeba aktualizacji :::
API używamy do pobierania danych pogodowych. Pochodzą one z Meteostatu, a pobieramy je dla Warszawy.
::: notes
- Temperatura, wiatr, nasłonecznienie, opady, ciśnienie
- Korelacja pogody z zachorowaniami (z opóźnieniem)
- Wysoka jakość danych
- Brak opłat
- Warszawa jako duże miasto w centrum kraju :::
::: notes
- Sprowadzenie danych do wspólnego formatu
- Wykorzystanie jupyter lab
- Interaktywne notatniki
- Osobne notatniki na pobieranie i analizę
- Trzymanie zmian w gicie :::
::: notes
- Ilość zakażeń z dnia (IHME/koronawirusunas)
- Różnice w danych
- koronawirusunas to dane z ministerstwa
- IHME raport bez uśredniania (?)
- Brak nowego raportu po 19 maja 2020 w IHME :::
::: notes
- Zmiana liczby zakażeń i mobilności w czasie
- Wprowadzanie kolejnych obostrzeń
- Czas od fioletu do czerwieni
- Spadek mobilności jedynie przez 2 tygodnie i późniejszy wzrost
- Ustabilizowanie liczby zakażeń po 3-4 tygodniach (350/dzień) :::
::: notes
- Wzorst mobilności nie wpłynął na liczbę zakażeń
- Skuteczność obostrzeń
- Widać na wykresie, że obostrzenia działały
:::
::: notes
- Specyficzny Śląsk
- Znaczny wpływ na dane
:::
::: notes
- Znaczna zmiana trendu po zignorowaniu Śląska
- Luzowanie obostrzeń
- Zwiększona mobilność nie powoduje wzorstu liczby zakażeń
:::
::: notes
- Widoczny trend wykładniczy
- Brak zmiany w trendzie niezależnie od obostrzeń
- Trend wykładniczy i wrażliwość na zmianę podstawy
- Współczynnik reprodukcji podstawą funkcji wykładniczej
:::
::: notes
- Poznanie metod:
- przetwarzania
- wizualizacji
- Sposoby na szukanie nowych danych
- Sposoby oczyszczania danych
- Wykluczanie danych silnie skorelowanych
:::
::: notes
- Dodatkowe punkty do stypendium
- Powiązanie z badaniami prof. Dominika Strzałki
- Lepsze poznanie kolegów z roku mimo pandemii
- Wymiana doświadczeń
- Środowisko pracy odmienne od uczelnianych projektów
- Wyznaczanie własnych celów
- Radzenie sobie z sytuacjami, gdzie nikt nie mógł nam w 100% pomóc
:::
::: notes Pytania :::