Difference between revisions of "Predict the Curve Flattening"

From BITPlan Wiki
Jump to navigation Jump to search
Line 1: Line 1:
 
= Slack =
 
= Slack =
herausforderung_164 is the channel you can ask for an invitation on 1_038_a_daten
+
herausforderung_164 is the channel you can ask for an invitation on slack channel 1_038_a_daten
 +
 
 +
Active structured documentation is now at https://docs.google.com/document/d/1DMAisYOtO1RZU7OVzppxrlRGVhjzJNq3eRiKbNHKC-g/edit#
 +
 
 
= Organisation =
 
= Organisation =
 
== Aufgabe ==
 
== Aufgabe ==

Revision as of 09:56, 21 March 2020

Slack

herausforderung_164 is the channel you can ask for an invitation on slack channel 1_038_a_daten

Active structured documentation is now at https://docs.google.com/document/d/1DMAisYOtO1RZU7OVzppxrlRGVhjzJNq3eRiKbNHKC-g/edit#

Organisation

Aufgabe

Titel Predict the Curve Flattening

Kategorie Kommunikation & Informationsvermittlung an Bürger*innen

Daten: Wie können wir Daten besser aufbereiten und nutzen?

Probleme

Jeder redet von #flattenthecurve aber wie sieht die Kurve eigentlich aus und wie entwickelt sie sich? Ich habe in den letzten Tagen bereits eine Open-Source Visualisierung mit Daten der John Hopkins University gemacht: https://paul-em.github.io/covid-19-curves/Spannend wäre allerdings zu wissen wie sich anhand des Momentums die Kurve entwicklen könnte und vielleicht noch andere Darstellungsformen zu entwickeln. Vielleicht wären hier Mathematiker ganz gut. Ich wäre als Informatiker jedenfalls dabei! Formulierung Herausforderung Wir können einfach darstellen ob die getroffenen Maßnahmen Wirkung zeigen.

Ziele

  • saubere und strukturierte Daten
  • Datengrundlage in Deutschland
  • Zeitreihen-Analyse
  • Zusammenhang zwischen Eindämmungsmassnahmen und Zeitreihen-Daten
  • Verzögerung durch Inkubationszeit berücksichtigen
  • Vergleich mit Ländern in denen die Wirkung schon eingetreten ist: China, Korea, Taiwan, ...
  • Mapping Region Bevölkerungszahl siehe https://github.com/paul-em/covid-19-curves/blob/master/assets/populations.js
  • Anwendern die Angst und Ungewissheit über die zukünftige Entwicklung nehmen. Exponentiell hört sich für die einen schrecklich an, die anderen nehmen es nicht ernst. Ein Satz wie "Im April brauchen wir 500.000 Krankenhausbetten" hilft es besser einzuordnen.
  • Anwendern die Notwendigkeit und Effizienz von Maßnahmen der Regierung aufzuzeigen. Eine Ausgangssperre ist hart, aber wenn man zeigt, dass wir dann im April doch nur 100.000 Krankenhausbetten brauchen, wird es vielleicht akzeptiert. Fakt ist: Bisherige Tools sind unzureichend, was die Prognose für die Zukunft anbelangt. "Flattening the curve" ist für den Mathematiker cool, für viele andere Menschen unverständlich.

Vorgehen

Teambildung

  • Modellierung
    • Netzwerke
    • SIR Modelle
    • Statistische Modelle
  • Datawarehousing
  • Visualization

Kommunikation

Idee

  • Backendleute vieleicht um DB und REST-API kümmern, Mathematiker um modelle und Frontendleute um die darstellung und dann noch datenquellen gesammeltwerden.
  • 21:25 Uhr kleine Gruppe 3 Leute: probabilistische Modellieren mit Unsicherheiten
  • 21:38 Uhr Ich würde gerne ein Team für das data warehousing mit ein paar leuten machen.
  • 21:37 Uhr Datenrecherche
  • 21:45 Uhr Visualisierung - Gruppe um 22:02 Uhr erstellt
  • 21:48 Uhr statistische Modelle

Ideen

  • Aufbauend auf diesem Open-Source Projekt könnte weitergearbeitet werden: https://paul-em.github.io/covid-19-curves/Andere Ansätze gibts es bereits einige.
  • Wäre es nicht sinnvoll ein datenbank cluster aufzusetzen um die Daten zentral zu sammeln. Dann könne wir die verschiedenen Tools gegen die selbe Datenbasis laufen lassen und testen welche Algorythmen die besten sind und die Daten zusammenführen
  • Epidemic Calculator
  • predictions mit lstm, dense oder whatever nn ihr mögt
  • disease equations fitten
  • quasi md simulationen mit ansteckung bei interaktionen
  • ein dashboard bauen was als frontend dienen könnte
  • Mit http://www.bitplan.com/index.php/SimpleGraph könnte aus den CSV eine Graph-Datenbank gemacht und anschliessend mit Geo-Daten usw. verknüpft werden, damit wir Datenformate bekommen, die wir besser nutzen können.
  • Json und CSV wäre sinnvoll
  • Prognosen bieten sich generell verschiedene Ansätze an: 1. Fit der Daten an epidemiologische Modelle 2. Vergleich der Daten mit anderen Ländern (Italien, Südkorea, China) 3. Abschätzung durch Veränderungen im aktuellen Datensatz
  • Susceptible Pool wichtig, also die Bevölkerungszahl %of pop infected e.g. Diamond P=23.58% 0.02 % China, 0.12% Norway
  • Gesamtarchitektur/Schnittstellen-Festlegung zwischen Daten, Modellierung und Visualisierung?

Vorgehensvorschlag

  • Daten und Events (Maßnahmen) sammeln
  • Modellierung, die daraus die Zukunft vorhersagen kann
  • Visualisierung der Zukunft (ähnlich Wettervorhersage)
  • Interaktive Visualisierung bei der sich einzelen Events abschalten lassen und die Folgen sichtbar sind (aus den Modellen abgeleitet)

Links

Germany