Revision as of 09:56, 21 March 2020

Slack

herausforderung_164 is the channel you can ask for an invitation on slack channel 1_038_a_daten

Active structured documentation is now at https://docs.google.com/document/d/1DMAisYOtO1RZU7OVzppxrlRGVhjzJNq3eRiKbNHKC-g/edit#

Organisation

Aufgabe

Titel Predict the Curve Flattening

Challenge ID 1757 Predict the Curve Flattening

Kategorie Kommunikation & Informationsvermittlung an Bürger*innen

Daten: Wie können wir Daten besser aufbereiten und nutzen?

Probleme

Jeder redet von #flattenthecurve aber wie sieht die Kurve eigentlich aus und wie entwickelt sie sich? Ich habe in den letzten Tagen bereits eine Open-Source Visualisierung mit Daten der John Hopkins University gemacht: https://paul-em.github.io/covid-19-curves/Spannend wäre allerdings zu wissen wie sich anhand des Momentums die Kurve entwicklen könnte und vielleicht noch andere Darstellungsformen zu entwickeln. Vielleicht wären hier Mathematiker ganz gut. Ich wäre als Informatiker jedenfalls dabei! Formulierung Herausforderung Wir können einfach darstellen ob die getroffenen Maßnahmen Wirkung zeigen.

Ziele

saubere und strukturierte Daten
Datengrundlage in Deutschland
Zeitreihen-Analyse
Zusammenhang zwischen Eindämmungsmassnahmen und Zeitreihen-Daten
Verzögerung durch Inkubationszeit berücksichtigen
Vergleich mit Ländern in denen die Wirkung schon eingetreten ist: China, Korea, Taiwan, ...
Mapping Region Bevölkerungszahl siehe https://github.com/paul-em/covid-19-curves/blob/master/assets/populations.js
Anwendern die Angst und Ungewissheit über die zukünftige Entwicklung nehmen. Exponentiell hört sich für die einen schrecklich an, die anderen nehmen es nicht ernst. Ein Satz wie "Im April brauchen wir 500.000 Krankenhausbetten" hilft es besser einzuordnen.
Anwendern die Notwendigkeit und Effizienz von Maßnahmen der Regierung aufzuzeigen. Eine Ausgangssperre ist hart, aber wenn man zeigt, dass wir dann im April doch nur 100.000 Krankenhausbetten brauchen, wird es vielleicht akzeptiert. Fakt ist: Bisherige Tools sind unzureichend, was die Prognose für die Zukunft anbelangt. "Flattening the curve" ist für den Mathematiker cool, für viele andere Menschen unverständlich.

Vorgehen

Teambildung

Modellierung
- Netzwerke
- SIR Modelle
- Statistische Modelle
Datawarehousing
Visualization

Kommunikation

Strukturierte Dokumentation hier
Metadokument/Organisation: https://docs.google.com/document/d/1DMAisYOtO1RZU7OVzppxrlRGVhjzJNq3eRiKbNHKC-g/edit#
Slack-Channel für Architektur: https://wirvsvirus.slack.com/archives/C010G6FAL00
- Architektur-Entwurf: https://docs.google.com/document/d/1K1_plqtRlrpn2tjNohiEXPTrNDtBRq2F13HqvTA1-Lo/edit#

Idee

Backendleute vieleicht um DB und REST-API kümmern, Mathematiker um modelle und Frontendleute um die darstellung und dann noch datenquellen gesammeltwerden.
21:25 Uhr kleine Gruppe 3 Leute: probabilistische Modellieren mit Unsicherheiten
21:38 Uhr Ich würde gerne ein Team für das data warehousing mit ein paar leuten machen.
21:37 Uhr Datenrecherche
21:45 Uhr Visualisierung - Gruppe um 22:02 Uhr erstellt
21:48 Uhr statistische Modelle

Ideen

Aufbauend auf diesem Open-Source Projekt könnte weitergearbeitet werden: https://paul-em.github.io/covid-19-curves/Andere Ansätze gibts es bereits einige.
Wäre es nicht sinnvoll ein datenbank cluster aufzusetzen um die Daten zentral zu sammeln. Dann könne wir die verschiedenen Tools gegen die selbe Datenbasis laufen lassen und testen welche Algorythmen die besten sind und die Daten zusammenführen
Epidemic Calculator
predictions mit lstm, dense oder whatever nn ihr mögt
disease equations fitten
quasi md simulationen mit ansteckung bei interaktionen
ein dashboard bauen was als frontend dienen könnte
Mit http://www.bitplan.com/index.php/SimpleGraph könnte aus den CSV eine Graph-Datenbank gemacht und anschliessend mit Geo-Daten usw. verknüpft werden, damit wir Datenformate bekommen, die wir besser nutzen können.
Json und CSV wäre sinnvoll
Prognosen bieten sich generell verschiedene Ansätze an: 1. Fit der Daten an epidemiologische Modelle 2. Vergleich der Daten mit anderen Ländern (Italien, Südkorea, China) 3. Abschätzung durch Veränderungen im aktuellen Datensatz
Susceptible Pool wichtig, also die Bevölkerungszahl %of pop infected e.g. Diamond P=23.58% 0.02 % China, 0.12% Norway
Gesamtarchitektur/Schnittstellen-Festlegung zwischen Daten, Modellierung und Visualisierung?

Vorgehensvorschlag

Daten und Events (Maßnahmen) sammeln
Modellierung, die daraus die Zukunft vorhersagen kann
Visualisierung der Zukunft (ähnlich Wettervorhersage)
Interaktive Visualisierung bei der sich einzelen Events abschalten lassen und die Folgen sichtbar sind (aus den Modellen abgeleitet)

Links

Germany

@@ Line 1: / Line 1: @@
 = Slack =
-herausforderung_164 is the channel you can ask for an invitation on 1_038_a_daten
+herausforderung_164 is the channel you can ask for an invitation on slack channel 1_038_a_daten
+Active structured documentation is now at https://docs.google.com/document/d/1DMAisYOtO1RZU7OVzppxrlRGVhjzJNq3eRiKbNHKC-g/edit#
 = Organisation =
 == Aufgabe ==

Difference between revisions of "Predict the Curve Flattening"