Freitag, 27. März 2020

Berechnungen in unsicheren Zeiten


"Prognosen sind schwierig, besonders wenn sie die Zukunft betreffen." - ein bekanntes Zitat. Trotzdem möchte ich mich daran versuchen. Dies kann scheitern (und im Grunde hoffe ich, daß ich mich mit den nachfolgenden Berechnungen irre).

Im letzten Beitrag auf diesem Blog (siehe: Toilettenpapier, Exponentialfunktion, Digitalisierung) hatte ich einige Aspekte zur aktuellen Pandemie dargestellt, die ich mit diesem Text um einen Aspekt ergänzen möchte. Ich will rechnen und zwar, wie sich die Zahl der Infektionen bisher entwickelt haben. Und mit der daraus entwickelten Formel will ich eine Vorhersage über die weitere Entwicklung wagen.


Vorbemerkung

Die hier präsentierten Zahlen sehen nicht gut aus. Ich will damit keine Panik erzeugen, einfach nur auf der Basis der verfügbaren Zahlen eine Hochrechnung wagen.


Voraussetzung

Die hier verwendeten Zahlen stammen von der Johns Hopkins University, die ein Coronavirus Resource Center betreiben, wo viele Informationen zu diesem Thema verfügbar sind. Die Daten des Centers werden täglich aktualisiert und hier veröffentlicht: CSSEGISandData / COVID-19.

Eine Übersicht über die Situation in Deutschland finden Sie hier: Robert Koch-Institut: COVID-19-Dashboard.

Für meine Berechnungen nehme ich die Formel, mit der man die Ausbreitung solcher Krankheiten berechnet. Der Name dieser Funktion ist logistische Funktion. Auf der Basis der bis jetzt (27.03.2020) bekannten Zahlen passe ich diese Formel so an, daß sie "gut passt". Und danach wage ich eine Abschätzung, was in den kommenden Tagen zu erwarten ist. Eine Verbindlichkeit meiner Vorhersage kann ich nicht garantieren, im Gegenteil hoffe ich, daß meine Berechnung sich als falsch herausstellen werden.


Einschränkungen

Ich möchte keine Ratschläge geben, wie man eine Infektion mit diesem Virus vermeiden kann. Ich kann keine Beschreibung und Beurteilung des Krankheitsverlaufs geben, dazu fehlt mir das Wissen. Ich berechne auch nicht die Anzahl benötigter Betten in Krankenhäusern oder der benötigten Intensivbetten. Und insbesondere berechne ich nicht die Anzahl der möglicherweise an diesem Virus Sterbenden.


Formel

In meinem letzten Beitrag hatte ich auf ein Youtube-Video verlinkt, das die Entwicklung der Fallzahlen einer Pandemie erläutert. In diesem Video dargestellt wurde eine Funktion, die ich auch hier für meine Berechnungen verwenden werde. Diese Funktion hat folgende Form:

Xheute+1 = C * ( 1 - Xheute Xgesamt ) * Xheute

Dabei ist Xheute die Anzahl Infektionen zu einem bestimmten Tag. Daraus errechnet sich die Anzahl der Fälle für den folgenden Tag als Xheute+1. Bei dieser Berechnung verwendet wird eine Konstante, hier als C bezeichnet, die ich zu bestimmen habe. Der Ausdruck in Klammern ist ein Korrekturfaktor, der vom aktuellen Stand und der Gesamtbevölkerung (=Xgesamt) abhängt. Dieser Korrekturfaktor bewirkt die Abflachung der Kurve, irgendwann.

Mit den vorliegenden Daten (Stand: 27.03.2020) habe ich diese Formel so angepasst, daß sie die Entwicklung bis zum heutigen Tag beschreibt. In der nachfolgenden Grafik sehen Sie in blauer Farbe die offiziellen Zahlen, in rot die aus obiger Formel errechneten Daten, wobei ich bei den Berechnungen in jedem Schritt immer die offiziellen Zahlen des jeweiligen Vortages verwendet habe. So sah dies aus:


Für die Konstante C in der Formel habe ich einen Wert von 1,3 eingesetzt. Sie sehen, daß die Übereinstimmung zwischen den Zahlen der Johns Hopkins University und meinen Berechnungen recht gut ist.


Vorhersage

Nun beginnt der problematische, aber interessante Teil: Man kann die Formel natürlich über den heutigen Tag hinaus weiterlaufen lassen, d.h. die Berechnung weiterhin durchgeführt, aber es gibt keinen Vergleich mit gemeldeten Zahlen mehr. Je weiter man in die Zukunft rechnen lässt, desto unsicherer werden natürlich die Zahlen. Bis zum 31.3.2020 habe ich die Berechnungen weiter durchgeführt und so sehen die Ergebnisse aus:


Natürlich kann man die Berechnungen auch über dieses Datum hinaus weiter durchführen, aber das wird mir zu unsicher und deshalb möchte ich diese Zahlen hier nicht veröffentlichen.


Tageszahlen

Von Bedeutung für die Beurteilung der Pandemie ist die Zahl der täglich neu hinzukommenden Fälle. Auch dies kann man rechnen (ist ganz einfach), und sieht dann so aus:


Basis dieser Kurve sind die errechneten Zahlen, da die Übereinstimmung zu den offiziellen Zahlen (bisher) recht gut war.

Sie sehen, welche Belastungen auf unser Gesundheitssystem zukommen (können).


Fehler

Keine Berechnung ist fehlerfrei, und die von mir in der Vergangenheit durchgeführten Berechnungen enthielten durchaus schon mal einen Fehler. Aus diesem Grunde kann ich nicht ausschliessen, daß auch in dieser Berechnung Fehler enthalten sind.

Wie auf diesem Blog schon mehrfach erwähnt bin ich offen für Hinweise auf Fehler.

Eine mögliche Fehlerquelle sind erkrankte, aber nicht getestete Personen. Da ich die Zahl der gemeldeten Fälle in meinen Berechnungen verwende, kann ich diese Personen somit nicht berücksichtigen.

4 Möglichkeiten

Bei allen diesen Untersuchungen gibt es 2 Ebenen:

  • mit diesem Virus erkrankt oder gesund: 2 Möglichkeiten
  • Test findet einen Virus oder es wird kein Virus gefunden: 2 Möglichkeiten

Alle Tests enthalten einen Fehler, d.h. es kann nicht ausgeschlossen werden, daß kein Virus festgestellt wird, obwohl die entsprechende Person an diesem erkrankt ist. Ebenfalls ist es möglich, daß der Test einen Virus findet, obwohl der Proband gesund ist. Diese Fälle nennt man false flag. Gut sind natürlich die übrigen, die korrekten Fälle. Es gibt somit immer 4 Fälle, die zu berücksichtigen sind. Mir liegen keine Zahlen vor, wie korrekt diese Tests arbeiten, d.h. wie hoch der Anteil der false flags ist. Somit lässt sich dies in den Berechnungen auch nicht berücksichtigen.

Meine Berechnungen sind simplifiziert. Sie berücksichtigen weder die Verweilzeit im Krankenhaus, die Schwere einer möglichen Erkrankung, die Zahl der Genesenen oder die Zahl der Verstorbenen usw..

Eine weitere Fehlerquelle sind Fehler in den Meldungen (siehe "Das RKI wies darauf hin, dass am Wochenende nicht alle Ämter Daten übermitteln"). Diese Fälle kommen vor, kann ich aber nicht berücksichtigen, weder einen Fehler nach oben noch nach unten. Aber in den Daten erkennen Sie schon, daß an Wochenenden die Behörden entweder weniger Tests durchführen oder aber nicht alle Kreise die Ergebnisse nach oben melden:


Dazu eine Stellungnahme des Robert Koch Instituts:
Durch die Dateneingabe und Datenübermittlung entsteht von dem Zeitpunkt des Bekanntwerdens des Falls bis zur Veröffentlichung durch das RKI ein Zeitverzug, sodass es Abweichungen hinsichtlich der Fallzahlen zu anderen Quellen geben kann.

Am aktuellen Wochenende wurden nicht aus allen Ämtern Daten übermittelt, sodass der hier berichtete Anstieg der Fallzahlen nicht dem tatsächlichen Anstieg der Fallzahlen entspricht.

Quelle: COVID-19: Fallzahlen in Deutschland und weltweit

Eine gute Übersicht über die Probleme des Robert Koch Instituts finden Sie in diesem Artikel: Statistikprobleme beim Coronavirus: Die große Meldelücke. Dabei möchte ich auf folgenden Abschnitt in diesem Text verweisen: "Datenübermittlung per Fax" - gut, daß wir FAX-Geräte haben.


Zahlen

Neben den Zahlen des Robert Koch Instituts und der Johns Hopkins University gibt es noch eine weitere Gruppe, die regelmässig Zahlen zu Infektionen veröffentlicht: Risklayer. Risklayer holt diese Zahlen direkt aus den einzelnen Landkreisen und kreisfreien Städten ab, wartet also nicht auf eine Meldung von dort.

Zum 24.3.2020 habe ich die Zahlen dieser 3 Einrichtungen geholt und möchte diese zum Vergleich hier angeben:

  • Robert Koch Institut: 27.436
  • Johns Hopkins University: 29.056
  • Risklayer: 32.024

Dies ergibt eine Abweichung von ca. 4.500 Personen, entspricht etwa 15%. Welche Zahl soll ich nun für meine Berechnungen verwenden? Welcher Zahl kann man glauben? Die Zahl des Risklayers kommen meinen Berechnungen am nächsten, aber ich habe mich trotzdem auf die Zahlen der Johns Hopkins University verlassen.


Offenlegung

Die von mir durchgeführten Berechnung und die zugrundeliegenden Daten stelle ich Ihnen hiermit zur Verfügung: Corona.ods.

Die Datei enthält die Daten im Format LibreOffice Calc. Mit diesem Werkzeug habe ich die Berechnungen durchgeführt. Alternativ können Sie natürlich auch Excel verwenden.

Wie bereits erwähnt bin ich offen für Hinweise auf Fehler.


Alternativen

Auch auf anderen Seiten werden solche Berechnungen präsentiert. Und auf manchen Seiten können Sie selbst solche Berechnungen durchführen lassen und dabei hier unterschlagene Parameter berücksichtigen:


Auf beiden Seiten finden Sie auch ausführliche Erläuterungen zum jeweils verwendeten mathematischen Modell. Aber eine Warnung möchte ich aussprechen: Man muß schon Differentialgleichungen mögen, um diese Erläuterungen zu verstehen.

Und eine Übersicht mit Vergleichsmöglichkeiten für einzelne Länder finden Sie hier: COVID19 - Trend Tracker.



Fazit

Die Zahlen bis heute sehen nicht gut aus. Führt man die Rechnung weiter, so wird es überhaupt nicht besser.

Ich hoffe, daß ich mich mit meinen Berechnungen irre.



Nachtrag

In der Kurve der Gegenüberstellung offizieller zu errechneten Fällen sehen Sie die blaue Kurve, die unterhalb der roten Kurve hervorlugt. Dies wäre ein positives Zeichen, sofern diese Entwicklung in den kommenden Tagen anhält. Und je stärker diese Abweichung wird, desto eher haben wir Hoffnung auf ein Überwinden des Virus.