Geschichtsstatistik mit Wikipedia

Man kann viel über die Geschichte der Erde lernen, indem man sich anschaut, welche großen Ereignisse es gab, welcher Staatsmann wann mit welchem ein Bündnis schloss oder welcher Feldherr wann eine Schlacht für sich entschied. Einzelne Begebenheiten und Personen sind aber ein Zugang, der zwar sehr spannend und lebendig sein kann, es allerdings oft schwer macht einen Blick auf das Ganze zu bekommen und zu vergleichen. Um das wirklich erreichen zu können braucht man Daten, viele Daten. Eine interessante Idee dazu kam mir, als mir auffiel, dass die Wikipedia alle Personen, die in einem bestimmten Jahr geboren oder gestorben sind, in eine Kategorie einordnet, die man aufrufen kann und dann die Anzahl der Artikel in der Kategorie sehen kann. Wenn man diese Anzahl dann gegen das Jahr in einem Diagramm aufträgt, so dachte ich mir, könnte man da sicher interessante Sachen feststellen. Und genau das habe ich dann gemacht und das hier ist dabei herausgekommen:

Bild

Ich habe das Ganze für die deutsche und die englische Wikipedia gemacht, erstmal bis ins Jahr 1850 zurück (bei der deutschen bin ich sogar schon ein bisschen weiter, aber das zeig ich, wenn ich beim Rest aufgeholt hab :)). In Blau und Grün sind die Geborenen zu sehen, in Rot und Lila die Gestorbenen. Ich schreibe jetzt einfach mal in Stichpunkten meine Erkenntnisse dazu hin:

– Die Geborenenkurve liegt immer über der Gestorbenenkurve, klar weil Leute, die in einem Jahr geboren wurden natürlich eine größere Chance haben in der Gegenwart bekannt zu sein als welche, die in dem Jahr gestorben sind

-Einzige Ausnahme sind die letzten 20 Jahre weil die Leute, die dort geboren wurden ja noch Kinder sind und noch nicht die Chance hatten ,sich einen Wikipediaartikel zu „verdienen“. Erstmals mehr Geborene als Gestorbene gibt es bei der deutschen Wikipedia im Jahr 1992, bei der Englischen im Jahr 1993.

-In den letzten zehn Jahren ist die Anzahl der Gestorbenen noch einmal stark gestiegen. Das fällt in etwa mit der Gründung von Wikipedia zusammen. Anscheinend wurden signifikant mehr Artikel für Leute angelegt, von deren Tod man eben erst erfahren hatte.

-Die Geborenen durchlaufen in beiden Fällen ein erstes Maximum in den Jahren 1982/85. Während das bei der englischen Wikipedia auch mit 12798 Artikeln das absolute Maximum ist, kommt man in der deutschen in den 1940er Jahren noch ein Stück höher. Ich vermute, dass das Maximum vor allem durch Sportler ausgemacht wird, ihre Artikel sind leicht anzulegen, die Relevanzkrieterien sind niedrig. Dadurch, dass die englische Wikipedia einfach mehr Autoren hat, werden in dem Bereich mehr Artikel geschrieben

-Die Artikelanzahl für die Geborenen in der deutschen Wikipedia hat in Mitte der 70er Jahren ein lokales Minimum, steigt ab 1972 aber wieder an. 1965 ist man erstmals über dem Maximum aus den von 1982. Sie bleibt dann auch konstant darüber (mit einer Ausnahme) bis zum Jahr 1940. Der Höchstwert ist im Jahr 1947 mit 4703 Artikeln erreicht. Dieses Jahr bildet auch in der englischen Wikipedia ein lokales Maximum, dessen Wert erst 1970 wieder erreicht wird. Hier bin ich mir nicht sicher, wer das Maximum ausmacht, ich tippe auf Politiker.

-Im Jahr 1945/46 hat die deutsche Wikipedia einen kurzen Einbruch bei den Geburten, der in der englischen nur angedeutet ist. Das fällt offensichtlich mit den Wirren am Kriegsende zusammen, wo auch viele kleine Kinder gestorben sind, oder man das Geburtsjahr gar nicht wusste.

– Bei den Gestorbenen kommt der zweite Weltkrieg in beiden Sprachen ganz klar raus. Während in den ersten Kriegsjahren der Anstieg eher moderat ist kommt zu Kriegsende noch eine große Spitze raus. Während die englische Wikipedia allerdings 1944 als Maximum hat, sticht in der deutschen 1945 sehr hoch hervor. Das wird wohl vor allem durch in Konzentrationslagern Umgekommene ausgemacht. Es ist eindrucksvoll und erschreckend, wie eindeutig dieses Jahr (in dem zumindest der Krieg ja schon im Mai vorbei war!) unsere gesamte Geschichte dominiert und dokumentiert.

-Die Geborenen durchlaufen zwischen den Weltkriegen bzw. während des Ersten Weltkriegs nochmal zwei Minima: Eines in den Jahren 1931-1933, ein zweites 1916-1919. Beide kommen in der deutschen Wikipedia stärker raus als in der englischen. Das zweite würde ich teils mit dem Ende des Ersten Weltkrieges, teils damit, dass viele in diesen Jahren Geborene dann im Zweiten Weltkrieg als junge Soldaten fielen und nicht mehr die Chance hatten, sich einen Namen zu machen, erklären. Beim Ersten habe ich ehrlich gesagt keine Ahnung. Wenn einer eine Idee hat, ab in die Kommentare damit!

-Die Gestorbenen im Ersten Weltkrieg kommen in der deutschen Wikipedia nicht so stark raus, wie ich erwartet hatte. Ohne das Jahr 1918 würde man sie möglicherweise kaum bemerken. In der englischen sieht man das viel stärker. Woran das liegt, bin ich mir nicht sicher, vielleicht daran, das die Gesamtzahl der Artikel auf Deutsch bereits so weit gesunken ist, dass man einzelne Ereignisse nicht mehr so sieht oder das relativ wenige, die als Soldaten starben, bereits bekannte Menschen waren. Hier wäre interessant, wie das Ganze in der französischen Wikipedia aussieht, die artikelmäßig ja mit der deutschen vergleichbar ist. In Frankreich war ja der Erste Weltkrieg ja noch verheerender als in Deutschland, weil eben dei Kampfhandlungen zu einem sehr großen Teil auf französischem Gebiet stattfanden.

-je weiter man in der Zeit zurückgeht, desto ähnlicher werden sich die Kurven für die verschiedenen Sprachen. Selbst einzelne Zacken kann man da dann wiederfinden. Überraschend ist das nicht, weil aus früherer Zeit immer nur über eine begrenzte Personenanzahl überhaupt etwas bekannt ist, da gleicht sich das Wissen mehr oder weniger an.

Das sind mal meine Beobachtungen. Ist jemand was aufgefallen, worüber ich noch nichts geschrieben habe? Oder hat jemand eine andere Interpretation einer Eigenschaft der Kurve? Schreibts mir in die Kommentare!

Ich beabsichtige, die Statistik noch weiter auszubauen. Erstmal werde ich noch weiter in der Zeit zurückgehen und schauen ,was für Effekte da dann eine Rolle spielen. Dann werden ich schauen, wie es in anderen Sprachen aussieht. Französisch, Spanisch, Russisch, Italienisch und so weiter. Ich mach ein Update, wenn ich singnifikant weiter gekommen bin.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s