Wikipedia:Wikipedistik/Vandalismusanfälligkeit

Nachdem ich mich vor etwa einem Monat gefragt habe, warum große Teile meiner Beiträge im Artikel Scholastik auf einmal verschwunden waren, bin ich der Sache etwas näher auf den Grund gegangen. Herausgekommen ist eine Untersuchung zu Vandalismusanfälligkeit der Wikipedia, die hier media:UntersuchungVandalismus041204.pdf abzurufen ist. - Uli

Ich finde diese Resultate eigentlich gar nicht so negativ, wie aufwendig müsste man die Artikel noch beobachten, um noch bessere Resultate - sprich schnellere Korrekturen - zu erzielen? Dass die Wikipedia äußerst verletzbar ist und gegen Vandalismus recht schlecht geschützt - weit weg von immun, das wissen wir längst, das wiederhole ich selbst auch nicht selten, wahrscheinlich bräuchten wir bessere, effizientere Werkzeuge zur Beobachtung, wenn wir in der Zukunft nicht statt Neues zu schaffen pausenlos nur paranoide & halbfrustriert mit Doppelflinte auf dem Wikipedia-Ansitz lauern wollen. - Ilja

Hochrechnung von Ulis Studie auf die Zahl aller Vandalismusschäden

Wir haben beobachtet:

  • y% des (von uns gezielt eingesetzten) Vandalismus wurde innerhalb von zwei Wochen gefunden und beseitigt.

(Hier müsste man eine größere Studie machen, um verlässliche Zahlen zu erhalten.)

Weitere Untersuchung:

  • von den Edits dieses Tages sind Y Beseitigungen von Vandalismus, der innerhalb von zwei Wochen davor stattfand.

Wir nehmen an, dass die Wahrscheinlichkeit für einen Vandalismusakt, beseitigt zu werden, unabhängig davon ist, ob er gezielt eingesetzt wird ...

Sei X die Anzahl des wirklich vorhandenen Vandalismus eines Tages (wir nehmen an, dass das nicht stark schwankt).

Dann gilt (modulo Messfehler):

   X * y% = Y,

also

   X = Y / y%.

Das Problem hierbei ist, dass da ein paar Annahmen drin sind, bei denen wir nicht wirklich wissen, ob diese in der Realität wirklich gegeben sind.

Ermittlung der Vandalismushäufigkeit generell

Eine andere Möglichkeit wäre es, mit einem Team einmal die Änderungen eines kompletten Tages mal nach mehr als zwei Wochen durchzugehen, um zu sehen

  • wieviel davon Vandalismus war
  • wieviel davon nach zwei Wochen noch übrig ist.

Man darf dieses Vorhaben allerdings nicht im Voraus ankündigen (während die zwei Wochen noch laufen), um Verfälschungen zu vermeiden - optiomalerweise nimmt man also zwei Wochen, die schon jetzt eine etwas längere Zeit her sind.

Das wären dann gute Daten - allerdings ist das auch ein entsprechend hoher Aufwand. Um statistische Schwankungen rauszubekommen, muss das ganze auch noch ein paar Mal (mit anderen Zeiträumen) wiederholt werden.

(Der Zwei-Wochen-Zeitraum ist natürlich auch ziemlich willkürlich gewählt - ich bleibe einfach mal dabei, weil Uli den gewählt hat. -- Paul E.)