Wiktionary

Wiktionary
ein Wiki-basiertes freies Wörterbuch
Wikiprojekt zur Erstellung eines freien Wörterbuches sowie Thesaurus in jeder Sprache
Sprachen172, darunter Deutsch, Französisch und Englisch
BetreiberWikimedia Foundation
RedaktionJimmy Wales und „Wikimedia-Community“
Registrierungoptional
OnlineEnglische Version: 12. Dez. 2002

Deutsche Version: 001. Mai 2004

http://de.wiktionary.org/ (Deutsche Version)

http://wiktionary.org/ (Übersicht aller Sprachen)

Das Wiktionary [ˈvɪkʃənərɪ] (dt.: Wikiwörterbuch) ist ein gemeinschaftliches Projekt der Wikimedia zur Erstellung eines frei zugänglichen, vollständigen und mehrsprachigen Wörterbuches sowie eines entsprechenden Thesaurus in jeder Sprache. Der Name Wiktionary ist ein analog zu Wikipedia gebildetes Kofferwort, das sich aus den Wörtern Wiki und dictionary (deutsch: Wörterbuch) zusammensetzt. Seit der Gründung 2002 wuchs die Anzahl der Einträge in die Wiktionarys international auf über 6,2 Millionen an.[1]

Konzept und Projekt

Sprachübergreifende Einstiegsseite des Wiktionary

Wiktionary ist der lexikalische Partner der freien Online-Enzyklopädie Wikipedia. Analog zu den verschiedenen Sprachausgaben der Wikipedia gibt es Wiktionarys in unterschiedlichen Sprachen. Während die Wikipedia als ein Lexikon Sachinformationen zu den Begriffen zur Verfügung stellt, übernimmt das Wiktionary die Funktionen eines Sprachwörterbuchs und eines Thesaurus; es dient somit der Vermittlung sprachlichen Wissens. In der Funktion als Sprachwörterbuch soll es sprachliche Eigenschaften wie Homonyme, Bedeutung, Grammatik, Etymologie und Übersetzungen erklären; die Auswahl der Lemmata soll den Wortschatz der Sprachen abdecken. In der Funktion als (linguistischer) Thesaurus werden zum Worteintrag assoziierte Begriffe wie Synonyme und Oberbegriffe zusammengestellt. Wie die Wikipedias werden die Wiktionarys laufend erweitert und verbessert; jeder kann jederzeit mitarbeiten.

Im Gegensatz zu üblichen gedruckten meist zweisprachigen Sprachwörterbüchern ist das Konzept der Wiktionarys so offen angelegt, dass in jeder einzelnen Sprachversion Lemmata zu Einträgen in allen Sprachen erwünscht sind. In einer theoretischen Endausbaustufe besäße jedes Sprach-Wiktionary den Wortschatz aller Fremdsprachen, erklärt in der Grundsprache des jeweiligen Wiktionarys, sowie zusätzlich alle Einträge aus dem Wortschatz der eigenen Sprache inklusive Übersetzungen in alle Fremdsprachen.

Einer Aussage beim Wikimedia-Projekt Meta zufolge wurde die Idee zur Erstellung des Wiktionary erstmals im Jahr 2002 von Daniel Alston (mit dem Benutzernamen Fonzy) vorgebracht.[2]

Die englische Version wurde als erstes Wiktionary am 12. Dezember 2002 begonnen. Die deutsche Version, das Wikiwörterbuch, startete am 1. Mai 2004. Der 95.000ste Eintrag dieses Projektes wurde am 12. September 2009 erstellt.

In den Wiktionarys werden für unterschiedliche Groß- / Kleinschreibung mit gleicher Buchstabenfolge einzelne Einträge generiert (Beispiel: Bank und bank im deutschen Wikiwörterbuch); dieses Vorgehen weicht von dem der Wikipedias ab, die unterschiedliche Groß- / Kleinschreibungsvarianten in einem Eintrag bündeln. Die Möglichkeit, verschiedene Einträge für Groß- und Kleinschreibungsvarianten zu generieren, wurde nach Aussagen des Wikimedia-Projekts Meta erst 2006 geschaffen.[3] Von dieser Option macht heute eine Vielzahl der Sprachversionen Gebrauch, bei einigen Sprachversionen ist dies jedoch nicht der Fall.

Alle Einträge in den Wiktionarys erhalten eine feste Formatvorlage. Das deutsche Wikiwörterbuch kategorisiert Artikel nicht nach der Bedeutung der erklärten Begriffe (es gibt also beispielsweise keine Kategorien „Biologie“ oder „Medizin“), sondern hauptsächlich nach ihrer Zugehörigkeit zu einer Wortart und einer Sprache. Um dennoch eine gewisse Übersicht über die Abdeckung bestimmter Fachgebiete aus dem Artikelbestand zu bieten, werden manuell gepflegte Listen geführt.[4]

In Wiktionarys können Audiodateien zur Demonstration der Aussprache eingebunden werden. Das deutsche Wikiwörterbuch weist über 11.000 mit Audiodateien versehene Einträge auf.[5] Darüber hinaus wird das Wikiwörterbuch – per gezieltem Einsatz nur bei hierfür geeigneten Einträgen – zum Bildwörterbuch ausgebaut; zum Stand September 2009 sind über 7400 Illustrationen eingebunden.

Lizenz

Die Inhalte der Wiktionarys sind lizenziert unter der GNU-Lizenz für freie Dokumentation (GFDL) und seit Juni 2009 zusätzlich unter der Creative-Commons-Lizenz „CC-BY-SA 3.0 Unported“. Für die Umstellung auf die Doppellizenz musste erst die GFDL von der Version 1.2 auf eine neue Version 1.3 aktualisiert werden, was aufgrund der Struktur der Version 1.2 ohne Einwilligung der Autorenschaft möglich war. Näheres zur Umstellung auf die Doppellizenz siehe GNU-Lizenz für freie Dokumentation#Verwendung in der Wikipedia.

Übersicht

Nachdem das englischsprachige Wiktionary am 12. Dezember 2002 gestartet wurde, folgten am 29. März 2004 die französisch- und die polnischsprachige Version. Wiktionary wurde zunächst auf einer provisorischen URL wiktionary.wikipedia.org betrieben, bevor es am 1. Mai 2004 auf die noch heute gültige URL übertragen wurde. Zu diesem Termin wurde zu jeder weiteren Sprache, in der bereits eine Wikipedia-Version betrieben wurde, ein Wiktionary gestartet. So entstanden an einem Tag 143 weitere Wiktionarys, darunter war die deutschsprachige Version.[1]

Bis heute sind in allen 172 Sprachversionen zusammen über 6,1 Millionen Einträge verfügbar. Die meisten Einträge, über 1,48 Millionen, stellt dabei die französischsprachige Version bereit, gefolgt von der englischsprachigen mit über 1,40 Millionen Einträgen. Diese beiden größten Wiktionaries haben ihre Plätze in der Rangfolge nach Zahl der Einträge mehrmals getauscht; erstmals Anfang 2006 war die französischsprachige Version die mit den meisten Einträgen. Aktuell stellen die 14 größten Wiktionarys jeweils mehr als 100.000 Einträge bereit. Das deutschsprachige Wiktionary steht mit etwas über 95.000 Einträgen auf Rang 16.[1]

Hier eine Tabelle mit den Eintragsanzahlen der 20 größten Wiktionarys zum Stand vom 13. September 2009: [6]

NrSprachkürzelSpracheAnzahl Einträge
1frFranzösisch1.494.866
2enEnglisch1.411.016
3trTürkisch264.203
4ltLitauisch245.143
5viVietnamnesisch228.351
6ruRussisch224.532
7zhChinesisch165.194
8ioIdo158.142
9plPolnisch138.248
10elGriechisch137.178
NrSprachkürzelSpracheAnzahl Einträge
11fiFinnisch129.028
12huUngarisch124.864
13noNorwegisch (Bokmål)122.400
14itItalienisch103.508
15taTamilisch99.104
16deDeutsch95.675
17svSchwedisch95.445
18koKoreanisch80.844
19ptPortugiesisch62.017
20loLaotisch60.653

Es gibt detaillierte Statistikseiten für die Wiktionarys, die auch die historische Entwicklung abbilden.[7] Die Anzahl an Einträgen für sich besitzt nur schwache Aussagekraft über die Qualität einer Sprachversion des Wiktionary; siehe hierzu auch das Kapitel über Wachstumsschübe durch Bots. Statistiken, die die Einträge nach Qualitätsmerkmalen klassifizieren, sind bislang nur eingeschränkt verfügbar.[8]

Einzelne Sprachversionen des Wiktionary

Wachstumskurve des deutschsprachigen Wiktionarys
Logo des Wikiwörterbuchs oder deutschsprachigen Wiktionarys

Deutsch

Das deutschsprachige Wiktionary oder Wikiwörterbuch wurde am 1. Mai 2004 gestartet. Für die Außendarstellung des deutschsprachigen Wiktionarys existieren bis heute die beiden Begriffe „Wiktionary“ und „Wikiwörterbuch“ nebeneinander. Im Logo (die nebenstehende Abbildung zeigt das Logo vor weißem statt grau meliertem Hintergrund) lautet die Abfolge der Textpassagen „Wikiwörterbuch – Wiktionary – [ˈvɪkʃəˌnɛʀi], n – Das freie Wörterbuch – ein Wiki-basiertes freies Wörterbuch“, wobei die oberste und unterste Passage „Wikiwörterbuch“ und „ein Wiki-basiertes freies Wörterbuch“ in grauer Schrift auf nur leicht heller grauem Untergrund gesetzt und damit kaum erkennbar sind.

Heute sind im Wikiwörterbuch über 96.000 Einträge verfügbar. Von den knapp 94.600 Einträgen zum Stand vom 2. September 2009 waren in der Aufteilung nach Sprache der erklärten Wörter etwa 41.600 Einträge deutsch, rund 15.600 Einträge italienisch, etwa 7100 Einträge französisch und zirka 6700 Einträge englisch; die restlichen Einträge verteilten sich auf 186 weitere Sprachen.[9] Laut Angaben von wikistics.falsikon.de war unter den eigentlichen Wörterbucheinträgen im August 2009 am häufigsten auf die Einträge „subtil“, „obligatorisch“ und „pragmatisch“ zugegriffen worden.[10]

Englisch

Als allererste Sprachversion wurde das englischsprachige Wiktionary am 12. Dezember 2002 gestartet. Brion Vibber legte das Wiktionary zunächst auf einer provisorischen URL wiktionary.wikipedia.org an, bevor es am 1. Mai 2004 auf die noch heute gültige URL übertragen wurde.[11] Im November 2005 wurden 100.000 Einträge erreicht, im August 2007 wurden es 500.000. Die Schwelle von 1 Million Einträgen wurde am 18. Oktober 2008 gerissen. Am 7. September 2009 wurde die Zahl von 1,4 Millionen Einträgen überschritten.[12]

Unter den am 8. Juni 2009 vorhandenen etwa 1,3 Millionen Einträgen waren aufgeteilt nach Sprache der erklärten Wörter etwa 349.000 Einträge italienisch, 268.000 englisch, 199.000 spanisch, 85.000 finnisch und 74.000 französisch; der Rest verteilte sich auf weit über 300 weitere Sprachen.[13]

Französisch

Am 29. März 2004 wurde das französischsprachiges Wiktionary oder Wiktionnaire ins Leben gerufen. Mittlerweile weist es nahezu 1,5 Millionen Einträge auf und ist damit gemessen an deren Zahl die umfangreichste aller Sprachversionen des Wiktionary. Von den am 13. Juni 2009 vorhandenen 1,483 Millionen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 842.000 Einträge französisch, jeweils 155.000 russisch und bulgarisch, 53.000 englisch und 14.000 deutsch; der Rest verteilte sich auf über 600 weitere Sprachen.[14]

Vietnamesisch

Das Wiktionary in vietnamesischer Sprache wurde 2004 gestartet. Von den mittlerweile über 230.000 vorhandenen Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 110.000 englisch, 44.000 französisch, 35.000 russisch und 31.000 vietnamesisch; der Rest verteilte sich auf 54 weitere Sprachen. [15]

Polnisch

Das polnischsprachige Wiktionary wurde im März 2004 ins Leben gerufen. Von den am 17. Mai 2009 vorhandenen etwa 153.000 Einträgen waren gemäß der Aufteilung nach Sprache der erklärten Wörter etwa 19.400 in der Plansprache Interlingua, 19.100 polnisch und 12.200 englisch; der Rest verteilte sich auf 222 weitere Sprachen. [16] Die zirka 7.900 Einträge in jiddisch machen das polnische Wiktionary nach eigener Darstellung[17] zum größten modernen Wörterbuch der Nachkriegszeit für Jiddisch, das in Polen ‚herausgegeben‘ wurde. Knapp 6.000 dieser Einträge entstanden 2007 durch eine Bot-Aktion (siehe das Kapitel über Wachstumsschübe durch Bots).

Wachstumskurve der 8 größten Sprachversionen des Wiktionary bis März 2008. Die Wachstumssprünge durch den Einsatz von Bots sind deutlich erkennbar.

Wachstumsschübe durch Bots

Die meisten Einträge in den umfangreichsten Sprachversionen des Wiktionary sind durch den Einsatz von Bots entstanden. Ihre Programmierer fanden kreative Wege, um große Anzahlen neuer Einträge zu generieren oder tausende von Einträgen aus öffentlich zugänglichen Wörterbüchern maschinell zu importieren.

Sieben der mittlerweile über 30 Bots, die beim englischsprachigen Wiktionary als solche gelistet sind,[18] haben dort etwa 163.000 Einträge neu erstellt.[19] 259 Komplex-Einträge, die selbst viele Definitionen enthalten, wurden von Websterbot aus öffentlich verfügbaren Quellen importiert; die meisten dieser Importe sind manuell in Tausende Einträge gesplittet worden. Ein weiterer dieser Bots, ThirdPersBot, erstellte Verbnebenformen in der dritten Person Singular, die in gedruckten Wörterbüchern üblicherweise nicht einzeln aufgeführt werden. Zur Zeit dieser Aktionen im Jahr 2006 hatte das englischsprachige Wiktionary ohne die etwa 163.000 Bot-Einträge etwa 137.000 Einträge umfasst und war damit noch deutlich kleiner als viele gedruckte Wörterbücher: So umfasst das Oxford English Dictionary etwa 615.000 Worteinträge und das Merriam-Webster's Third New International Dictionary of the English Language, Unabridged 475.000 Einträge; dabei sind viele Wortwendungen nur im Textkörper anderer Einträge vorhanden.

Die Wiktionarys in englischer und französischer Sprache haben die zirka 20.000 Einträge der Unihan-Datenbank der CJK-Schriftzeichen (chinesisch, japanisch und koreanisch) importiert.

Das rapide Wachstum des französischsprachigen Wiktionarys im Jahr 2006 geht hauptsächlich auf die Arbeit von Bots zurück, die viele Einträge aus alten, lizenzfreien Wörterbüchern wie der 8. Ausgabe des Dictionnaire de l'Académie française von 1935 mit rund 35.000 Worteinträgen übernahmen, sowie von Bots, die Begriffe aus anderen Sprachausgaben des Wiktionary mit französischen Übersetzungen importierten. Das französisch- wie das vietnamesischsprachige Wiktionary hat große Teile des Free Vietnamese Dictionary Project (FVDP)[20] importiert. Dieses bietet frei zugängliche zweisprachige Wörterbücher von und ins Vietnamesische an.[21] Das vietnamesischsprachige Wiktionary bestand nach dieser Aktion fast ausschließlich aus diesen importierten Einträgen.

Das Wiktionary in polnischer Sprache hat mit Hilfe des Bots Tsca.bot[22] im Zeitraum vom 10. Juli bis zum 27. November 2004 zirka 15.000 Stummeleinträge der Plansprache Interlingua mit Genehmigung des Autors von der Webpräsenz interlingua.filo.pl importiert.[23] Mit Hilfe desselben Bots Tsca.bot wurden vom 31. März bis zum 2. April 2007 knapp 6.000 Einträge in jiddischer Sprache angelegt, die zumeist neben der polnischen Übersetzung die IPA-Aussprache und die YIVO-Transskription enthielten.[24]

Das russischsprachige Wiktionary übernahm mit Hilfe des Bots LXbot ab Oktober 2006 etwa 80.000 Stummeleinträge („Boilerplates“) für englische, deutsche und französische Wörter.[25] [26] [27] Ab Juni 2008 wurden durch den Bot TrudoBot in hoher Zahl Stummeleinträge für russische Wörter erstellt.[28]

Bedeutung

Sprachübergreifend gesehen wird wiktionary.org von Alexa Internet im sogenannten „Alexa Ranking“ auf Rang 1.036 (Stand 24. September 2009) geführt.[29] Von den registrierten Zugriffen erfolgten nach Sprachversion etwa 49 % auf die englische, 13 % auf die deutsche und 10 % auf die französische Version; der Rest verteilte sich auf die vielen weiteren Sprachversionen.

Einzelnachweise

  1. a b c Wiktionary, Eintrag beim Wikimedia-Projekt Meta, abgerufen zuletzt am 24. September 2009.
  2. Talk:Wiktionary/Archives/2002 beim Wikimedia-Projekt Meta; dies bezieht sich wiederum auf den Eintrag Wiktionary/Split_into_thesaurus_and_dictionary beim gleichen Projekt.
  3. Capitalization of Wiktionary pages beim Wikimedia-Projekt Meta, abgerufen am 13. September 2009.
  4. Verzeichnis:Übersicht im Wikiwörterbuch.
  5. Kategorie:Audio-Datei im Wikiwörterbuch, abgerufen am 15. September 2009.
  6. s23.org/wikistats/wiktionaries_html.php, abgerufen am 24. September 2009.
  7. Siehe Wiktionary:Statistik/Sprachenübersicht in der deutsch- und Wiktionary:Statistics#Detail in der englischsprachigen Ausgabe des Wiktionary.
  8. Siehe etwa Wiktionary Category Overview bei stats.wikimedia.org.
  9. Wiktionary:Statistik/Sprachenübersicht, abgerufen am 2. September 2009.
  10. Page hits per day for de.wiktionary in month 2009-08, Statistik bei wikistics.falsikon.de.
  11. Talk:Wiktionary/Archives/2002 bei meta.wikimedia.org, abgerufen am 13. September 2009.
  12. Wiktionary:Milestones beim englischsprachigen Wiktionary, abgerufen am 13. September 2009.
  13. Wiktionary:Statistics, abgerufen am 2. September 2009 (Version vom 10. Juni 2009).
  14. Wiktionnaire:Statistiques, abgerufen am 6. September 2009 (Version mit Stand vom 13. Juni 2009).
  15. Wiktionary:Thống kê im vietnamesischsprachigen Wiktionary, abgerufen am 15. September 2009.
  16. Wikisłownik:Statystyka im polnischsprachigen Wiktionary, abgerufen am 15. September 2009 (Version mit Stand vom 17. Mai 2009).
  17. Portal:Jidysz/pl/mainpage im polnischsprachigen Wiktionary, abgerufen am 17. September 2009.
  18. Siehe Special:Listusers beim englischsprachigen Wiktionary.
  19. Aussage auf Wiktionary in der englischsprachigen Version, abgerufen am 2. September 2009; angegeben werden folgende Bearbeitungszähler für 5 Bots: TheDaveBot, TheCheatBot, Websterbot, PastBot, NanshuBot. Allerdings ist hier zu beachten, dass nicht jeder Edit eine Neuanlage eines Eintrags darstellt.
  20. Free Vietnamese Dictionary Project (FVDP) bei der Universität Leipzig.
  21. Für Details siehe auch Wiktionary:Nguồn gốc/FVDP beim vietnamesischen Wiktionary.
  22. Siehe Tsca.bot im polnischsprachigen Wiktionary.
  23. Eintrag des ersten Wortes (abandonamento) und Eintrag des letzten Wortes (tic-tac) durch Tsca.bot aus der Quelle http://interlingua.filo.pl.
  24. Eintrag des ersten Wortes (שפּאַס) und Eintrag des letzten Wortes (שראַם) durch Tsca.bot.
  25. triskaidekaphobia, erster Eintrag dieser Art durch LXbot.
  26. Bearbeitungszähler für LXbot.
  27. Siehe Diskussionsabschnitt ru:User:LXbot bei User talk:VPliousnine im englischsprachigen Wiktionary.
  28. Участник:TrudoBot im russischsprachigen Wiktionary.
  29. wiktionary.org bei Alexa, abgerufen am 24. September 2009.
Commons: Wiktionary-Statistiken – Sammlung von Bildern, Videos und Audiodateien
Commons: Wiktionary-Logos – Album mit Bildern, Videos und Audiodateien
Wiktionary: Wiktionary – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen

Wiktionary Wiktionary auf deutsch – ein freies Wörterbuch.

Dieser Artikel nimmt am Schreibwettbewerb teil. Bitte hilf mit, ihn zu verbessern!