Suchmaschine

Eine Suchmaschine ist ein Programm zur Recherche von Dokumenten, die in einem Computer oder einem Computernetzwerk wie z.B. dem World Wide Web gespeichert sind. Nach Eingabe einer Suchanfrage - bestehend aus Schlagwoertern und der Art ihrer logischen Verknüpfung - liefert eine S. eine Liste von Verweisen auf relevante Dokumente oder Webseiten, meist dargestellt mit Titel und einem kurzen Auszug des jeweiligen Dokuments.

Im Gegensatz zu gelegentlich vom Begriff der Suchmaschine miterfassten Such-Kataloge wie z.B. Yahoo!), die Dokumente hierarchisch in einem Inhaltsverzeichnis nach Themen organisieren, ist die Recherche mit S. im eigentlichen Sinne (z.B. Altavista, Google, Fireball) nach Schlagworten bzw. Suchbegriffen organisiert.

Die zur Suche noetige Datenbasis gewinnen Suchmaschinen meist durch automatisierten Abruf und Indexierung einer großen Anzahl von Webseiten sowie Verfolgung der darin enthaltenen Verweise, d.h. Links, oder im Fall von Metasuchmaschinen durch Rueckgriff auf mehrere andere Suchmaschinen.

Die Darstellung der Suchergebnisse geschieht sortiert nach Relevanz, wofür jede Suchmaschine ihre eigenen, geheimen Kriterien heranzieht. Das koennen z.B. Häufigkeit und Stellung der Suchbegriffe im jeweiligen gefundenen Dokument, die Einstufung und Anzahl der zitierten Seiten, sowie die Haeufigkeit von Verweisen anderer Dokumente auf das im Suchergebnis enthaltene Dokument sein.

Manche Suchmaschinen sortieren Suchergebnisse nicht nur nach Relevanz für die Suchanfrage sondern lassen gegen Bezahlung auch Einflussnahme auf ihre Ausgabe zu.

Eine der ersten Suchmaschinen war Lycos, die 1994 als Universitätsprojekt gestartet ist. Vorher gab es schon andere, z.B. Archie oder Veronica, die aber nicht mit einer graphischen Web-Oberfläche ausgestattet waren.

Herausforderungen für Suchmaschinen:

  • Mehrdeutigkeit: Suchanfragen von Benutzern und Inhalte von Webseiten sind häufig unklar und mehrdeutig. Die Suchmaschine muss natürliche Texte zu einem gewissen Grad "verstehen", um relevante Antworten liefern zu können. Idealerweise wird eine Suchmaschine zur Anfrage "Rechner Linux" auch Seiten liefern, die das Wort "Rechner" gar nicht enthalten und statt dessen "Computer" benutzen.
  • Datenmenge: Das Web wächst schneller als die Suchmaschinen mit der derzeitigen Technik indizieren können.
  • Aktualität: Viele Webseiten werden häufig aktualisiert, was die Suchmaschinen zwingt, diese Seiten immer wieder zu besuchen.
  • Spam: Mittels Suchmaschinen-Spamming, d.h. mit unlauteren Methoden (z.B. versteckten Texten und unsichtbaren Links auf der Webseite, automatischen Weiterleitungen von gut platzierten Brückenseiten auf unerwünschte Seiten), versuchen selbsternannte "Suchmaschinen-Optimierer", den Algorithmus einer Suchmaschine, der für die automatische Bewertung und günstige Platzierung von Webseiten in den Ergebnislisten zuständig ist, auszutricksen. Mit anderen Worten: Die Manipulateure versuchen, ihre eigenen Internetseiten (oder die ihrer Kundschaft), die normalerweise nicht unter den besten Ergebnissen einer Suchabfrage angezeigt würden, durch Anwendung diverser Spamming-Methoden in den Ergebnislisten der Suchmaschinen möglichst weit vorn zu platzieren. Dadurch liefert die Suchmaschine auf ihren ersten Ergebnisseiten keine relevanten, vom Surfer gewünschten Resultate mehr, sondern präsentiert dem Internetnutzer die Seiten des Spammers. Die meisten Suchmaschinen versuchen, sich gegen diese Form der Manipulation zu wehren.

Verzeichnisse/Listen von Suchmaschinen

  • Die besten Suchdienste ist eine Auswahl empfehlenswerter Internetsuchdienste der Universitätsbibliothek Karlsruhe
  • klug-suchen.de bietet eine Übersicht über allgemeine, wie auch regional oder thematisch begrenzte Suchmaschinen und Kataloge
  • Suchdienste im Internet gesammelt vom Bibliotheksservice-Zentrum Baden-Württemberg
  • Suchlexikon liefert weitere Informationen zur Vorgehensweise von Suchmaschinen und gibt hilfreiche Recherchetipps
  • Suchdienste-Kompass mit Erläuterungen zu den einzelnen Diensten
  • Statistiken u.a. über die Markanteile der Suchmaschinen

Wichtige allgemeine Suchmaschinen (in Auswahl)

  • Google ist im Moment die bekannteste Suchmaschine, auch für PDF und Postscript geeignet; Beispiel: Suche "Wort" in Wikipedia per Google. Google bietet durch seinen guten Mechanismus eine unendliche Vielzahl von Links zu beinahe jedem Suchwort. Trotzdem findet auch Google nur einen Bruchteil aller Informationen (ca. 1 Prozent), die im Internet vorhanden sind. Teilweise ist es zu einem Sport geworden Worte zu finden zu denen Google nichts oder nur wenige Ergebnisse liefert (Knack den Google). Durch die Dominanz Googles könnte eine Monopolisierung eintreten.
  • Altavista war früher eine der meistgenutzten Suchmaschinen, ist aber seit einigen Jahren durch Google verdrängt worden.
  • Yahoo präsentiert zur Zeit noch Google-Resultate und besitzt einen umfangreichen, thematisch gegliederten Webkatalog, wird aber bald auf Inktomi-Ergebnisse zurückgreifen.
  • Lycos ist auch eine bekannte Suchmaschine, die auf die Daten von Fast/All the Web zurückgreift.
  • Mirago ist eine Suchmaschine, die deutsche Seiten sucht und sehr gute Ergebnisse liefert.
  • Fireball ist eine deutsche Suchmaschine, die auf deutschsprachige Resultate spezialisiert ist, aber in letzter Zeit an Attraktivität eingebüßt hat.
  • Open Directory Project ist ein von ehrenamtlich tätigen Fachleuten erstellter und bearbeiteter Katalog zu den verschiedensten Themen. Eine Suchanfrage liefert zwar nicht sehr viele, dafür aber meistens sehr relevante Resultate zu einem Stichwort.
  • Die Blinde Kuh ist die erste deutschsprachige Suchmaschine für Kinder. Sie ist nichtkommerziell und tritt für ein dezentrales und freies Netz für Kinder ein.

Wichtige spezialisierte Suchmaschinen (in Auswahl)

Suchmaschinen, die gezielt nur bestimmte Themen bearbeiten: