„Webalizer“ – Versionsunterschied

[ungesichtete Version][Sichtung ausstehend]
Inhalt gelöscht Inhalt hinzugefügt
Ebcdic (Diskussion | Beiträge)
erg. und übertragen aus en-wp en:Webalizer, Stand: 27. Januar 2008, 18h44, Quellen und Autoren siehe dort, geht gleich weiter....
Die Domain webalizer.net steht zum Verkauf :(
 
(66 dazwischenliegende Versionen von 53 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
<noinclude>{{Löschantragstext|tag=9|monat=April|jahr=2008|titel=Webalizer}}''Logdateinanalysetool., reißt [[WP:RSW]]'' [[Benutzer:Syrcro|sугсго]][[Benutzer:Syrcro/roter Punkt|.]]<small>[[Benutzer Diskussion:Syrcro|PEDIA]]</small> 13:23, 9. Apr. 2008 (CEST)


{{Infobox Software
----</noinclude>
|Screenshot =
{{Infobox_Software
|Beschreibung =
|Name= Webalizer
|Hersteller = Bradford L. Barrett
|Screenshot=[[Bild:Webalizer daily usage 20061014 for movingtofreedom dot org.png]]
|AktuelleVersion = <!-- Wikidata -->
|Beschreibung=Beispiel einer Webalizer Grafik
|AktuelleVersionFreigabeDatum = <!-- Wikidata -->
|Hersteller=
|Betriebssystem = [[Plattformunabhängigkeit|plattformunabhängig]]
|AktuelleVersion=
|Programmiersprache = [[C (Programmiersprache)|C]]
|AktuelleVersionFreigabeDatum= 2002
|Kategorie = [[Statistik-Software]]
|Betriebssystem=
|Lizenz = [[GNU General Public License|GPL]] ([[Freie Software]])
|Kategorie= [[Statistik-Software]]
|Deutsch = ja
|Lizenz= [[GNU General Public License|GPL]]
|Deutsch=
|Website=
}}
}}


'''Webalizer''' ist eine [[Freie Software|freie]] [[Web Analytics|Web-Analytics]]-Software, die mit [[Logdateianalyse]] arbeitet und unter der [[GNU General Public License|GPL]] steht.
Beim '''Webalizer''' handelt es sich um eine [[GNU General Public License|GPL]]-Applikation, die mittels Auswertung von Zugriffs- und Auslastungs-Logdateien Website-Analysen erstellt ([[Logdateianalyse]]). Der Webalizer ist auch heute noch ein beliebtes Webserver-Administrations-Tool. Angeregt wurde das Projekt im Jahre 1997 durch Bradford L. Barrett. Die vom Webalizer generierten Statistiken enthalten üblicherweise folgende Informationen: Anfragen, Besuche, Verweise, Länder der Besucher und heruntergeladene Datenmenge. Diese Statistiken können sowohl grafisch als auch textuell betrachtet werden und sind auf unterschiedlichen Zeitskalen (Stunden, Tage, Monate, Jahre) dargestellt.
Angeregt wurde das Projekt im Jahre 1997 durch Bradford L. Barrett. Die vom Webalizer generierten Statistiken enthalten üblicherweise folgende Informationen: Anfragen, Besuche, Verweise, Länder der Besucher und Menge der ausgelieferten Daten. Diese Statistiken können sowohl grafisch als auch textuell betrachtet werden und sind auf unterschiedlichen Zeitskalen (Stunden, Tage, Monate, Jahre) dargestellt.


== Übersicht ==
== Übersicht ==
Die Logdateianalyse einer Webseite wird durch Gruppierung und Zusammenfassung verschiedener, vom Webserver während des Benutzerzugriffs auf die Webseite in Logfiles aufgezeichneten Daten erzeugt. Dabei werden meistens die folgenden Parameter verwendet und ausgewertet:
Die Protokolldateianalyse einer Webseite wird durch Gruppierung und Zusammenfassung verschiedener, vom Webserver während des Benutzerzugriffs in Protokolldateien aufgezeichneter Daten erzeugt. Dabei werden meistens die folgenden Parameter verwendet und ausgewertet:

; URL
; URL
* Ein [[Uniform Resource Locator]] (URL) bezeichnet eindeutig die vom Browser des zugreifenden Nutzers angeforderten Daten.
: Ein [[Uniform Resource Locator]] (URL) bezeichnet eindeutig die vom Browser des zugreifenden Nutzers angeforderten Daten.
; Hit
: Jeder [[Hypertext Transfer Protocol|HTTP]]-Zugriff durch den Webbrowser des Nutzers wird als ein Hit bzw. Zugriff gezählt. Dabei können HTTP-Zugriffe auch für nicht vorhandene Inhalte anfallen, die aber trotzdem als Zugriff mitgezählt werden. Wenn beispielsweise eines von fünf durch den Webbrowser des Nutzers angeforderten Bildern fehlt, zählt der Webserver trotzdem sechs Zugriffe (Hits), von denen fünf als erfolgreich (die [[Hypertext Markup Language|HTML]]-Datei und vier Bilder) und einer als fehlgeschlagener Zugriff (der für das fehlende Bild) aufgezeichnet werden.


== Auswertungen ==
; Hit
[[Datei:Referrer spam in Webalizer.png|mini|Auswertung mit [[Referrer-Spam]] in Webalizer]]
* Jeder [[HTTP]]-Zugriff durch den Webbrowser des Nutzers wird als ein Hit bzw. Zugriff gezählt. Dabei können HTTP-Zugriffe auch für nicht vorhandene Inhalte anfallen, die aber trotzdem als Zugriff mitgezählt werden. Wenn beispielsweise eines von fünf durch den Webbrowser des Nutzers angeforderten Bildern fehlt, zählt der Webserver trotzdem sechs Zugriffe (Hits), von denen fünf als erfolgreich (die [[HTML]]-Datei und vier Bilder) und einer als fehlgeschlagener Zugriff (der für das fehlende Bild) aufgezeichnet werden.
Webalizer produziert standardmäßig zwei verschiedene Auswertungen, einen Jahresüberblick und eine detaillierte Monatsauswertung für jeden ausgewerteten Monat.
<!--
<dl>
<dt>URL</dt>
<dd><p>A Uniform Resource Locator ([[Uniform Resource Locator|URL]]) uniquely identifies the resource requested by the user's browser.</p></dd>


Der Jahresüberblick enthält Informationen über die Anzahl von Seitenzugriffen (hits), Datei- und Seitenabrufe (file and page requests), zugreifende Rechner (hosts) sowie die Anzahl ihrer Zugriffe (visits), sowie den täglichen Durchschnitt dieser Werte für jeden Monat. Zu der Auswertung gehört auch eine graphische Jahreszusammenfassung.
<dt>Hit</dt>
<dd><p>Each [[HTTP]] request submitted by the browser is counted as one hit. Note that HTTP requests may be submitted for non-existent content, in which case they still will be counted. For example, if one of the five image files referred by the example page mentioned above is missing, the web server will still count six HTTP requests, but in this case, five will be marked as successful (one [[HTML]] file and four images) and one as a failed request (the missing image)</p></dd>


Jede der Monatsauswertungen wird als einzelne HTML-Seite aufgebaut, die zum einen eine monatliche Übersicht der genannten Werte (Gesamtanzahl der Hits, File/Page Requests, Visits, Hosts etc.), zum anderen eine tägliche Zusammenfassung dieser Werte für jeden Tag des Monats, eine stundenweise Zusammenfassung für jede Stunde jedes Tages, eine Übersicht nach den abgerufenen Seiten mit ihrer [[Uniform Resource Locator|URL]], eine nach ihrer [[IP-Adresse]] gegliederte Übersicht der zugreifenden Rechner, eine Übersicht über Anfangs- und Ausstiegs-URL, aus der die am meisten verwendeten Einstiegs- und End-URLs des Servers ersichtlich sind, eine Referrer-Übersicht, aus der die URLs der Seiten zu ersehen sind, von denen aus der Zugriff bzw. die Weiterleitung erfolgt ist, eine Übersicht über die verwendeten Suchbegriffe, eine Übersicht über die für den Zugriff verwendeten Webbrowser sowie eine Übersicht über die Länder, aus denen der Zugriff auf die Webseiten erfolgt ist.
<dt>Page</dt>
<dd><p>A page is a successful HTTP request for a resource that constitutes primary website's content. Pages are usually identified by a file extension (e.g. .html, .php, .asp, etc) or by a missing extension, in which case the subject of the HTTP request is considered a directory and the default page for this directory is served.</p></dd>


Jede der vorstehend beschriebenen Standard-HTML-Auswertungen benennt die zwanzig häufigsten Einträge für jeden auszuwertenden Parameter, beispielsweise die zwanzig am häufigsten aufgerufenen Seiten (URLs). Die Zahl der tatsächlich aufgeführten Zeilen in jeder dieser Auswertungen lässt sich über die Konfiguration beeinflussen. Webalizer lässt sich auch so konfigurieren, dass er separate Auswertungen für jeden Parameter erzeugt, die beispielsweise jeden einzelnen Nutzer der Website oder alle angeforderten URL-Adressen aufführen.
<dt>File</dt>
<dd><p>Each successful HTTP request is counted as a file.</p></dd>


Zusätzlich zu den in HTML generierten Berichten kann der Webalizer auch so konfiguriert werden, dass er durch Kommata begrenzte Dateien ([[CSV (Dateiformat)|CSV]]) erzeugt, die alle in einem Bericht verwendeten Daten in reiner Textform enthalten. Diese Dateien kann man in Tabellenkalkulationsprogramme oder Datenbanken einlesen und dort weiter auswerten.
<dt>Visitor</dt>
<dd><p>A visitor is the actual person browsing the website. A typical website serves content to anonymous visitors and cannot associate visitors with the actual person browsing the website. Visitor identification may be based on their [[Internet Protocol|IP]] address or an [[HTTP cookie]]. The former approach is simple to implement, but results in all visitors browsing the same website from behind a firewall counted as a single visitor. The latter approach requires special configuration of the web server (i.e. to log HTTP cookies) and is more expensive to implement. Note that neither of the approaches identifies the actual person browsing the website and neither provides 100% accuracy in determining that the same visitor has visited the website again.</p></dd>


== Sprachunterstützung ==
<dt>Visit</dt>
Statistische Auswertungen in HTML können in mehr als 30 Sprachen erzeugt werden, dazu gehören: Vereinfachtes Chinesisch, Dänisch, Deutsch, Englisch, Estnisch, Finnisch, Französisch, Galicisch, Griechisch, Indonesisch, Isländisch, Italienisch, Japanisch, Katalanisch, Koreanisch, Kroatisch, Litauisch, Malaiisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch (auch für Brasilien), Rumänisch, Russisch, Schwedisch, Serbisch, Slowakisch, Slowenisch, Spanisch, Tschechisch, Türkisch, Ukrainisch, Ungarisch.
<dd><p>A visit is a series of HTTP requests submitted by a visitor with the maximum time between requests not exceeding a certain amount configured by the webmaster, which is typically set at 30 minutes. For example, if a visitor requested page A, then in 10 minutes page B and then in 40 minutes page C, then this visitor has generated two visits, one when pages A and B were requested and another when the page C was requested.


Um Berichte in einer anderen Sprache zu erzeugen, muss ein spezielles Webalizer Binary für diese Sprache kompiliert werden.
<dt>Host</dt>
<dd><p>In general, a host is the visitor's machine running the browser. Hosts are often identified by IP addresses or domain names. Those web traffic analysis tools that use IP addresses to identify visitors use the words hosts, domain names and IP addresses interchangeably.</p></dd>


== Kritikpunkte ==
<dt>User Agent</dt>
* Die erzeugten Statistiken unterscheiden nicht zwischen menschlichen Nutzern einer Website und automatisierten Zugriffen, beispielsweise durch Suchmaschinenroboter. Die daraus resultierenden Berichte weisen dann natürlich zu hohe Zugriffszahlen aus, verglichen mit den nur durch menschliche Nutzer erzeugten Zugriffen.
<dd><p>User agent is a synonym for a web browser.</p></dd>
* Die ausgewiesenen Zugriffszahlen werden auch durch Downloadmanager verfälscht, die die Downloads von der Website in Teilen vornehmen. Jeder Zugriff mit dem [[HTTP-Statuscode#g2xx|Status 206]] „Partial Content“ wird als separater Zugriff gezählt.
</dl>
* Es gab bis zur Version 2.20 keine Auswertung für Abfragebegriffe (query); dynamisch erzeugte Webseiten, z.&nbsp;B. [[PHP]]-Seiten mit Argumenten, können dann nicht separat ausgewiesen werden. Ab Version 2.20 ist es mit ''StripCGI'' und ''DefaultIndex'' möglich, diese separat auflisten zu lassen.


== Alternativen ==
In order to illustrate the difference between hits, pages and files, let's consider a user requesting an HTML file referring to five images, one of which is missing. In this case the web server will log six hits (i.e. one successful for the HTML file itself and four for successfully retrieved images and one for the missing image), five files (i.e. five successful HTML requests) and one page (i.e. the HTML file).
* [[AWStats]]

* [[Matomo]] (ehemals [[Piwik]])
== Log File Types ==
* [[Analog (Web Analytics)|Analog]]

The Webalizer analyzes web server log files, extracting such items as client's IP addresses, URL paths, processing times, user agents, referrers, etc and grouping them in order to produce HTML reports.

Web servers log HTTP traffic using different file formats. Most popular file formats are [[Common Log Format|CLF]], the [http://httpd.apache.org/docs/2.2/mod/mod_log_config.html#formats Apache Custom Log Format] and [http://www.w3.org/TR/WD-logfile.html W3C Extended Log File Format]. CLF is the less informative log format and should be used only when there are no other options. An example of a CLF log line is shown below.

<pre>192.168.1.20 - - [26/Dec/2006:03:09:16 -0500] "GET HTTP/ 1.1" 200 1774</pre>

Apache Custom Log Format can be customized to log most HTTP parameters, including request processing time and the size of the request itself. The format of a custom log is controlled by the format line. A typical Apache log format configuration is shown below.

<pre>LogFormat "%a %l \"%u\" %t %m \"%U\" \"%q\" %p %>s %b %D \"%{Referer}i\" \"%{User-Agent}i\"" my_custom_log
CustomLog logs/access_log my_custom_log</pre>

Microsoft's Internet Information Services (IIS) web server logs HTTP traffic in W3C Extended Log File Format. Similarly to Apache Custom Log format, IIS logs may be configured to capture such extended parameters as request processing time. W3C extended logs may be recognized by the presence of one or more format lines, such as the one shown below.

<pre>#Fields: date time s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) cs(Referer) sc-status sc-bytes cs-bytes time-taken</pre>

The original version of The Webalizer can process CLF log files, as well as [[HTTP proxy]] log files produced by [[Squid cache|Squid]] servers. Other log file formats are usually converted to CLF in order to be analyzed. Some of the forks listed in the External Links section below are capable of processing IIS and Apache log files without having to convert them to CLF first.

== Command Line ==

The Webalizer is a command line application and is launched from the [[Operating System|OS]] shell prompt. A typical command is shown below.

<pre>webalizer -p -F clf -n en.wikipedia.org -o reports logfiles/access_log</pre>

This command instructs The Webalizer to analyze the log file access_log, run in the incremental mode (-p), interpret the log as a CLF log file (-F), use the domain name en.wikipedia.org for report links (-n) and produce the output subdirectory of the current directory.

Use the -h option to see the complete list of command line options.

== Configuration ==

Besides the command line options, The Webalizer may be configured through parameters of a configuration file. By default, The Webalizer reads the file webalizer.conf and interprets each line as a processing instruction. Alternatively, a user-specified file may be provided using the -c option.

For example, if the webmaster would like to ignore all requests made from a particular group of hosts, he or she can use the IgnoreSite parameter to discard all log records with the IP address matching the specified pattern:

<pre>IgnoreSite 192.168.0.*</pre>

There are over one hundred available configuration parameters, which make The Webalizer a highly-configurable web traffic analysis application. For a complete list of configuration parameters please refer to the README file shipped with every source or binary distribution.

== Reports ==

By default, The Webalizer produces two kinds of reports - a yearly summary report and a detailed monthly report, one for each analyzed month.

The yearly summary report provides such information as the number of hits, file and page requests, hosts and visits, as well as daily averages of these counters for each month. The report is accompanied by a yearly summary graph.

Each of the monthly reports is generated as a single HTML page containing a monthly summary report (listing the overall number of hits, file and page requests, visits, hosts, etc), a daily report (grouping these counters for each of the days of the month), an aggregated hourly report (grouping counters for the same hour of each day together), a URL report (grouping collected information by URL), a host report (by IP address), website entry and exit URL reports (showing most common first and last visit URLs), a referrer report (grouping the referring third-party URLs leading to the analyzed website), a search string report (grouping items by search terms used in such search engines as Google), a user agent report (grouping by the browser type) and a country report (grouping by the host's country of origin).

Each of the standard HTML reports described above lists only top entries for each item (e.g. top 20 URLs). The actual number of lines for each of the reports is controlled by configuration. The Webalizer may also be configured to produce a separate report for each of the items, which will list every single item, such as all website visitors, all requested URLs, etc.

In addition to HTML reports, The Webalizer may be configured to produce comma-delimited dump files, which list all of the report data in a plain-text file. Dump files may be imported to spreadsheet applications or databases for further analysis.

== Internationalization ==

HTML reports may be produced reports in over 30 languages, including Catalan, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, Galician, German, Greek, Hungarian, Icelandic, Indonesian, Italian, Japanese, Korean, Latvian, Malay, Norwegian, Polish, Portuguese, Portuguese (Brazil), Romanian, Russian, Serbian, Simplified Chinese, Slovak, Slovene, Spanish, Swedish, Turkish, Ukrainian.

To generate reports in an alternate language requires a separate webalizer binary compiled specifically for that language.
-->
== Kritikpunkte ==
* Die Entwicklung des Webalizers wurde 2002 eingestellt, es gibt allerdings verschiedene weiterentwickelte Versionen der Software von anderen Herstellern.
* Die erzeugten Statistiken unterscheiden nicht zwischen menschlichen Nutzern einer Website und automatisierten Zugriffen beispielsweise durch Suchmaschinenroboter. Die daraus resultierenden Berichte weisen dann natürlich zu hohe Zugriffszahlen aus, verglichen mit den nur durch menschliche Nutzer erzeugten Zugriffen.
* Die ausgewiesenen Zugriffszahlen werden auch durch Downloadmanager verfälscht, die die Downloads von der Website in Teilen vornehmen. Jeder Zugriff mit dem Status 206 "Partial Content" wird als separater Zugriff gezählt.
* Es gibt keine Auswertung für Abfragebegriffe, dynamisch erzeugte Webseiten, z.B. PHP-Seiten mit Argumenten, können nicht separat ausgewiesen werden.


== Weblinks ==
== Weblinks ==
* [http://www.mrunix.net/webalizer/ Webalizer] (wird seit 2002 nicht mehr weiterentwickelt)
* [http://www.tobias-schwarz.net/webalizer_gui.html Webalizer GUI], [[grafische Benutzeroberfläche]] für den Webalizer
* [http://www.stedee.id.au/awffull/ AWFFull] (Weiterentwicklung des ursprünglichen Webalizer mit Segmentierung, Anzeige von mehr als 12 Monaten, via CSS anpassbar, automatische Identifizierung des Log-Formats)
* [http://www.tobias-schwarz.net/webalizer_gui.html Webalizer GUI] [[Grafische Benutzeroberfläche]] für den Webalizer
* [http://www.patrickfrei.ch/webalizer/ Webalizer Xtended] (Weiterentwicklung des ursprünglichen Webalizer mit zahlreichen Erweiterungen und Verbesserungen wie beispielsweise [[Toter_Link|HTTP-404]]-Statistik, [[HTTP-Statuscodes|HTTP-Statuscode]]-Grafik, benutzerdefinierbare Farben für die generierten Statistiken, [[GeoIP]], Sicherheits-Bugfixes und vielem mehr)
* [http://www.patrickfrei.ch/webalizer/ Webalizer Xtended] (Weiterentwicklung des ursprünglichen Webalizer mit zahlreichen Erweiterungen und Verbesserungen wie beispielsweise [[Toter Link|HTTP-404]]-Statistik, [[HTTP-Statuscode]]-Grafik, benutzerdefinierbare Farben für die generierten Statistiken, [[Geotargeting|GeoIP]], Sicherheits-Bugfixes und vielem mehr)
* [http://www.stonesteps.ca/projects/webalizer/ Stone Steps Webalizer] (Weiterentwicklung des ursprünglichen Webalizer mit einem überarbeiteten Layout der erzeugten HTML-Seiten, Sicherheits-Bugfixes sowie zahlreichen Erweiterungen wie z.B. HTTP-404-Statistik, benutzerdefinierbaren Farben und vielem mehr)
* [http://www.stonesteps.ca/projects/webalizer/ Stone Steps Webalizer] (Weiterentwicklung des ursprünglichen Webalizer mit einem überarbeiteten Layout der erzeugten HTML-Seiten, Sicherheits-Bugfixes sowie zahlreichen Erweiterungen wie z.&nbsp;B. HTTP-404-Statistik, benutzerdefinierbaren Farben und vielem mehr)
* [http://weprog.awardspace.com/webalizer/ Wie eine Webalizer Statistik interpretiert wird (auf awardspace.com), (engl.)]

<!--
* [http://www.mrunix.net/webalizer/simpleton.html Simpletons Guide to Web Server Analysis] ("This guide is intended to provide the necessary background and insight to how web server analysis works . . ")
* [http://www.daydream.co.uk/webalizer_guide.asp Webalizer User Guide] (A non-technical guide aimed at marketers that explains how to interpret webalizer reports.)
* [http://www.ipligence.com/community/ IPligence Community Edition] (Free ip-location database for Webalizer.)
* Forks
** [http://www.stedee.id.au/awffull AWFFull] (adding new features and algorithms)
** [http://www.patrickfrei.ch/webalizer/ Webalizer Xtended] (with additional features as e.g. HTTP-404-error statistics, user definable colors for all statistics and several security bugfixes)
** [http://www.nayxx.com/~jmichel/webalizer/ Webalizer Teria]
** [http://wiki.bennington.edu/wiki/Webalizer Bennington College Webalizer] Classic Webalizer that adds detailed hit pages to several of the reports.
** [http://sysd.org/stas/node/10 Geolizer] ([http://www.maxmind.com/app/ip-location MaxMind GeoIP]-based geographic statistics, country flag pictures, human-readable transfer size display and [[MinGW]]/[[MSYS]] [[Windows]] port)
** [http://www.projet-webdruid.org Webdruid] (The Webalizer brother.)
-->


== Einzelnachweise ==
[[Kategorie:Freie Software]]
<references />
[[Kategorie:Statistik-Software]]


[[Kategorie:Freie Statistik-Software]]
[[en:Webalizer]]
[[fr:Webalizer]]
[[it:Webalizer]]
[[pl:Webalizer]]
[[ru:Webalizer]]

Aktuelle Version vom 9. Juli 2024, 08:43 Uhr

Webalizer
Basisdaten

Entwickler Bradford L. Barrett
Erscheinungsjahr 1997
Aktuelle Version 2.23-08[1]
(26. August 2013)
Betriebssystem plattformunabhängig
Programmier­sprache C
Kategorie Statistik-Software
Lizenz GPL (Freie Software)
deutschsprachig ja
webalizer.net

Webalizer ist eine freie Web-Analytics-Software, die mit Logdateianalyse arbeitet und unter der GPL steht. Angeregt wurde das Projekt im Jahre 1997 durch Bradford L. Barrett. Die vom Webalizer generierten Statistiken enthalten üblicherweise folgende Informationen: Anfragen, Besuche, Verweise, Länder der Besucher und Menge der ausgelieferten Daten. Diese Statistiken können sowohl grafisch als auch textuell betrachtet werden und sind auf unterschiedlichen Zeitskalen (Stunden, Tage, Monate, Jahre) dargestellt.

Übersicht

Die Protokolldateianalyse einer Webseite wird durch Gruppierung und Zusammenfassung verschiedener, vom Webserver während des Benutzerzugriffs in Protokolldateien aufgezeichneter Daten erzeugt. Dabei werden meistens die folgenden Parameter verwendet und ausgewertet:

URL
Ein Uniform Resource Locator (URL) bezeichnet eindeutig die vom Browser des zugreifenden Nutzers angeforderten Daten.
Hit
Jeder HTTP-Zugriff durch den Webbrowser des Nutzers wird als ein Hit bzw. Zugriff gezählt. Dabei können HTTP-Zugriffe auch für nicht vorhandene Inhalte anfallen, die aber trotzdem als Zugriff mitgezählt werden. Wenn beispielsweise eines von fünf durch den Webbrowser des Nutzers angeforderten Bildern fehlt, zählt der Webserver trotzdem sechs Zugriffe (Hits), von denen fünf als erfolgreich (die HTML-Datei und vier Bilder) und einer als fehlgeschlagener Zugriff (der für das fehlende Bild) aufgezeichnet werden.

Auswertungen

Auswertung mit Referrer-Spam in Webalizer

Webalizer produziert standardmäßig zwei verschiedene Auswertungen, einen Jahresüberblick und eine detaillierte Monatsauswertung für jeden ausgewerteten Monat.

Der Jahresüberblick enthält Informationen über die Anzahl von Seitenzugriffen (hits), Datei- und Seitenabrufe (file and page requests), zugreifende Rechner (hosts) sowie die Anzahl ihrer Zugriffe (visits), sowie den täglichen Durchschnitt dieser Werte für jeden Monat. Zu der Auswertung gehört auch eine graphische Jahreszusammenfassung.

Jede der Monatsauswertungen wird als einzelne HTML-Seite aufgebaut, die zum einen eine monatliche Übersicht der genannten Werte (Gesamtanzahl der Hits, File/Page Requests, Visits, Hosts etc.), zum anderen eine tägliche Zusammenfassung dieser Werte für jeden Tag des Monats, eine stundenweise Zusammenfassung für jede Stunde jedes Tages, eine Übersicht nach den abgerufenen Seiten mit ihrer URL, eine nach ihrer IP-Adresse gegliederte Übersicht der zugreifenden Rechner, eine Übersicht über Anfangs- und Ausstiegs-URL, aus der die am meisten verwendeten Einstiegs- und End-URLs des Servers ersichtlich sind, eine Referrer-Übersicht, aus der die URLs der Seiten zu ersehen sind, von denen aus der Zugriff bzw. die Weiterleitung erfolgt ist, eine Übersicht über die verwendeten Suchbegriffe, eine Übersicht über die für den Zugriff verwendeten Webbrowser sowie eine Übersicht über die Länder, aus denen der Zugriff auf die Webseiten erfolgt ist.

Jede der vorstehend beschriebenen Standard-HTML-Auswertungen benennt die zwanzig häufigsten Einträge für jeden auszuwertenden Parameter, beispielsweise die zwanzig am häufigsten aufgerufenen Seiten (URLs). Die Zahl der tatsächlich aufgeführten Zeilen in jeder dieser Auswertungen lässt sich über die Konfiguration beeinflussen. Webalizer lässt sich auch so konfigurieren, dass er separate Auswertungen für jeden Parameter erzeugt, die beispielsweise jeden einzelnen Nutzer der Website oder alle angeforderten URL-Adressen aufführen.

Zusätzlich zu den in HTML generierten Berichten kann der Webalizer auch so konfiguriert werden, dass er durch Kommata begrenzte Dateien (CSV) erzeugt, die alle in einem Bericht verwendeten Daten in reiner Textform enthalten. Diese Dateien kann man in Tabellenkalkulationsprogramme oder Datenbanken einlesen und dort weiter auswerten.

Sprachunterstützung

Statistische Auswertungen in HTML können in mehr als 30 Sprachen erzeugt werden, dazu gehören: Vereinfachtes Chinesisch, Dänisch, Deutsch, Englisch, Estnisch, Finnisch, Französisch, Galicisch, Griechisch, Indonesisch, Isländisch, Italienisch, Japanisch, Katalanisch, Koreanisch, Kroatisch, Litauisch, Malaiisch, Niederländisch, Norwegisch, Polnisch, Portugiesisch (auch für Brasilien), Rumänisch, Russisch, Schwedisch, Serbisch, Slowakisch, Slowenisch, Spanisch, Tschechisch, Türkisch, Ukrainisch, Ungarisch.

Um Berichte in einer anderen Sprache zu erzeugen, muss ein spezielles Webalizer Binary für diese Sprache kompiliert werden.

Kritikpunkte

  • Die erzeugten Statistiken unterscheiden nicht zwischen menschlichen Nutzern einer Website und automatisierten Zugriffen, beispielsweise durch Suchmaschinenroboter. Die daraus resultierenden Berichte weisen dann natürlich zu hohe Zugriffszahlen aus, verglichen mit den nur durch menschliche Nutzer erzeugten Zugriffen.
  • Die ausgewiesenen Zugriffszahlen werden auch durch Downloadmanager verfälscht, die die Downloads von der Website in Teilen vornehmen. Jeder Zugriff mit dem Status 206 „Partial Content“ wird als separater Zugriff gezählt.
  • Es gab bis zur Version 2.20 keine Auswertung für Abfragebegriffe (query); dynamisch erzeugte Webseiten, z. B. PHP-Seiten mit Argumenten, können dann nicht separat ausgewiesen werden. Ab Version 2.20 ist es mit StripCGI und DefaultIndex möglich, diese separat auflisten zu lassen.

Alternativen

  • Webalizer GUI, grafische Benutzeroberfläche für den Webalizer
  • AWFFull (Weiterentwicklung des ursprünglichen Webalizer mit Segmentierung, Anzeige von mehr als 12 Monaten, via CSS anpassbar, automatische Identifizierung des Log-Formats)
  • Webalizer Xtended (Weiterentwicklung des ursprünglichen Webalizer mit zahlreichen Erweiterungen und Verbesserungen wie beispielsweise HTTP-404-Statistik, HTTP-Statuscode-Grafik, benutzerdefinierbare Farben für die generierten Statistiken, GeoIP, Sicherheits-Bugfixes und vielem mehr)
  • Stone Steps Webalizer (Weiterentwicklung des ursprünglichen Webalizer mit einem überarbeiteten Layout der erzeugten HTML-Seiten, Sicherheits-Bugfixes sowie zahlreichen Erweiterungen wie z. B. HTTP-404-Statistik, benutzerdefinierbaren Farben und vielem mehr)

Einzelnachweise

  1. The Webalizer: Whats New.