Homepage     Computerstoff (Hauptseite) [english] [français]

RGXStat

zur zeitlichen Auswertung von HTTP-logs

Download

rgxstat-0.43.tgz (77K) [Der ausführbare Code ist gestrippt ca. 90K groß. Das Paket enthält die sourcen und Dokumentation in Englisch und teilweise in Deutsch.]

rgxstat-0.20.tgz (55K) [Der ausführbare Code ist gestrippt ca. 80K groß. Das Paket enthält die sourcen und html-Dokumentation in Englisch und Deutsch.]

(benötigt die Standard-Include-Dateien. Außerdem GTK. Extrem sinnvoll wären außerdem die GNU plotutils (s.u.).)


Beschreibung

RGXStat ist ein Programm, welches dazu gedacht ist, die zeitlichen Veränderungen bei den Zugriffen auf einzelne Teile einer Homepage zu verfolgen, so daß man sie miteinander vergleichen kann. Was damit gemeint ist, sieht man vielleicht am besten an zwei Beispielen:

Statistik 1

Auf diesem Bild sieht man die Anzahl der Zugriffe auf html-Dateien in einzelnen Unterbereichen meiner Homepage seitdem sie Mitte 2000 auf eine eigene Domain gezogen ist, bis zum Ende des Jahres 2001, aufgeschlüsselt nach Wochen. Der Rückgang auf null Zugriffe Anfang 2001 ist ein Artefakt des Programmes, vermutlich entstanden durch Wochen am Anfang oder Ende des Jahres, die aus weniger als 7 Tagen bestehen.

Statistik 2

Dieses Bild zeigt Zugriffe auf unterschiedliche Dateiarten aufgeschlüsselt nach der Uhrzeit des Zugriffs. Man kann gut erkennen, daß jede meiner html-Dateien im Durchschnitt rund 1,5 jpg-Dateien nachlädt. In der Nacht dagegen dominiert das "Hintergrund-Rauschen" der Suchmaschinen, die nur html-Dateien abrufen.

Zwei oder drei weitere Statistiken kann man auf der Seite mit zusätzlichen Statistiken sehen.

Die Angabe der zu untersuchenden Bereiche erfolgt mit Hilfe von regulären Ausdrücken. Im zweiten Fall beispielsweise wurden \.html, \.jpg usw. verwendet. Zusätzlich können aus reguläre Ausdrücke für den Referrer, den Browser, die Domain usw. angegeben werden, so daß sich beispielsweise alle Zugriffe von Netscape-Benutzern herausfiltern lassen, die von google kommen (oder ähnliche Sachen). Die Einstellung der Zeitschritte, über die das Programm die Zugriffe summieren soll, ist nicht so flexibel, dafür aber auch einfacher. Auch das vom Server verwendete Log-Format muß man dem Programm mit Hilfe eines modifizierten regulären Ausdrucks mitteilen. Man sollte sich also einigermaßen mit regulären Ausdrücken auskennen: Die Benutzung dieses Programmes ist nicht einfach.

Grafische Ausgaben wie oben werden vom Programm mit Hilfe der libplot, einer Bibliothek, die zu den GNU plotutils gehört, erstellt. Alternativ kann man vom Programm html-Code oder ascii-Text ausgeben lassen. Html funktioniert allerdings nur unzureichend, da ich schon länger nicht mehr damit gearbeitet habe. Ich würde davon abraten. Die ascii-Ausgabe ist im wesentlichen als Eingabe für andere Programme gedacht.

Außerdem enthält das Paket vier weitere ausführbare Programme, die ohne GUI laufen. Eines sucht aus den Log-Daten Suchbegriffe heraus, die auf bestimmte Seiten geführt haben. Ein anderes gibt eine baumartige Struktur als ascii-art aus, die zeigt, welche Bereiche einer Homepage häufiger oder seltener zusammen mit welchen anderen Bereichen besucht werden. (Also eine Art Verwandtschafts-Diagramm.) Das dritte listet referrer auf. Das letzte schließlich dient als Filter für die beiden anderen.

Im Augenblick läßt sich das Programm noch nicht installieren, sondern lediglich im Verzeichnis compilieren und dann ausführen.

Copyright

Die Programmteile von mir stehen unter der BSD-Lizenz. Da aber die GNU plotutils unter GPL stehen, müssen abgeleitete Programme, die diese ebenfalls benutzen, ebenfalls unter GPL stehen. Man kann RGXStat auch ohne libplot compilieren. In diesem Fall hat man dann natürlich keine grafischen Ausgaben mehr.

Systemvoraussetzungen

Das Programm läuft auf meinen Linux-Kisten (SuSE-6.4 und 7.0) und läßt sich mit dem gcc übersetzen. Die GUI benutzt GTK, das Programm läßt sich aber auch ohne GUI compilieren. Für grafische Ausgaben wird die libplot aus den GNU plotutils benötigt. Diese werden zwar bei den meisten Linux-Distributionen mitgeliefert, werden aber meist nicht defaultmäßig installiert.


Homepage     Computerstoff (Hauptseite) by Michael Becker, 12/2001. Letzte Änderung 11/2002