Codecandies

Das Weblog von Nico Brünjes.

Saubere Besucheranalyse mit Piwik

Seit einigen Wochen hört man verstärkt, dass das WordPress-Statistik-Plugin zu fremden Webservern, also noch zu anderen als WordPress.com telefoniert (Perun, WordPress.org Thread). Da mir das nicht passte, habe ich die Statistiken am 20. Januar abgeschaltet.

Vor längerer Zeit schon, am 25.11.2009 (hab’s gerade nachgeschaut), habe ich aufgehört mit Google Analytics Daten sammeln zu lassen. Damals kochte eine Diskussion über die Rechtmäßigkeit der Analyticsnutzung und ich bin der Ansicht: dies ist eine private Seite, da brauche ich solche juristischen Probleme (und sind sie noch so unwirklich) nicht hereinzulassen.

Keine Zahlen sind aber auch keine Lösung, jedenfalls nicht, wenn man wissen will, was auf dem eigenen Blog so abgeht, oder eben auch nicht. In letzter Zeit eher nicht. Trotzdem. Deswegen habe ich nun Piwik auf meinem Webspace installiert. Diese sehr ansehnliche Open-Source-Software macht im Grunde alles, was Google Analytics auch macht, nur mit einem sehr großen Unterschied: es ist nicht Google, sondern es ist (in diesem Fall) Codecandies. Und – nach Aktivierung des entsprechenden Piwik-Plugins – anonymisiert es außerdem die gesammelten IP-Adressen, diese landen also nicht in der Datenbank. Damit sehe ich zwei Hauptforderungen der Datenschützer erfüllt: keine Verbringung der Daten nach USA (dafür sind weiter eure Banken zuständig) bzw. anderes Ausland und Speicherung nur in anonymisierter Form.

Die Installation von Piwik geht leicht von der Hand, die Einbindung des Trackingcodes in das footer-Template war natürlich auch unproblematisch. Der Pagespeed leidet natürlich ein wenig, vor allem im Vergleich zur trackerfreien Zeit. Dafür sind die Statistiken von Piwik nicht nur tres chic, sondern die Software lässt sich mit diversen Plugins noch erweitern (im Prinzip genau wie bei WordPress). Apropos WordPress: es gibt auch ein WordPress-Plugin, dass die Daten im WP-Dashboard anzeigt. Habe ich aber noch nicht getestet. Wie performant Piwik ist, kann ich jetzt noch nicht sagen, ich glaube aber kaum, dass Codecandies soviel Traffic verursacht, dass Piwik oder der Server von Domainfactory (Affiliate Link) an seine Leistungsgrenze gerät. Da aber Webseitenstatistik definitiv eine rechenintensive Angelegenheit ist, kann das für größere Webseiten durchaus ein Problem werden.

Damit bin ich dem Ziel, meine Website in einer Welt der Ads, Like-Buttons und Umfrage-Popups, gegen den Trend datensicher zu machen, ein wenig näher gekommen. Da sind aber noch dunkle Flecken auf der immer weißeren Weste: die drei Bettelbuttons unter jedem Artikel sind natürlich auch kleine Datenkraken. Die werden bei nächster Gelegenheit ausgetauscht. Dann werde ich nochmal eine up-to-date privacy policy erstellen und dort auch das Opt-out des Piwik-Statistiktools einbauen.

8 Kommentare

  1. Für deine Pleasurebuttons: Kein iframe einbinden, so füttert jeder Besucher ungefragt die Kraken. Wenn das ein Link ist, liefern nur die Klicker Daten (Beispiel).

  2. Ja, das ist schon klar. Der flattr-Button kommt so im Moment aus dem entsprechenden WordPress-Plugin, das muss ich einfach abschalten und den entsprechenden statischen Code in die Templates aufnehmen. Schnell gemacht, aber muss eben gemacht werden.

    Für Twitter habe ich eine ähnliche Lösung, hier möchte ich aber wenigsten die bit.ly-API zum Verkürzen der URLs nutzen. Genauso für den Buzz-Button (der erstaunlich gute Ergebnisse liefert, von wg. Buzz wäre tot…).

    Was diesen Lösungen dann fehlt, ist die Rückmeldung, wie oft schon andere geklickt haben. Bei Twitter ist das eher eine schnelle Info für mich, beim flattr-Button ist es glaube ich allerdings irgendwie ein Verkaufsargument, wenn schon viele geflattrt haben. Schad drum. ;) Wie aber versprochen: kommt demnächst hier.

  3. Ja, Piwik ist cool! Schön, daß man einen Haufen Seiten mit einer Piwik-Installation erfassen kann. Und bisher ist die DF bei mir (zähle vier Seiten damit, eine etwas größere) noch nicht an irgendwelche Grenzen gestoßen…

  4. Tue dir einen Gefallen und teste bitte nie die API von Piwik. Die nutze ich aktuell noch, um auf t3n rechts in der Sidebar die Top 5 Artikel anzuzeigen.
    Die API von Pikwik ist grottenschlecht und unlogisch. Du kannst nicht einfach mal dir die Top 5 aus dem Bereich x geben lassen, sondern musst erstmal nach dem Bereich x suchen und dir die „tagesaktuelle“ ID geben lassen (sie sich unlogischerweise natürlich immer ändert). Erst dann kannst du mit einem zweiten API-Call die Ergebnisse ermitteln. Aber auch das ist mehr Schmerz als Freude.
    In der Summe schalten wir Piwik demnächst wieder ab und stellen auf die Google Analytics API um, damit wir endlich richtige Ergebnisse bekommen.

  5. Man könnte sich evtl. (kenne die APIs nicht) nur bei jedem Klick die Zahlen holen? Oder einfach selber die Klicks mitzählen ;-) Ok, nicht ganz trivial (jeder nur einen Keks…).

  6. Piwik habe ich seit einem Monat im Einsatz und freu mich täglich, dass es fast so gut ist wie Google Analytics, ohne die Besucherdaten auszuliefern.
    Allein: Mit der Opt-out-Option hadere ich. Konsequent müsste man sie eigentlich auf jeder Seite unterbringen, nicht nur beim Datenschutz-Hinweis. Ästhetisch bringe ich das nicht übers Herz.
    Und das Anonymisierungs-Plugin kann ja auch erst wirken, nachdem die IP bereits in den Logfiles des Servers vermerkt ist.

  7. Was das Opt-Out angeht, tut’s IMO auch ein Link auf die Datenschutzerklärung inkl. Opt-Out-Möglichkeit, bspw. im Footer.

  8. Es gibt auch ein Tool zur Migration von Daten aus Google Analytics zu Piwik -- Google2Piwik. Wir entwickeln die in meiner Firma -- Clearcode ;)