Privacyverklaring rudhar.com / rhar.info

24–25 februari 2013

Logging van websitebezoeken

Software en instellingen

De website gebruikt webserversoftware Apache 2.2.17, die draait onder FreeBSD 10.3 op een VPS (Virtual Private Server) gerealiseerd door Tilaa.nl.

De standaardlogging van Apache is ingeschakeld. Een typische logging van het bezoek aan één pagina kan er bijvoorbeeld zo uitzien:

10.11.12.13 - - [19/Feb/2013:16:21:51 +0100] "GET /lingtics/noch.htm 
      HTTP/1.1" 200 1490 "http://rudhar.com/lingtics/lingtics.htm" 
      "Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14"
10.11.12.13 - - [19/Feb/2013:16:21:51 +0100] "GET /cgi-bin/colschem.cgi?url=toegesta.css 
      HTTP/1.1" 200 1208 "http://rudhar.com/lingtics/noch.htm" 
      "Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14"
10.11.12.13 - - [19/Feb/2013:16:21:51 +0100] "GET /cgi-bin/colschem.cgi?url=textfont.css 
      HTTP/1.1" 200 1441 "http://rudhar.com/lingtics/noch.htm" 
      "Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14"
10.11.12.13 - - [19/Feb/2013:16:21:51 +0100] "GET /cgi-bin/colschem.cgi?url=advert.css 
      HTTP/1.1" 200 1434 "http://rudhar.com/lingtics/noch.htm" 
      "Opera/9.80 (Windows NT 6.0) Presto/2.12.388 Version/12.14"

Aan het begin van elke logregel stond mijn eigen IP-nummer, omdat ik voor de test zelf de bezoeker was. Maar ik heb dat nummer vervangen door iets betekenisloos om op deze pagina weer te geven.

Dat één bezoek aan één webpagina leidt tot meerdere logregels, komt doordat de HTML-bestanden CSS-bestanden aanroepen, waarin de opmaakinstructies staan. Sommige CSS-bestanden roepen weer andere op. Ik doe dat via CGI, vanwege de manier waarop ik de kleuren gerealiseerd heb.

Bewaarperiode van de loggingdata

Elke ochtend rond kwart voor zes (tijdzone CET/CEST) wordt het logbestand van Apache teruggebracht tot alleen de meest recente 20.000 regels. Algoritme:
tail -20000 access_log > a; cat a > access_log; rm a

Dat komt er in de praktijk op neer dat de bezoeklogging zo’n 3,5 tot 4 dagen bewaard blijft. Voorbeeld: op Tue Feb 19 18:08:17 CET 2013 bleken de eerste logregels te dateren van 15/Feb/2013:22:43:53 +0100. De volgende dag om 11:55 was de eerste regel van 17 februari om 08:00.

Gebruik van gelogde gegevens

Actuele bezoekstatistieken

De bezoekgegevens die Apache vastlegt worden automatisch gebruikt om actuele statistieken te tonen: recent bezochte pagina’s en een overzicht van populaire pagina’s. Er is ook een toevalslijst van onpopulaire pagina’s, dit zijn willekeurig gekozen pagina’s uit de sitemap, gecorrigeerd voor recente bezoeken.

Geen van deze statistieken tonen persoonsgegevens: geen IP-nummers of zoekwoorden.

Nieuwsgierigheid van de webmaster

Als webmaster en schrijver word ik soms nieuwsgierig als ik zie dat een webpagina vaker wordt opgevraagd dan anders. Waar komt die belangstelling uit voort? Dan zoek ik wel eens een IP-nummer op met hulpmiddelen als ‘whois’ en ‘nslookup’. Dan weet ik nog niet wie de bezoekers waren – en dat wil ik eigenlijk ook niet weten – maar er valt soms iets uit af te leiden over het land waar het bezoek vandaan kwam en de voorkeurstaal.

Die informatie kan me helpen prioriteiten te stellen bij toekomstige schrijfactiviteit: het is leuker dingen te schrijven waarvoor misschien ook een publiek is.

Soms is bij hits uit zoekmachines zoals Google te zien met welke zoekwoorden de bezoeker op een pagina terechtkwam. Hieronder een echt (maar afgekapt en iets veranderd) voorbeeld:

10.11.12.13 - - [17/Feb/2013:20:05:52 +0100] 
      "GET /foneport/en/foneport.htm HTTP/1.1" 200 75124 
      "http://www.google.co.us/url?sa=t&rct=j&q=european%20portuguese%20pronunciation
      &[..rest skipped..]

Hier had iemand gezocht naar informatie over “european portuguese pronunciation” en vond het gezochte (hoop ik) op mijn website.

Dat is interessant. Toch bekijk ik zulke informatie maar incidenteel. Zelden of nooit eigenlijk. Misschien 3 of 4 keer per maand.

Derden

De webmaster zal nooit gelogde informatie over websitezoeken doorgeven aan derden, tenzij hij daartoe wettelijk verplicht is, zoals op last van een rechtbank. Van die laatste situatie verwacht ik redelijkerwijs niet dat die zich ooit zal voordien, aangezien ik me geen geldige reden daarvoor kan voorstellen.

Weblogcommentaren

Ik bied andere mensen niet de mogelijkheid commentaren onder mijn artikelen te plaatsen. Daarom kan ik ook niet verantwoordelijk worden gesteld voor zulke commentaren. Ook dit maakt het erg onwaarschijnlijk dat een gerechtelijk bevel me er ooit toe zou verplichten persoonlijke details van reageerders te onthullen.

Ik heb wel een enkele keer artikelen van anderen op mijn website gepubliceerd, geschreven door gastauteurs. Maar dat komt zelden voor. De naam van de schrijver zette ik er dan duidelijk bij, met hun toestemming.

Wat notice&takedown-procedures betreft is het mijn voornemen steeds te voldoen aan wat wettelijk vereist is, mocht zo’n situatie zich ooit voordoen.

Cookies

Flash cookies

Deze website gebruikt zelf geen Flash cookies.

Kleurenvoorkeur

Het enige waarvoor deze website een cookie gebruikt, is om een kleurenvoorkeur van de bezoeker te onthouden, zoals kenbaar gemaakt door op een link te klikken. Meer details staan hier en hier.

Naar mijn opvatting is deze kleurkeuzecookie “strikt noodzakelijk” in de zin van het recent toegevoegde artikel 11.7a, lid 3b van de Nederlandse Telecomwet, en ook “strikt noodzakelijk [is] voor het wettige doel of om het gebruik mogelijk te maken van een specifieke dienst waarom de abonnee of gebruiker heeft verzocht” in de zin van EU-richtlijn 2009/136/EG, overweging 66 op bladzijde 20; die “specifieke dienst” is dan: de website getoond te krijgen met het kleurenschema waaraan de betreffende bezoeker de voorkeur geeft.

Zie ook het gewijzigde artikel 5(3) op bladzijde 30 van Richtlijn 2009/136/EG:

of, indien strikt noodzakelijk, om ervoor te zorgen dat de aanbieder van een uitdrukkelijk door de abonnee of gebruiker gevraagde dienst van de informatiemaatschappij deze dienst levert.

De cookie is nodig als het specifieke kleurenschema gewenst wordt. De cookie hoeft niet gezet te zijn en verwijderen is oké. In dat geval geldt in het vervolg het standaardschema, maar de content van de website blijft volledig toegankelijk.

Sitemeter

Sitemeter werd door deze website gebruikt voor het verkrijgen van bezoekstatistieken. Maar Sitemeter gebruikt third-party cookies. Daarom zijn, gezien de aangepaste Nederlandse Telecomwet, alle Sitemeter-tellers rigoureus verwijderd van deze website.

Google Adsense

Google Adsense werd door deze website gebruikt om wat inkomsten te vergaren door het tonen van advertenties. Maar Adsense gebruikt third-party cookies. Daarom zijn, gezien de aangepaste Nederlandse Telecomwet, alle Adsense-advertenties rigoureus verwijderd van deze website.

Bol.com

Diverse artikelen op deze website bevatten promotielinks naar de webwinkel Bol.com. Als mensen zo’n link volgen en daadwerkelijk iets kopen in die winkel, verdien ik een kleine commissie.

Een lijst van de pagina’s met zulke links staat hier. Het weergeven van een van mijn pagina’s met zo’n link, zet nog geen cookies. Maar door erop klikken, gaat de gebruiker naar de site van Bol.com, en dan worden wel cookies gezet. Niet mijn cookies, maar die van Bol.com.

Ik neem aan dat die vallen in de categorie strikt noodzakelijke cookies, in de zin van de Nederlandse Telecomwet en de EU-Richtlijn. Dat betekent dat Bol.com ze gebruikt voor het herkennen van de verschillende stappen in de dialoog met de bezoeker, die uiteindelijk misschien iets koopt.

Youtube

Op mijn pagina http://rudhar.com/musica/ruivelte/en.htm zijn Youtube-filmpjes ingebed m.b.v. iframes, om het punt dat ik daar maak te illustreren.

Helaas probeert Youtube al cookies te zetten nog voordat die filmpjes worden gestart, alleen door ze te tonen als afspeelbaar.

Dit zijn niet mijn cookies, ik wil niet dat ze gezet worden en ik doe er niks mee. Als u ook niet wilt dat ze gezet worden, kunt u alle cookies van Youtube.com blokkeren, of third-party cookies in het algemeen, via de instellingen in het bladerprogramma dat u gebruikt (de zogeheten browser; voorbeelden van browsers zijn: Internet Explorer, Mozilla Firefox, Google Chrome, Opera).

Google Maps

De pagina http://rudhar.com/toerisme/lmrkstyn/nl.htm is een verslag van een vakantiewandeling die we maakten. Om te laten zien waar we waren, bedde ik (met iframes) twee kaarten met foto’s in, beschikbaar gemaakt door Google Maps.

Helaas probeert maps.google.fr alleen al bij het weergeven daarvan cookies te zetten.

Dit zijn niet mijn cookies, ik wil niet dat ze gezet worden en ik doe er niks mee. Als u ook niet wilt dat ze gezet worden, kunt u alle cookies van maps.google.fr blokkeren, of third-party cookies in het algemeen, via de instellingen in het bladerprogramma dat u gebruikt (de zogeheten browser; voorbeelden van browsers zijn: Internet Explorer, Mozilla Firefox, Google Chrome, Opera).

Invoergegevens in berekeningsprogramma’s

Op enkele pagina’s van deze website kan de gebruiker gegevens invullen, waarna er een algoritme op kan worden toegepast om de resultaten te laten tonen.

Voorbeelden zijn:

De invoergegevens gaan onversleuteld naar de site, er wordt geen SSL toegepast. Dit is te zien doordat de URL begint met http://, niet met https://.

Hetzelfde geldt voor de uitvoergegevens die van de website naar de gebruiker gaan.

De invoergegevens worden slechts kortstondig opgeslagen in tijdelijke variabelen, alleen om de berekening mogelijk te maken. Er worden geen gegevens gelogd.

E-mail

Behalve een webserver draait op de VPS ook een e-mailserver. De e-mailserver gebruikt sendmail om het protocol SMTP te implementeren. Spam wordt zo veel mogelijk tegengegaan m.b.v. milter-greylist en spamassassin.

De e-mailserver bewaart de mails slechts enkele dagen. De mails worden regelmatig overgebracht (‘de mail checken’) van de e-mailserver naar de eigen computer van de webmaster. Deze overdracht gebeurt met het protocol POP3.

Op de computer van de webmaster wordt een uitgebreid e-mailarchief bewaard, versleuteld op een virtueel schijfstation gemaakt met het programma Bestcrypt van Jetico. Ook de back-ups zijn versleuteld. Dit betekent dat alleen de webmaster toegang heeft tot het e-mailarchief.