De laatste tijd gebeurt er nogal wat op internet rondom Google, bloggen en reageren, en in het algemeen rondom de vrijheid van informatie op Internet. In deze tijd, waarin bijna iedereen kan publiceren op Internet zijn we op zoek naar hoe we daar mee omgaan. Dat wat jij publiceert kan nog wel eens schadelijk zijn voor een ander. Maar betekent dat dan dat je het weg moet halen? En soms zal iemand in de reacties op een blog van je zich negatief uitlaten over een ander: in hoeverre ben jij daar dan verantwoordelijk voor? En moet je dat dan weghalen? Daar komt nog eens bij dat Google je website waarschijnlijk wel heeft geïndexeerd en dat de informatie in het cache geheugen van Google dus nog wel een tijdje te lezen is.
Zo waren er een tijdje terug wat kritische geluiden in de reacties van een artikel op recruitmentmatters.nl te horen over ene Marc Ernst (over hem is nog wel meer rottigs te vinden). Dit pikte deze persoon niet en dus stapte hij met een advocaat naar de rechter. De rechter besloot vervolgens dat Marc Drees (de eigenaar van recruitmentmatters.nl) de IP adressen van de reageerders moest overhandigen aan de eiser en de reacties moest verwijderen. Op straffe van €10.000 per dag! Drees was niet de enige die gedaagd werd, ook Google moest het ontgelden. Die had immers de pagina nog in zijn index staan (en nog steeds in de cache).
Verder las ik laatst op MarketingFacts dat de Duitse Wikipedia door een Duitse rechter uit de lucht is gehaald. Dit omdat de politicus Lutz Heilman het niet eens is met zijn biografie op Wikipedia. Beetje dom natuurlijk want iedereen is naar het lemma aan het linken en schrijft erover. Daardoor weet ‘der Lutz’ die wikipediapagina natuurlijk nooit meer van de eerste pagina van de zoekresultaten te drukken.
En kortgeleden kreeg ik zelf ook een mailtje met het verzoek om censuur te plegen op mijn blog. In dat mailtje ging het erom dat een reageerder op mijn blog een link naar een archiefpagina van de NEDBIB-L mailinglist had geplaatst (de eeuwenoude mailinglist van bibliothecarissen en informatieprofessionals). Volgens degene die het mailtje stuurde kwam het door mijn link dat deze pagina nu in Google’s index stond. Zij had ooit op de desbetreffende mailinglist een oproep gedaan. Ze was op zoek naar een nieuwe baan. NU was ze er niet zo kapot van dat deze oproep in Google te vinden was.
Naar aanleiding van die constatering had ze de lijstbeheerder een mailtje gestuurd. Deze vertelde haar dat de archieven van NEDBIB waren beschermd doordat hij een meta tag in de HTML heeft die zoekmachines verbiedt om de pagina’s te indexeren. Daar heeft hij deels gelijk in. Een korte uitleg: Webmasters kunnen in de HTML van een pagina de volgende tag opnemen: <meta name=”robots” content=”nofollow,noindex” />. Deze tag verteld zoekmachines dat ze de links op de pagina niet mogen volgen en dat ze de pagina niet mogen indexeren. De site van de NEDBIB mailinglist is als volgt opgebouwd:
Op nedbib.reuser.biz staat een bestand wat de pagina verdeelt in vier ‘frames’. Eén van die frames bevat deze pagina: http://nedbib.reuser.biz/HomePage.html. Op die pagina staan een aantal links naar andere pagina’s. Een van die pagina’s is de archiefpagina. Die staat op https://listserv.surfnet.nl/archives/nedbib-l.html. Op deze pagina is de eerder genoemde meta tag aanwezig. Dat betekent dus dat Google deze pagina niet zal indexeren en de links op de pagina niet zal volgen (en dat klopt). Maar goed, op deze pagina staan nog geen berichten. Alleen links naar pagina’s waar de berichten van de mailinglist per maand op staan. Zo is dit bijvoorbeeld de pagina met alle berichten uit november. En daar is de meta tag NIET aanwezig. Ook van een andere mogelijkheid om zoekmachines te weren, een robots.txt bestand in de ‘root’ van je website, wordt geen gebruik gemaakt (lees meer op Wikipedia). En dus staan die archiefpagina’s ook in de index van Google.
Het gevolg van dit alles is dat wanneer iemand eenmaal naar één van de pagina’s met berichten heeft gelinkt (op een webpagina die bekend is bij Google), deze uiteindelijk in de index van Google terecht zal komen. En om er voor te zorgen dat de pagina weer uit de index van Google verdwijnt zal de webmaster eerst de stappen die Google daarvoor noemt moeten nemen.
Heb je advies nodig over hoe je de zoekresultaten over jouw bedrijf in Google weer onder controle krijgt? Maak dan een vrijblijvende afspraak met me.
Who's to blame voor de inhoud van een blogreactie of Google's index?
De laatste tijd gebeurt er nogal wat op internet rondom Google, bloggen en reageren, en in het algemeen rondom de vrijheid van informatie op Internet. In deze tijd, waarin bijna iedereen kan publiceren op Internet zijn we op zoek naar hoe we daar mee omgaan. Dat wat jij publiceert kan nog wel eens schadelijk zijn voor een ander. Maar betekent dat dan dat je het weg moet halen? En soms zal iemand in de reacties op een blog van je zich negatief uitlaten over een ander: in hoeverre ben jij daar dan verantwoordelijk voor? En moet je dat dan weghalen? Daar komt nog eens bij dat Google je website waarschijnlijk wel heeft geïndexeerd en dat de informatie in het cache geheugen van Google dus nog wel een tijdje te lezen is.
Zo waren er een tijdje terug wat kritische geluiden in de reacties van een artikel op recruitmentmatters.nl te horen over ene Marc Ernst (over hem is nog wel meer rottigs te vinden). Dit pikte deze persoon niet en dus stapte hij met een advocaat naar de rechter. De rechter besloot vervolgens dat Marc Drees (de eigenaar van recruitmentmatters.nl) de IP adressen van de reageerders moest overhandigen aan de eiser en de reacties moest verwijderen. Op straffe van €10.000 per dag! Drees was niet de enige die gedaagd werd, ook Google moest het ontgelden. Die had immers de pagina nog in zijn index staan (en nog steeds in de cache).
Verder las ik laatst op MarketingFacts dat de Duitse Wikipedia door een Duitse rechter uit de lucht is gehaald. Dit omdat de politicus Lutz Heilman het niet eens is met zijn biografie op Wikipedia. Beetje dom natuurlijk want iedereen is naar het lemma aan het linken en schrijft erover. Daardoor weet ‘der Lutz’ die wikipediapagina natuurlijk nooit meer van de eerste pagina van de zoekresultaten te drukken.
En kortgeleden kreeg ik zelf ook een mailtje met het verzoek om censuur te plegen op mijn blog. In dat mailtje ging het erom dat een reageerder op mijn blog een link naar een archiefpagina van de NEDBIB-L mailinglist had geplaatst (de eeuwenoude mailinglist van bibliothecarissen en informatieprofessionals). Volgens degene die het mailtje stuurde kwam het door mijn link dat deze pagina nu in Google’s index stond. Zij had ooit op de desbetreffende mailinglist een oproep gedaan. Ze was op zoek naar een nieuwe baan. NU was ze er niet zo kapot van dat deze oproep in Google te vinden was.
Naar aanleiding van die constatering had ze de lijstbeheerder een mailtje gestuurd. Deze vertelde haar dat de archieven van NEDBIB waren beschermd doordat hij een meta tag in de HTML heeft die zoekmachines verbiedt om de pagina’s te indexeren. Daar heeft hij deels gelijk in. Een korte uitleg: Webmasters kunnen in de HTML van een pagina de volgende tag opnemen: <meta name=”robots” content=”nofollow,noindex” />. Deze tag verteld zoekmachines dat ze de links op de pagina niet mogen volgen en dat ze de pagina niet mogen indexeren. De site van de NEDBIB mailinglist is als volgt opgebouwd:
Op nedbib.reuser.biz staat een bestand wat de pagina verdeelt in vier ‘frames’. Eén van die frames bevat deze pagina: http://nedbib.reuser.biz/HomePage.html. Op die pagina staan een aantal links naar andere pagina’s. Een van die pagina’s is de archiefpagina. Die staat op https://listserv.surfnet.nl/archives/nedbib-l.html. Op deze pagina is de eerder genoemde meta tag aanwezig. Dat betekent dus dat Google deze pagina niet zal indexeren en de links op de pagina niet zal volgen (en dat klopt). Maar goed, op deze pagina staan nog geen berichten. Alleen links naar pagina’s waar de berichten van de mailinglist per maand op staan. Zo is dit bijvoorbeeld de pagina met alle berichten uit november. En daar is de meta tag NIET aanwezig. Ook van een andere mogelijkheid om zoekmachines te weren, een robots.txt bestand in de ‘root’ van je website, wordt geen gebruik gemaakt (lees meer op Wikipedia). En dus staan die archiefpagina’s ook in de index van Google.
Het gevolg van dit alles is dat wanneer iemand eenmaal naar één van de pagina’s met berichten heeft gelinkt (op een webpagina die bekend is bij Google), deze uiteindelijk in de index van Google terecht zal komen. En om er voor te zorgen dat de pagina weer uit de index van Google verdwijnt zal de webmaster eerst de stappen die Google daarvoor noemt moeten nemen.
Heb je advies nodig over hoe je de zoekresultaten over jouw bedrijf in Google weer onder controle krijgt? Maak dan een vrijblijvende afspraak met me.