SEO - Webdesign nieuws 2006

Nieuws archief 2006

Jan. Feb. Mrt. Apr. Mei. Jun.
Jul. Aug. Sep. Okt. Nov. Dec.

Double slash in URl - Kort zoekmachine nieuws (23  mei 2006)

Double slash in URl - Googlebot kapot!

Jarenlang staan we zonder problemen in de top 5 indien gezocht op webontwerp in Google. Geen vuiltje aan de lucht bij geen enkele update. Niet bij Bourbon, niet bij Jagger123 en niet bij Bigdaddy. Tot voor kort dan.

Tot onze verbazing zien we een aantal weken terug in de access_log een verwijzing opduiken naar de map 'webontwerp' met aan het eind een dubbele slash (trailing double slash). Bijvoorbeeld: vision2form.nl / webontwerp // documentnaam.html.

Normaal gesproken niets aan de hand. Technisch gezien is een verwijzing naar een document met een enkele of dubbele slash hetzelfde.

Tja, maar normaal geldt niet voor de googlebot. Deze had al problemen met een 301 redirect permanent en jaren terug ook dit specifieke probleem. Eea. leek opgelost, echter door de hoeveelheid problemen die men bij Google trachtte te tackelen in de nieuwe structuur, is deze fout er weer eens ingeslopen of wellicht versterkt zichtbaar geworden.

Verdwijnen van de pagina in de resultaten

Ook al zou het 'technisch' gesproken dezelfde eindbestemming moeten zijn, ook voor Google, is het dat helaas niet. De googlebot ziet URl's met een enkele slash en die met een double slash als twee verschillende eindbestemmingen. Het gevolg laat zich raden. De googlebot neemt de dubbele slash als eindbestemming en de verwijzing naar ons document verdween uit de resultaten van Google.

Een zoektocht met 'site:vision2form.nl/webontwerp/' toonde wel de URl met de reeds gemelde dubbele slash "//"

Een oplossing voor het 'double slash' probleem

Gezien het feit dat dit een fout in de googlebot moest zijn, geen van de regels in de .htaccess was gewijzigd, nergens dook er een verwijzing met de dubbele slash op, zat er maar 1 ding op, op zoek te gaan naar een oplossing voor dit probleem.

Door onze ervaring met een ander 'canonical' probleem van de bot (wel of geen www. in de url) wisten we dat de oplossing gezocht moest worden in de .htaccess file en dan het liefst met een 301 redirect permanent. Hierdoor worden alle aanvragen die we niet willen, verwezen naar de juiste locatie. Dus ook die aanvragen van de googlebot. Op die wijze zou die op den duur door moeten krijgen dat er geen documenten met een dubbele slash opgevraagd kunnen worden.

Veel ervaring met de gebruikte expressies hadden we niet, maar wel een goede kennis die ons daarbij heeft geholpen: Pennywise - Drock.de een geniale hoster in Duitsland die nog oog heeft voor detail! Helaas heeft hij nog geen website voor zijn diensten, maar op zijn homepage vindt u de contactgegevens, mocht u ooit overwegen een website in Duitsland te laten hosten.

De 301 RewriteRule voor de dubbele slash

Deze oplossing werkt alleen op een Apache server!! Voor de juiste oplossing in uw specifieke situatie raad ik u aan, indien u geen ervaring heeft met deze materie, contact op te nemen met een expert!

In de .htaccess namen wij de volgende regels op:

RewriteEngine On
RewriteCond %{REQUEST_URI} //
RewriteRule ([^/]*)/+(.*) http://vision2form.nl/$1/$2 [R=301,L]

Het werkt!

Vandaag dan toch snel gekeken of ook Google het wel snapt. En gelukkig werkt het en is onze vermelding weer in de resultaten opgenomen.

Penny, bedankt!

SEO Nieuws archief 2006

SEO Nieuws