free hit counter
Lisää Soopa päivän pamaukseen.

maaliskuu 24, 2004

Sisällön poistaminen Googlesta

Vanhan ajan bloggaaja Pekka Pekkala (Pekkala.info, jonka linkki minulla on vieläkin tuossa etusivun oikeassa reunassa) kirjoittaa päivän Hesarissa, ettei Googlesta saa poistettua sinne kertaalleen joutunutta tai ajautunutta materiaalia. Tämä ei aivan täysin pidä paikkaansa, sillä Google tarjoaa varsin seikkaperäiset ohjeet siitä, kuinka materiaalin saa poistettua Googlen välimuistista. Helpoin tapa on tietysti alunperinkin estää sivuja joutumasta Googlen syövereihin asettamalla kunkin tällaisen HTML-sivun headereihin:
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">>

Jotta kenenkään sivuja ei poistettaisi Googlesta virheellisesti, suurin osa poistokeinoista on sellaisia jotka vaativat robots.txt -tiedoston sijoittamista palvelimelle. Tarkempaa tietoa ko. tiedostosta: www.robotstxt.org

Googlehan ei tietenkään ole ainut hakupalvelu, joten sitten sama poisto-operaatio on toistettava kaikille muille hakupalveluille. Siinä onkin hiukan isompi homma, koska erilaisia tunnettuja hakurobotteja on 288 ja niiden lisäksi vielä 41 sellaista, joista ei ole tarkempaa tietoa.

Hesarin artikkeli löytyy webistäkin, mutta koska maksan Sanoma Osakeyhtiölle ainoastaan paperiversiosta, minulla ei ole veppisivuille sen suurempia selailuoikeuksia kuin muillakaan webin käyttäjillä. Ei ehkä aivan reilua.

Ja aivan siltä varalta, että Pekka tai joku muu Hesarin verkkoversion maksullisuuden puolustaja sattuu tämän lukemaa ja kysymään, tiedänkö montakin ilmaiseksi tuotettaan jakavaa pörssiyhtiötä, tarjoan nähtäville seuraavan listan suurehkoista lehdistä, jotka ovat verkossa ilmaiseksi luettavissa:
The Miami Herald
New York Metro
The New York Times
The Washington Times
Guardian
The Daily Telegraph
Aftonbladet
Luulisin ainakin jonkun takana olevan pörssiyrityksen.

Kirjoittanut soopa 24.03.04 23:54
Kommentit
vm kommentoi 25.03.04 08:20 seuraavasti:

Ei todellakaan ole aivan reilua, nimittäin tuo verkkoversion maksullisuus paperiversion tilaajille. Nimim. myös Hesarin tilaaja

Powered by
2.661 [Valid RSS]