Posts Tagged ‘robots’

Robots.txt creativos: con arte ASCII

Friday, April 29th, 2011

Vía @senormunoz a quien a su vez le llegó vía @conoroconnor, me llega noticia de este fantástico robots.txt trufado de ejemplos de arte ASCII que ilustran un texto creado por Rishi Lakhani, SEO de profesión (este link sí es dofollow, porque él lo vale), con su trayectoria, aficiones y tribulaciones. Resulta divertido de leer, y casi se puede reconocerse uno en él, o reconocer a alguno :-) .

detalle del robots

Para ver más entradas del mismo tema (similitud garantizada, ya que son enlaces que menda ha puesto a mano) mirad Esplendor y miseria del robots.txt I y Esplendor y miseria del robots.txt II.

Modo patada en el culo: on

Sunday, June 20th, 2010

El robots.txt de Isaac Sunyer. Básicamente le dice a Google que no entre en su blog. Más info aquí: Harakiri SEO

robots-sunyer

Isaac: andas desaparecido de Google, ya no escribes… Me estás preocupando, ¿no dura mucho ya la broma?, ¿no crees que estás llevando el Disallow a un extremo excesivo? :-P

Leyes de la robótica en el robots.txt

Wednesday, June 16th, 2010

Robots.txt de Lastfm. Las leyes de la robótica, una vez más.
robots-lastfm

Banda sonora de este post: Domo Arigato, Mr. Roboto de Stynx.


Mr RobotoVote for my rendition!

Googlebot no desprecia las galletas

Tuesday, March 30th, 2010

Ya me lo dijo Barbol hace tiempo, ahora lo confirma John Mu:

@Affar – Googlebot generally does not use cookies, so session-level information will generally be dropped for future accesses.

Y es que cuando una araña tiene hambre…

la letra aquí.

Googlebot Sad :-(

Monday, January 18th, 2010

El Googlebot nos cuenta sus desdichas en Monkeys with Handguns. Y es que los robots también tienen su corazoncito ¡qué caray!. Me ha encantado el post sobre los “alt”, pobrecito, se le ve tan frustrado. Voy a darle un poco de linklove.

Bots

Monday, August 25th, 2008

Bots! you can’t live with or without them.

Conversaciones en el messenger con el USA country manager.

Música para los robots

Monday, July 14th, 2008

¿qué suena en el mp3 del Googlebot cuando está dedicado a sus labores? Pues Songs for a Robot (The Wall-E Mix) bueno, vale en realidad es Wall-E.

posteado en Humor, aunque debería crear una categoría chorradas

Esplendor y miseria del robots.txt (parte II)

Tuesday, July 10th, 2007

Bueno, así como a Brett Tabke le da por ser original y escribir su blog en el archivo de marras, los hay que prefieren el uso tradicional y les gusta tirar de robots.txt para prohibir el acceso a determinadas partes de su site. Véase por ejemplo el robots.txt de la Casa Blanca

¿Qué pasa? ¿Nunca habéis conocido a alguien que se lea la guía telefónica? Pues yo leo el robots.txt de la Casa Blanca. Además, encuentro muy interesante ver que tienen directorios llamados blackhistory, firstlady o fitness y me pregunto las razones por las que querrías sacar del buscador cosas como sitemap.html o accesibility.html.

No obstante, tengo una duda razonable sobre la longitud que puede alcanzar este archivo, en principio, no debería de estar limitado: total, los de la Casa Blanca usan 89.356 caracteres de nada (ale a lo grande, como todo lo estadounidense) sin embargo Google restringe la prueba del robots.txt en su webmaster tool a 5.000 caracteres.

El sentido común sugiere moderación que el robots.txt es muy delicado. Tendré que desechar lo de hacer una tesis en/sobre el robots.txt.

clicad en la foto para poder leer el pantallazo con el mensaje de error

Gracias a María que me descubrió la existencia de este mensaje de error (hacer click en la foto para pantallazo legible). Por cierto, que no fue ella la culpable de subir un robots.txt de semejante tonelaje ¡Ni yo!

PD: ya sé que la imagen se sale, es enorme, por coherencia.

Actualización (22-03-2010): A fecha de 19 de enero de 2009 con la llegada al poder de Obama se rehizo la web de la Casa Blanca, y se hizo un nuevo archivo robots.txt rebajando las 2.400 que había llegado a tener, hecho que fue bastante comentado en la blogosfera, etc. por ejemplo aquí.

Esplendor y miseria del robots.txt (parte I)

Thursday, July 5th, 2007

¿Pueden los androides soñar con ovejas elécricas?. ¿Pueden los robots tener humor y además un blog? Pues sí señores y aquí está la prueba: Brett Tabke (1) de Webmasterworld bloguea usando el robots.txt en The Bot Blog
Esta paradoja oculta, comentada y sin comentarios, no es solo es un bello ejercicio de arte por el arte. El robots.txt era originalmente archivo creado para la lectura y dirección de máquinas (2), no para el solaz e información de humanos curiosos, y sin embargo ahí está, desafiando al RSS, a las suscripciones, al diseño, a la publicidad y a la dichosa web 2.0 en “un viaje especial de esbeltez y osadía… solo, alegre, sin perder la línea” (3)

La idea surgió como un diálogo interior (ver el jocoso primer post en los archivos antiguos) y desde entonces ha venido dejando nos muestras de la mente de su creador y de la de un tal Steven Wright

En cuanto a los contenidos recomiendo leer el post Can Google Predict The Future? del 29 de mayo sobre los mecanismos que podrían estar utilizándose para detectar tus clicks en tus propios adsenses. ¿Escalofriante o teoría conspiratoria?

Una última cosilla, no intentéis hacerlo en casa, a menos que sepáis como derivar el robots.txt al “otro robots.txt”

———

1) por si no os suena, es el inventor de la palabra SERP (Search Engine Results Page)
2) El archivo real del protocolo de exclusión de robots se encuentra aquí: http://www.webmasterworld.com/robots2
3) Copiando el poema La Fiesta Nacional de Manuel Machado. Eso sí, omitimos lo de ágil, que por mucho que nos guste el blog, va a ser que no.