Hola compañeros:

Parece ser que el otro día, durante un encuentro en la American Library
Association, Kurt Groetsch, de Google Books Project, mostró detalles de cómo
Google está procesando los metadatos que saca de más de 100 fuentes
distintas, como bibliotecas, editoriales, librerías, y agregadores de
información enriquecida (cubiertas, revisiones, etc).

Por lo que se deduce de este post (ver debajo) comentando la ocasión, debió
haber un cruce de comentarios bastante duro. Algunas perlas:

- "The most difficult problem faced by the Google Books team is garbage
data."

- "Groetsch said without hesitation "Move away from MARC". "

<http://go-to-hellman.blogspot.com/2010/01/google-exposes-book-metadata-privates.html>-
"One of the Google engineers working on record parsing, Leonid Taycher,
added that the first thing he had had to learn about MARC records was that
the "Machine Readable" part of the MARC acronym was a lie."

http://go-to-hellman.blogspot.com/2010/01/google-exposes-book-metadata-privates.html


-- 
Jorge Serrano-Cobos
http://www.masmedios.com

Social:
http://es-es.facebook.com/jorgeserrano
http://www.linkedin.com/in/jorgeserranocobos
http://www.google.com/profiles/jorgeserrano
http://www.thinkepi.net

Personal:
http://twitter.com/serranocobos
http://trucosdegoogle.blogspot.com


----------------------------------------------------
Los archivos de IWETEL  pueden ser consultados en: 
                http://listserv.rediris.es/archives/iwetel.html
----------------------------------------------------

Responder a