Hola compañeros: Parece ser que el otro día, durante un encuentro en la American Library Association, Kurt Groetsch, de Google Books Project, mostró detalles de cómo Google está procesando los metadatos que saca de más de 100 fuentes distintas, como bibliotecas, editoriales, librerías, y agregadores de información enriquecida (cubiertas, revisiones, etc).
Por lo que se deduce de este post (ver debajo) comentando la ocasión, debió haber un cruce de comentarios bastante duro. Algunas perlas: - "The most difficult problem faced by the Google Books team is garbage data." - "Groetsch said without hesitation "Move away from MARC". " <http://go-to-hellman.blogspot.com/2010/01/google-exposes-book-metadata-privates.html>- "One of the Google engineers working on record parsing, Leonid Taycher, added that the first thing he had had to learn about MARC records was that the "Machine Readable" part of the MARC acronym was a lie." http://go-to-hellman.blogspot.com/2010/01/google-exposes-book-metadata-privates.html -- Jorge Serrano-Cobos http://www.masmedios.com Social: http://es-es.facebook.com/jorgeserrano http://www.linkedin.com/in/jorgeserranocobos http://www.google.com/profiles/jorgeserrano http://www.thinkepi.net Personal: http://twitter.com/serranocobos http://trucosdegoogle.blogspot.com ---------------------------------------------------- Los archivos de IWETEL pueden ser consultados en: http://listserv.rediris.es/archives/iwetel.html ----------------------------------------------------