[IWETEL] [ThinkEPI]: El que tiene los datos, tiene el poder

Jesús Tramullas Mon, 03 Jan 2011 12:28:39 -0800

El que tiene los datos, tiene el poder.
Jesús Tramullas
Depto. Ciencias de la Documentación, UNiv. de Zaragoza
http://tramullas.com

En un momento tecnológico en el cual los usuarios tienden a identificarla interfaz que utilizan con el sistema o aplicación que está por debajode la misma, en el cual las aplicaciones se simplifican hasta extremosinsospechados hace pocos años, existe una peligrosa tendencia a olvidarun principio básico y fundamental, aceptado y aplicado en el diseño deaplicaciones informáticas desde hace más de treinta años, y que de unacuestión técnica se está transformando en una cuestión social, políticay económica.



1. El principio de independencia de los datos.

El principio de independencia de los datos establece que los datos debenser independientes de las aplicaciones que los manejan. Este principioviene del campo del diseño de bases de datos relacionales, y ya fueincluido por Codd en su famosas doce reglas(http://es.wikipedia.org/wiki/12_reglas_de_Codd). De una manera máscercana y coloquial, es la independencia entre las aplicaciones y losficheros que contienen los datos, la información, la que hace posibleacciones tan sencillas como hacer copias de seguridad, intercambiarficheros, o exportar e importar entre diferentes formatos, y permiteacciones mas complejas, como reutilizar información entre aplicaciones yservicios web de diferentes proveedores. Estas tareas tan necesarias ycomunes han fortalecido, además, el papel de los estándares para eltratamiento de información, ya que el acceso libre a la informaciónalmacenada demanda la existencia de estándares que establezcan lascaracterísticas lógicos y físicas de los ficheros que almacenan lainformación, como es el caso de OpenDocument o Acrobat PDF.



2. Internet y los silos de datos.

Un silo de datos es un gran depósito de información estructurada osemi-estructurada. Hasta el advenimiento de internet, la mayoría de lossilos de datos eran privados y de difícil acceso. Con la popularizaciónde la red, cada vez una mayor cantidad de información de los siloscomenzó a estar disponible para los usuarios, mucha de ellagratuitamente, otra mediante pago. La proliferación de las tecnologías yaplicaciones del web social a comienzos de la década de 2000 hizo quecomenzaran a crearse nuevos silos, cuyo contenido se ha ido formando coninformación proveniente de dos fuentes principales:

a) La que se ha captado de los comportamientos y acciones que losusuarios llevan a cabo en la red.b) La proveniente de los contenidos e información que los usuarios hanaportado a la propia red.

Puede imaginarse la gran cantidad de información de ambos tipos queatesoran servicios como Facebook, Twitter, Slideshare o Flickr, porcitar unos pocos. El interés de servicios como los citados no radica enlas funcionalidades que ofrecen, sino en la base de datos a la que danacceso. Facebook vale lo que vale no por su funcionalidades decomunicación, que realmente son básicas, comunes y conocidas de antes,sino por la red de datos de usuarios a la que se puede tener acceso. Enrealidad, por los datos y la información de otros usuarios a los queofrece acceso con la metáfora de red social.



3. El que tiene los datos, tiene el poder.

En un contexto como el actual, en el cual el desarrollo de aplicacionesse ha abaratado y acelerado, la riqueza no está en las propiasaplicaciones. Quien tiene el poder es quien tiene el silo de datos, quees el que puede imponer políticas de usos permisibles y no permisiblesde los datos contenidos en el mismo. Muchas de las aplicacionesinnovadoras que alcanzan la cima del efímero éxito “2.0” se fundamentanen una capa de funcionalidad que aprovecha o explota los silos de datosque ofrecen otros. Google, siempre tan avizor, se ha posicionado antesque la competencia en el campo de la explotación de los silos de datoscomprando Metaweb y su producto estrella Freebase(http://googleblog.blogspot.com/2010/07/deeper-understanding-with-metaweb.html).En el campo de la gestión de información un modelo parecido ya se viviódurante las décadas de 1980 y 1990, cuando los host de bases de datoscampaban a sus anchas con sus tarifas y servicios. Esos tiempos pasaron,evidentemente, pero no hay que descartar que, a medio plazo, muchossilos de datos gratuitos vayan pasando a modelos mixtos pararentabilizar sus costes de mantenimiento y explotación.

No son muchos los usuarios que se toman la molestia, necesaria molestia,de leer los términos de uso de los servicios que contratan. Deberíanhacerlo. Es necesario aclarar que cuando se habla de “propiedad de losdatos”, los usuarios tienden a pensar que los datos son suyos, y puedenhacer con ellos lo que quieran, y es cierto... hasta cierto punto. Porejemplo, las condiciones de uso de Facebook establecen en su Declaraciónde derechos y responsabilidades(http://www.facebook.com/terms.php?ref=pf), punto 2 “Eres el propietariode todo el contenido y la información que publicas en Facebook, y puedescontrolar cómo se comparte...” hasta que se llega al punto 2.1. “...nosconcedes una licencia no exclusiva, transferible, con posibilidad de sersub-otorgada, sin royalties, aplicable globalmente, para utilizarcualquier contenido de PI que publiques en Facebook o en conexión conFacebook.” La propiedad es del usuario, pero se cede el uso sin controly la obtención de beneficios a Facebook sin contraprestación. Twittertambién muerde la manzana envenenada, parece que incluso con más ahínco(http://twitter.com/tos): “El usuario se reserva los derechos decualquier contenido enviado, publicado o presentado a través de losServicios.... el usuario otorga a Twitter licencia mundial, noexclusiva, libre de regalías (con derecho a la concesión de la licenciaa terceros) para utilizar, copiar, reproducir, procesar, adaptar,modificar, publicar, transmitir, mostrar y distribuir dicho Contenidocualquier medio de comunicación o método de distribución (actual odesarrollado en un futuro) ... Twitter, otras compañías, organizacioneso personas asociadas con Twitter podrán llevar a cabo tales usosadicionales sin compensar de ninguna manera al usuario que ha enviado,publicado, transmitido o puesto a disposición Contenido a través de losServicios.”



4. El “señor” de los datos

Esta avaricia de datos no es exclusiva de los servicios del web 2.0. Enlos dos últimos años hemos visto como el uso de los silos de datos se havuelto motivo de fricción entre proveedores y usuarios de mundo de lainformación. En 2009, Zotero fue amenazada judicialmente por ThomsonReuters, que intentaba evitar que los usuarios exportasen e importaseninformación entre las diferentes aplicaciones, llegando incluso aintentar arrogarse la propiedad intelectual de los ficheros de estilosque creaban los usuarios(http://tramullas.com/2009/08/15/zotero-gana-una-batalla/). A mi juicio,se trataba de un movimiento para intentar controlar los silos personalesde datos bibliográficos, dado que su gestor bibliográfico de referenciaestaba siendo superada por otros más avanzadas, en un movimientodefensivo evidentemente condenado al fracaso, como han demostradoposteriormente CiteuLike, 2collab o Mendeley.

Las bibliotecas tampoco han quedado al margen de estas tensiones. OCLCintentó evitar que Skyriver, que le estaba ganando contratos deservicios, utilizase los datos contenidos en WordlCat. Para ello cambióunilateralmente los términos de uso de su producto sin avisar, y llegó aenfrentarse incluso a sus propios socios. El asunto llegó a lostribunales en julio de 2010(http://www.librarytechnology.org/web/breeding/skyriver-vs-oclc/). Losproblemas del catálogo colectivo C17, cuyo acceso es financiado todavíapor el Instituto de Salud Carlos III, son un indicador de la inocenciacon la que se han ido firmando contratos en los cuales no se habíaprevisto la propiedad y explotación de los silos de datos creados conlas aplicaciones. La web del Catálogo colectivo de Rebiun no contiene niuna mención de la propiedad de los datos del catálogo, y de cuales sonlos usos permitidos de los mismos a terceras partes. En el caso deREBECA, se establece la necesidad de solicitar una cuenta de usuario, alparecer restringida a bibliotecas públicas, pero tampoco se ofrece mayorinformación. Más curioso es el caso de Dialnet, que específicamenteindica, al pie de su interfaz “Todos los derechos reservados”, sin mayoraclaración, pero en que en su páginas de ayuda publica su política deAcceso Abierto (http://dialnet.unirioja.es/ayuda/SPA/ayuda_oai.jsp).

Todas estas cuestiones no deberían llevar a una reflexión sobre cualesdeberían ser las políticas de propiedad y uso de los datos generados porlas unidades de información en el marco de su trabajo diario. Para mí,evidentemente, mis datos son míos, y la compra de licencias de uso deuna aplicación dada no debe suponer que los datos sean cedidos alproveedor, ni que tenga derechos sobre los mismos, y menos cuando sonfruto de mi trabajo y, además, puedan ser resultado de actividadesfinanciadas con fondos públicos. La Ley de Propiedad Intelectualcontempla en su articulo 12.2. una definición “amplia” de lo que seconsidera base de datos, y añade en el 12.3 “La protección reconocida alas bases de datos en virtud del presente artículo no se aplicará a losprogramas de ordenador utilizados en la fabricación o en elfuncionamiento de bases de datos accesibles por medios electrónicos.”,reconociendo que no es lo mismo la base de datos que la aplicación usadapara gestionarla. El artículo 133.3a establece como “fabricante” de labase de datos, y poseedor de sus derechos a “la persona natural ojurídica que toma la iniciativa y asume el riesgo de efectuar lasinversiones sustanciales orientadas a la obtención, verificación opresentación de su contenido.” El dueño de los datos de un blog o de unweb dinámico es su autor o creador de contenidos, no la empresa queinstaló un CMS y cobra por su mantenimiento. Por si acaso, que no seolvide hacerlo constar de manera expresa en el contrato correspondiente.

En realidad, las administraciones públicas españolas ya estánentendiendo la importancia de los silos de datos abiertos en cuanto hanempezado a dar acceso a datos a través de iniciativas de apertura dedatos (Open Data), para que puedan ser usados por terceros. Seráinteresante ver cómo se van conjugando las iniciativas privadas en buscade rentabilidad con la utilización sensata de los datos de lasadministraciones públicas que, no debe olvidarse, se sufragan con eldinero de los ciudadanos.


--
"Nunca la bandera arriada"
Ernest Shackleton

--#------------------------------------------------------------
Dr. Jesús Tramullas
http://tramullas.com
Dept. Ciencias Documentación // Information Sciences Dep.
Universidad de Zaragoza 50009 Zaragoza (España)
-----------------------------------------------------------#--


----------------------------------------------------
Normas para el correcto uso del correo electrónico:
                http://www.rediris.es/mail/estilo.html
----------------------------------------------------

[IWETEL] [ThinkEPI]: El que tiene los datos, tiene el poder

Responder a