Aaron Swartz, el Acceso Abierto y los Estándares

Publicado en

SG #39

Programar es un Estilo de Vida

Aaron Swartz fue un joven entusiasta de la programación, firme creyente de la necesidad de la libre circulación de la información. Su vida tiene muchos momentos dignos de nota, los puntos más relevantes incluyen:

Participó en la creación de la especificación RSS 1.0 (W3C RFC 3870) a los 14 años de edad.
Fue co-autor del lenguaje de marcado Markdown, diseñado para hacer más natural a un usuario no técnico preparar páginas Web que lo que hasta entonces permitía el HTML.
Es uno de los creadores de la iniciativa Creative Commons, un conjunto de licencias orientadas a facilitar a los creadores elegir un marco que permita la libre circulación de los bienes culturales, sin renunciar a sus derechos autorales.
Participó en la creación del sitio sindicador de noticias sociales Reddit, uno de los primeros sitios en aprovechar la interacción viral y en definir lo que hoy conocemos como temas tendencia (trending topic).
Estuvo involucrado en diversas campañas oponiéndose a las propuestas legislativas encaminadas a la restricción de las libertades individuales en línea, entre las cuales destaca SOPA
Creó la Open Library, populándola con la información bibliográfica completa de la Biblioteca del Congreso de los Estados Unidos. Previamente, a pesar de que dicha información era legalmente del dominio público, se cobraba por su acceso.
Descargó en 2008 la base de datos completa de registros judiciales públicos (PACER), otro caso de información legalmente del dominio público pero restringida por un cargo por acceso. Donó los archivos resultantes a http://public.resource.org, siendo este el primer caso que le mereció ser abiertamente investigado por el FBI, aunque el caso fue cerrado sin presentarle cargos después de dos meses.

Dentro de su lucha por la puesta a disposición irrestricta de la información pública, entre 2010 y 2011 descargó cerca de cuatro millones de artículos académicos del repositorio JSTOR, aprovechando la política de «campus abierto»[1] que sostenía el MIT. Los artículos en cuestión provenían mayormente de investigaciones realizadas con fondos públicos, por lo que deberían ser para beneficio de la sociedad entera, pero por las diversas distorsiones que sufre la publicación científica formal, para tener un factor de impacto deseable para sus autores, tienen que ser publicadas en revistas especializadas que (cada vez menos, pero aún por regla general) ejercen una política intransigente de control de derechos de autor.

En julio de 2011 fue acusado formalmente por esta descarga de actividad criminal. Si bien JSTOR retiró su demanda, las autoridades judiciales continuaron persiguiéndolo de oficio — La fiscal Carmen Ortiz buscó repetidamente fincarle una sentencia de hasta 35 años de cárcel y una multa de hasta un millón de dólares, equiparando sus acciones con actos terroristas. Ante esta presión (y con antecedentes de depresión severa), el pasado 11 de enero Aaron Swartz se suicidó.

Las ideas sobreviven

Aaron, del mismo modo que muchos de los activistas del movimiento del software libre, fue encontrando la necesidad ética de actuar para fomentar la libre circulación y correcta preservación a largo plazo del conocimiento. Para muchos de nosotros, el movimiento del conocimiento libre es sencillamente la consecuencia lógica del movimiento del software libre, y surge naturalmente (y con las mismas premisas) una vez que el acceso a Internet llega a toda la sociedad.

A fin de cuentas, el código es sólo una herramienta de expresión y comunicación humana (aunque tenga la restricción de un lenguaje formal, de ser interpretable por una computadora). El ideario completo de la Fundación del Software Libre puede aplicarse a cualquier otra área del conocimiento —y tenemos hoy las herramientas para que la circulación del conocimiento no sólo resulte irrestricta, sino que a un costo de reproducción prácticamente nulo.

En sus 26 años de vida, Swartz contribuyó con buena parte de la implementación técnica y activismo social necesarios para impulsar al movimiento del Acceso Abierto (Open Access) [2]. Los diversos protocolos y sitios con los cuales él contribuyó quedan no sólo como legado, sino como indicador de cómo y hacia dónde un joven brillante vio que podríamos, y deberíamos, avanzar.

El acceso abierto y estructurado

Un corolario fundamental del acceso abierto es que la información, para ser útil, debe estar adecuadamente organizada y clasificada. Simplemente volcar millones de artículos científicos (o programas de computadora, obras culturales o literarias, arte, etc.) en un espacio sin estructura no sirve de mucho.Ahogarse en un mar de información resulta casi tan inútil como no tener acceso a ella. Es por eso que el Open Access va casi siempre de la mano del empleo de herramientas de clasificación, redistribución y agregación basadas en estándares ampliamente reconocidos.

Hay muchos sitios (incluyo entre ellos, por cierto, al de nuestra revista SG) destinados a la difusión de información con importantes cuerpos históricos. Si bien aplaudo y agradezco la decisión de Software Gurú de ofrecer el acervo histórico de ya ocho años de trabajo, para que esta información sea verdaderamente útil debería comprometerse a mantener URLs estables a largo plazo y adherirse a un esquema de publicación de material bibliográfico.

Muy probablemente, el esquema más adecuado sería el DublinCore[3]. Este estándar permite la indexación, cosecha y agregación de repositorios por medio de protocolos como el OAI-PMH[4]. ¿Qué significa semejante verborragia de siglas? Significa que, para que la información resulte de utilidad para el avance técnico-científico, no podemos solamente confiarnos al criterio de los “indexadores” de los motores de búsqueda. Siguiendo un poco la retórica de Tim Berners-Lee impulsada con el título de Web semántica, extiende la red de páginas hipervinculadas legibles por humanos, insertando metadatos legibles por computadora acerca de las páginas y sus interrelaciones, permitiendo a los agentes Web entenderlas más inteligentemente y realizar tareas en nombre de los usuarios.

Si bien hay críticas bien fundadas a la propuesta de Berners-Lee, para información tan estructurada como una revista de publicación periódica como esta, el modelo de metadatos DublinCore se ajusta perfectamente.

El Instituto de Investigaciones Económicas de la UNAM, donde trabajo, participa del proyecto de Red de Acervos Digitales (RAD-UNAM) [5]. Hemos ido creando un acervo interdisciplinario con diversas entidades universitarias que, por medio de OAI-PMH, ofrece una colección unificada y distribuida con miles de objetos académicos de gran diversidad, rescatándolos en buena medida del olvido y de la inaccesibilidad.

Software Guru va más allá de ser una revista — El cuerpo de noticias del ramo, whitepapers y congresos presenciales y virtuales podrían sumarse al cuerpo de conocimiento disponible y sistematizado publicado en nuestro país, impulsando de este modo su visibilidad y el impacto de lo aquí publicado. Del mismo modo, otras revistas (sean más formales o menos formales, impresas o en línea), boletines, congresos y demás actividades de nuestra área de conocimiento podrían beneficiarse de adoptar estos estándares.

Un repositorio correctamente descrito puede ser cosechado enfatizando en diferentes facetas. El esfuerzo para lograrlo, cierto, no es despreciable, Pero tengo la certeza de que Software Gurú tendría mucho por ganar. Y más que nuestra revista: Sé que muchos de quienes aquí escribimos, y quienes trabajan con dedicación brindándonos este espacio, más que por ganancia personal, lo hacemos en un afán de contribuir con nuestro granito de arena a la sociedad, y si bien la revista tiene su carga técnica, muchos de nosotros aspiramos a contribuir a la profesionalización de nuestro gremio, a una introspección acerca del rol y la responsabilidad social que cargamos.

A los pocos días de la muerte de Aaron Swartz, cientos de académicos hicieron públicas copias de sus artículos secuestrados por las editoriales científicas restrictivas como un tributo al trabajo de este joven idealista y activista. En una especie de paralelo, espero poder impulsar un poco más a través de este texto el conocimiento de las herramientas (y no sólo los principios éticos) que puedan permitir que el acceso abierto y pleno al cuerpo de conocimiento generado por los especialistas sea puesto al servicio de la humanidad toda de forma más efectiva.

>> Por Gunnar Wolf

Nota del editor: Gracias por la recomendación, Gunnar. Sin duda nos interesa mejorar la organización, identificación y permanencia de los contenidos que hemos publicado.

Referencias

[1] Política que permitía a cualquier usuario externo conectar una computadora de su propiedad en la red universitaria y aprovechar los convenios que ésta tenía subscritos. Podemos encontrar políticas similares en todas las principales universidades, partiendo de la premisa de facilitar la labor académica y reducir trámites.
[2] Por si se van perdiendo en la sopa de letras de movimientos libertarios, Open Access busca el libre acceso a publicaciones académicas.
[3] Dublin Core Metadata Initiative. http://dublincore.org
[4] Open Access Initiative Protocol for Metadata Harvesting. http://www.openarchives.org/OAI/openarchivesprotocol.htm
[5] Repositorio Institucional RAD-UNAM http://rad.unam.mx

Bio

Gunnar Wolf es administrador de sistemas para el Instituto de Investigaciones Económicas de la UNAM y desarrollador del proyecto DebianGNU/Linux. http://gwolf.org