Nunca se me ocurrió que tal vez no estuviera lo suficientemente agradecido por Internet Archive. Durante muchos años, lo he usado casi a diario, incluso para investigar numerosos artículos que no podría haber escrito de otra manera. Subí algunos de mis propios trabajos, los envié a la biblioteca académica de mi abuelo para escanearlos y doné dinero (aunque no lo suficiente).

Pero durante la última semana, aprecio aún más el Archivo, por las peores razones posibles. El 9 de octubre, el sitio sufrió un ataque DDoS que resultó estar vinculado a una violación de datos total en la que los piratas informáticos robaron y filtraron la información de las cuentas de 31 millones de usuarios. Luego se desconectó para protegerse contra nuevos ataques de este tipo, un proceso que, según su fundador, Brewster Kahle, debería llevar «días, no semanas». Mientras escribo esto, solo Wayback Machine está de regreso, en formato de solo lectura.

Considerándolo todo, ha sido un un año terrible para este depósito gratuito único de conocimiento y creatividad humanos. Incluso antes del reciente ataque, sufrió un ataque DDoS anterior en mayo; y en septiembre perdió su apelación en un caso judicial iniciado por importantes editoriales sobre su biblioteca de préstamo de libros electrónicos escaneados, lo que ya le había llevado a eliminar de la lista 500.000 títulos. Todavía está luchando contra un caso diferente relacionado con su colección de discos digitalizados de 78 rpm.

En otras palabras, el año ha estado lleno de recordatorios de lo frágil que es Internet Archive como institución. Pero prescindir de él por completo (sólo durante unos días) ha centrado mi atención en cuánto lo necesitamos.

Primero, está la Wayback Machine. Llevamos 30 años en la era de la web y el porcentaje del discurso público que tiene lugar digitalmente en lugar de en forma impresa sigue creciendo. Sin embargo, en lugar de dedicarse más a preservar sus archivos de contenido pasado, muchos editores parecen haber abandonado toda la idea. En mayo, Hunter Schwarz informó sobre un estudio del Pew Research Center que encontró que el 38% de los enlaces web de 2013 ya no funcionan. Los artículos y vídeos que serían invaluables para propósitos de investigación a menudo han desaparecido: no estoy seguro de si algo de lo que escribí mientras estaba en el personal de Mundo PCdonde trabajé entre 1994 y 2008, todavía se encuentra en su sitio. En estos tiempos tan desafiantes para el negocio de los medios, sitios de noticias enteros están fracasando y llevándose sus archivos con ellos.

Cuando las páginas web más antiguas logran permanecer, a menudo sufren graves problemas de formato y han perdido algunos o todos sus medios. También pueden alcanzar una especie de estado fantasma en el que es difícil localizarlos a menos que ya sepas que están allí. Por ejemplo, CNN.com todavía tiene algunos artículos históricamente significativos de la década de 1990, pero hasta donde yo sé, no se pueden encontrar con su propio motor de búsqueda.

Hay muchas explicaciones para esta lamentable situación. Preservar el contenido creado en un sistema de publicación una vez que se ha pasado a otro es una molestia. También lo es mantener el mismo formato para las URL a lo largo de los años. Y a algunos editores les preocupa no tener derechos legales demostrables para seguir publicando cada palabra e imagen que hayan publicado. Pero todos estos problemas podrían superarse si las empresas vieran que se puede ganar dinero manteniendo todo disponible para siempre. Lamentablemente, normalmente no lo hacen.

(Divulgación completa: FastCompany.com tiene lo que es, hasta donde yo sé, un archivo razonablemente completo de nuestro material que se remonta a nuestro primer número en 1995. Sí, parte de él ha sido víctima de peculiaridades de formato, pero Me alegro que haya sobrevivido.)

A medida que amplias zonas de la web se han ido pudriendo, el hecho de que Internet Archive, una organización sin fines de lucro, haya estado almacenando páginas desde 1996 y poniéndolas a disposición a través de Wayback Machine desde 2001 se ha vuelto más importante. Incluso Google ha descontinuado su venerable caché de páginas web y lo reemplazó con enlaces a Wayback Machine.

Luego está el resto de Internet Archive, una vasta biblioteca de documentos, videos, audio y software que representan no sólo los últimos 28 años, sino toda la historia humana. El Archivo no es la única institución que realiza parte de este trabajo: por ejemplo, HathiTrust es una excelente biblioteca electrónica gratuita a la que puede acceder si está afiliado a un colegio o universidad, incluido el simple hecho de ser alumno de uno. Pero nadie más ha intentado hacerlo todo, todo en un solo lugar.

Las empresas con fines de lucro, por supuesto, ven valor en los libros, las películas y la música más antiguos. Es por eso que algunos de ellos han demandado a Internet Archive por sus ofertas. Pero hay enormes cantidades de material que nunca se molestarán en poner a disposición. A menudo, ni siquiera son buenos administradores del contenido que tienen: la tienda Kindle de Amazon, lo más parecido que tenemos a una colección completa de libros electrónicos de pago, está tan contaminada con spam generado por IA que navegar por ella da me duele la cabeza.

Son los elementos que de otro modo serían inalcanzables los que hacen que el Archivo sea esencial. Lo uso regularmente para leer revistas de informática de los años 1970 y 1980. Tiene una novela escrita por un primo lejano mío que debe haberse agotado poco después de su publicación en 1949. La semana pasada, poco antes de la violación, busqué algo en una guía telefónica de Londres de 1973. Varias veces durante la interrupción, instintivamente fui allí para comprobar algo a pesar de saber que el sitio no funcionaba.

Las buenas bibliotecas físicas ven la oscuridad no como una excusa para ignorar una obra, sino como un argumento para recopilarla y garantizar que permanezca disponible cuando sea necesario. Lo mismo ocurre con Internet Archive. La diferencia es que nunca se quedará sin espacio. Al igual que Wikipedia (quizás su única par entre las instituciones en línea), es un bien público en una escala que sólo podría existir en la era digital. Y existe sólo porque Brewster Kahle así lo pensó y porque un enorme número de personas han contribuido a convertirla en la asombrosa realidad que es.

Has estado leyendo Conectado,Empresa rapidaEl boletín de tecnología semanal de mi parte, el editor de tecnología global Harry McCracken. Si un amigo o colega le envió esta edición (o si la está leyendo en FastCompany.com), puede consultar ediciones anteriores e inscribirse para recibirla usted mismo todos los miércoles por la mañana. Me encanta saber de usted: envíeme un ping a hmccracken@fastcompany.com con sus comentarios e ideas para futuros boletines.