Archiwum Internetu oraz telewizyjne "Call to Action"

Zwiedzania San Francisco ciąg dalszy, a w dzisiejszym odcinku przesyłam pozdrowienia z Internet Archive!

Czym jest ta instytucja? Archiwum Internetu, dostępne pod adresem Archive.org, to cyfrowa biblioteka non-profit założona w celu archiwizacji zasobów internetowych i innych materiałów cyfrowych. Jego najbardziej znaną częścią jest “Wayback Machine”, która regularnie zapisuje kopie stron internetowych, pozwalając użytkownikom zobaczyć, jak wyglądały one w przeszłości. Oprócz stron WWW, Archiwum gromadzi również ogromne kolekcje zdigitalizowanych książek, filmów, muzyki, oprogramowania i nagrań audio, dążąc do zapewnienia “uniwersalnego dostępu do całej wiedzy”.

Pod adresem 300 Funston Ave. w San Francisco spotkamy dość masywny budynek. Jest to stary kościół wyznawców Chrystusa Naukowca (Church of Christ, Scientist - nie mylić z Scientologami!), co tłumaczy klasyczną, niesakralną fasadę.

W środku, w większość piątków około godziny 13:00, wita nas założyciel - Brewster Kahle. W trakcie oprowadzki dowiemy się o aktualnych prowadzonych aktywnościach Archiwum Internetu oraz bezpośredniej historii - jak fundacja rozpoczęła od archiwizacji internetu w latach 90, przez archiwizację książek (oraz perypetie z pozwami wydawców), gazet, mikrofilmów, muzyki aż po klasyczne gry komputerowe z starych konsol.

“Pytacie czemu znajdujemy się w tym budynku? Bo wyglądał jak nasze logo - musieliśmy go kupić!” ~ Brewster Kahle

Wchodzimy piętro wyżej, do nawy głównej byłego kościoła. Teraz jest to dość eleganckie centrum konferencyjne, akurat dzisiaj przygotowane do wydarzenia skierowanego na dziennikarzy i to jak walczyć obecną dezinformacją w internecie. Dookoła, przy ścianach znajdują się figury przedstawiające wszystkich kontrybutorów i pracowników Archiwum Internetu. Jak widać, jest ich dosyć dużo!

Za nami coś dla każdego fana “blinkenlights” - dwa zestawy po trzy szafki rackowe “Petabox”, czyli infrastruktury umożliwiającej pracę archiwum. To na tych maszynach przetrzymywane są zasoby archiwizowane przez cyfrową bibliotekę, chociaż te konkretne stanowią zaledwie 10% całości. Jak zwraca uwagę fundator, każde migające światełko przy każdym z dysków to jedna operacja odczytu archiwalnych zasobów przez kogoś na świecie. Poniżej załączam video - obejrzyjcie je koniecznie z dźwiękiem, który wypełnia całe pomieszczenie.

Zwrócę uwagę na “ołtaż”; po lewej stronie możemy zauważyć pierwsze 9 cyfr liczby pi, a po prawiej - 3 kody stanu HTTP; 200, 404 oraz 451. Ten ostatni to w szczególności kod odpowiadający za zasób “Niedostępny z powodów prawnych”, coś z czym archiwum niestety spotyka się coraz częściej w postaci nieracjonalnych i często bezpodstawnych wniosków o usunięcie danych z archiwum przez wielkich wydawców. Jak zwraca uwagę fundator, nawet sądy coraz częściej wydają wyroki, które godzą w prawa bibliotek do przechowywania i udostępniania licencjonowanych kopii dzieł medialnych. Sama liczba 451 zawiera w sobie element “humorystyczny” - jest to temperatura samozapłonu papieru w stopniach Fahrenheita oraz aluzja do książki o tym samym tytule - “Fahrenheit 451”.
Na ołtarzu znajduje się też instalacja, która pierwotnie była zainstalowana w Bibliotece Kongresu Stanów Zjednoczonych. Wizualizuje ona pierwszy “zrzut” internetu, który został umieszczony w zasobach Kongresu.


W trakcie krótkiej sesji pytań i odpowiedzi, zeszliśmy na ważny wątek praw autorskich i relacji wydawców treści oraz ich konsumentów. Nie ma tutaj owijania w bawełnę - coraz mniej posiadamy jako osoby indywidualne. Objawia się to między innymi przez korzystanie np. z usług streamingowych muzyki czy filmów, które udzielają nam tylko tymczasowego dostępu do licencji na dany utwór. W kontrze stoi posiadanie fizycznych kopii bądź ekskluzywnych praw, które następnie możemy odstąpić naszym znajomym czy kolejnym pokoleniom. Ten problem dotyczy również bibliotek. Tak jak ponad 100 lat temu amerykańskie i światowe biblioteki były wypchane wiedzą, współcześnie coraz ciężej jest tym samym instytucjom archiwizować i udostępniać wiedzę. Wydawcy wręcz upewniają się, że biblioteki nie posiadają fizycznych kopii, a jedynie licencje dostępowe i subskrypcje. Ten sam problem dotyczy usług streaming’owych muzyki, artykułów naukowych etc. Dochodzimy do absurdu w którym najmłodsze pokolenia dorastają w środowisku w którym nie mają dostępu do wolnych informacji, a klasyczne biblioteki się zamykają, albo nie mają dostępu do najnowszej wiedzy.

Po odrobinę przygnębiającej wizji świata, czas na odskocznię - idziemy na lody, dosłownie.

Dalej rozmawiam z Rogerem Macdonald’em, który zajmuje się najnowszym obszarem działalności Archiwum Internetu - digitalizacją i archiwizacją kanałów telewizyjnych. Częściowo jest to powiązane z otrzymaniem archiwum po zmarłej Marion Stokes, która stworzyła archiwum ponad 30 lat amerykańskiej TV nagranej na kasetach VHS. Takich archiwów nie mają nawet same stacje telewizyjne, a wręcz same aktywnie usuwają swoje zasoby.

Oprócz digitalizacji starych materiałów (powyższy zasób zajmie im wiele lat i miliony dolarów), Archiwum przyjmuje nowe materiały. Są bardzo zainteresowani współpracą z każdym, kto może im dostarczyć cyfrowy strumień telewizji na żywo - czy to kablówki, telewizji naziemnej czy satelitarnej. Dalej posiadają narzędzia do wyłapywania metadanych, napisów oraz ich tłumaczenia przy pomocy modeli językowych. Jako jeden z przykładów zastosowania przedstawili śledzenie sytuacji w mediach przed atakiem Rosji na Ukrainę, szczególnie w kontekście dezinformacji i zmieniających się narracji. Bez archiwizacji takich zasobów ciężko zauważyć, a na pewno udowodnić, jak subtelnie może działać dezinformacja w współczesnym świecie masowego przekazu.

Call to Action

Tutaj wchodzi wątek polski. Jeżeli znacie kogoś, lub sami chcielibyście zacząć dostarczać do IA strumień polskiej telewizji, będzie to mile widziane a nawet bardzo potrzebne z perspektywy prezerwacji cyfrowej historii. Celem jest podprowadzenie cyfrowego strumienia video do infrastruktury Archive.org, którzy zrobią z nim co uważają, we własnej dyskrecji.

Pomysł na projekt? System dygitalizacji strumieni analogowych do strumienia cyfrowego. W miarę możliwości z meta-danymi (napisy, opcje językowe, telegazeta). Poniżej analogiczna instalacja w siedzibie:

Poczyniłem kiedyś o tym posta, ale w zamyśle miało działać w drugą stronę; z mediów cyfrowych do analoga:

Więcej czytania

https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/

1 polubienie