Digital Vellum: cyfrowa migawka w służbie ludzkości
Wątpliwe jest, aby ludzie mogli korzystać z dzisiejszych cyfrowych materiałów za 10 lub 20 lat, nie mówiąc już o perspektywie 100 lat, pomimo tego, że nadal będą mogli wchodzić w interakcje z tymi wiekowymi dokumentami. Niepokojące jest to, że wraz z rosnącą ilością danych znaczna ich część może być niedostępna dla przyszłych pokoleń z powodu zjawiska bit rot [Hayes 1998, Odersky i Moors 2009].
Zgnilizna bitów (bit rot) oznacza nieodwracalną degradację lub utratę informacji cyfrowych, gdy infrastruktura (sprzęt i oprogramowanie) wymagana do uzyskania dostępu, interpretacji, przeglądania i korzystania z tych informacji nie jest już dostępna [Kosciejew 2015].
Cyfrowa migawka
Propozycją swoistego panaceum na zjawisko bit rot jest tzw. Digital Vellum (cyfrowy welin). Autorem koncepcji Digital Vellum jest Vinton Gray Cerf (Vint Cerf). Vellum (pol. welin) to pergamin wysokiej jakości wykonywany ze skóry zwierzęcej. Jest synonimem trwałego, luksusowego nośnika treści [Cerf 2011]. Z kolei Digital Vellum to utrwalenie ekosystemu cyfrowego wraz z podtrzymującą jego egzystencję infrastrukturą – swoiste zdjęcie rentgenowskie zawartości dysków, aplikacji i systemu operacyjnego wraz z opisem maszyny. Digital Vellum zakłada zachowanie „cyfrowej migawki”, tak aby możliwe było odtworzenie przeszłości w przyszłości. Wszystko to w celu zachowania informacji o plikach, oprogramowaniu i sprzęcie dla przyszłych pokoleń [Mottl 2015].
Głównym składnikiem Digital Vellum są znormalizowane opisy, które mają zapewnić dostępność, zrozumiałość i użyteczność informacji. V. Cerf stwierdził, że kluczowe jest to, aby podczas przenoszenia informacji z jednego miejsca na drugie było jasne, jak je rozpakować i poprawnie zinterpretować poszczególne komponenty. Wymaga to zapewnienia, że w odległej przyszłości standardy odczytu będą nadal znane i pozwolą zinterpretować cyfrową migawkę. Struktura informacji w migawce musi być znormalizowana i nadal znana, lub przynajmniej dostępna i zrozumiała, aby umożliwić ich wykorzystanie i zapewnić migrację danych w ciągłym postępie technologicznych [Kosciejew 2015].
Pojawiły się już pierwsze testy Digital Vellum. Według Iana Sample badacze z Carnegie Mellon University robią cyfrowe migawki starych komputerowych dysków twardych podczas pracy z różnymi programami, które są następnie przesyłane na nowy komputer, który może „naśladować ten sfotografowany” i odczytać pliki. Naukowcom udało się „wskrzesić” np. wczesną wersję Mystery House (gra przygodowa na Apple II z lat 80. XX wieku) oraz grę Doom (first-person shooter z 1993 r.). Prace nad koncepcją Digital Vellum i jego zastosowaniem nadal trwają [Kosciejew 2015].
Prawa autorskie, licencje i patenty
Digital Vellum to nie tylko kwestie techniczne, ale także, lub przede wszystkim, ekonomiczne i prawne. Jest to projekt niekoniecznie opłacalny komercyjnie, a jego dalszy rozwój wymaga zaangażowania środków finansowych i inwestycji technologicznych. Istnieje niewiele zachęt biznesowych do rozwijania tej koncepcji. Nie sprzyjają temu również uwarunkowania prawne. Dostępność większości danych cyfrowych jest ograniczana m.in. prawem autorskim, patentami, licencjami i innymi prawami. Koszty wykupu praw mogą być wygórowane lub wręcz zaporowe. Dlatego też V. Cerf zaproponował, aby prawo autorskie, licencje i prawo patentowe umożliwiało zachowanie i udostępnienie oprogramowania przyszłym pokoleniom [Kosciejew 2015].
Samo sformułowanie ‘digital vellum’ pojawiło się dużo wcześniej niż koncepcja V. Cerfa, np. w pracy Terry Kuny, choć w nieco mniej technologicznym kontekście. Kuny [1998] już kilkadziesiąt lat temu zwrócił uwagę, że pomimo braku zainteresowania opinii publicznej ochroną zasobów cyfrowych należy mieć nadzieję, że wysiłki archiwistów podejmowane w tym zakresie zostaną docenione w przyszłości. Dane, które będą możliwe do ocalenia z digital vellum, będą cennym źródłem informacji dla przyszłych pokoleń. Nawet jeśli zadanie ochrony zasobów cyfrowych pozostaje niewdzięczne, jest ono niezbędne i należy je podjąć. Cel jest szlachetny i konieczny, pomimo że wiele problemów wydaje się obecnie trudnych do rozwiązania.
Virtual Vellum
Virtual Vellum to projekt dla e-nauki, którego celem jest promowanie i demonstrowanie wykorzystania technologii w badaniach w dziedzinie sztuki i nauk humanistycznych [Blanke i in. 2009]. Projekt obejmował prace nad narzędziem umożliwiającym komfortowe przeglądanie w internecie obrazów o bardzo wysokiej rozdzielczości, zwykle większych niż 8k x 6k pikseli, przykładowo – zdigitalizowanych manuskryptów. W pierwszej prezentacji narzędzia, w trakcie wirtualnych warsztatów, które odbyły się w 2007 roku wykorzystano zdigitalizowane rękopisy Jeana Froissarta będące zapisem 100-letniej wojny między Anglią i Francją z XIV wieku [VV 2007]. Te obrazy są nie tylko interesujące historycznie, ale także niezwykle „kruche” i cenne. Dostęp do nich jest zatem ograniczony [Blanke i in. 2009].
Wyzwaniem dla Virtual Vellum było umożliwienie natychmiastowego dostępu do tak dużych obrazów z zachowaniem komfortu przeglądania. Istotna jest duża rozdzielczość obrazów ponieważ badacze są szczególnie zainteresowani detalami, które stanowią o różnicach i podobieństwach między nimi. Virtual Vellum wykorzystuje struktury danych oparte na kafelkach i format JPEG 2000. Wraz z plikami konfiguracyjnymi XML, JPEG 2000 może częściowo zautomatyzować proces kafelkowania. Korzystając z kafelków, użytkownicy nie muszą oglądać całego obrazu na raz, a tylko odpowiednie kafelki [Blanke i Hedges 2008, Blanke i in. 2009].
Źródła
- Blanke, T., Hedges, M. (2008). Providing linked-up access to Cultural Heritage Data. In ECDL 2008 Workshop on Information Access to Cultural Heritage. Aarhus, Denmark.
- Blanke, T., Hedges, M., Dunn, S. (2009). Arts and humanities e-science – current practices and future challenges. Future Generation Computer Systems, 25(4), 474-480. https://doi.org/10.1016/j.future.2008.10.004
- Cerf, V. G. (2011). Avoiding “Bit Rot”: Long-Term Preservation of Digital Information [Point of View]. Proceedings of the IEEE, 99(6), 915-916. https://doi.org/10.1109/JPROC.2011.2124190
- Hayes, B. (1998). Bit rot. American Scientist, 86(5), 410-415.
- Kosciejew, M. (2015). Digital vellum and other cures for bit rot. Information Management Journal, 49(3), 20-26.
- Kuny, T. (1998). The digital dark ages? Challenges in the preservation of electronic information. International preservation news, 17, 8-13.
- Mottl, J. (2015). Internet Pioneer Vint Cerf Warns Of Bit Rot And Digital Dark Age But Don’t Panic Yet. Tech Times. Retrived from: https://goo.gl/Wmo4nu
- Odersky, M., Moors, A. (2009). Fighting Bit Rot with Types (Experience Report: Scala Collections). Leibniz International Proceedings in Informatics, 4, 427-451. https://doi.org/10.4230/LIPIcs.FSTTCS.2009.2338
- VV (2007). Virtual Vellum. The University of Sheffield, https://www.dhi.ac.uk/projects/virtual-vellum/
Pingback: Cyfrowy ślad: utracone za zawsze, jednak niezapomniane… – Karol Król
Pingback: Era utraconych danych – zgnilizna bitów, rozkład danych i cyfrowe popioły – Karol Król