Każdy link jest obietnicą. Czym wykonać audyt linków wewnętrznych i wychodzących?
Dwie dekady po tym, jak zdiagnozowano zjawisko linkrot, niedziałające linki są nadal plagą nękającą Internet, i to plagą, która narasta. Już 20 lat temu J. Nielsen [1998] zwrócił uwagę, że: „Wskazane jest regularne uruchamianie walidatora linków na każdej stronie(…)”. Zatem czym wykonać audyt linków wewnętrznych i wychodzących? Pewnych wskazówek może dostarczyć test bezpłatnych narzędzi testujących, któremu poddano wybrane rozszerzenia przeglądarek internetowych oraz wybrane aplikacje internetowe.
W przypadku małych witryn wystarczająca może być zlecona (zaprogramowana) weryfikacja „zdrowia linków” (health of links, healthy URLs) wykonywana przez aplikacje, które mogą testować witrynę raz w miesiącu i wysyłać listę martwych linków. W przypadku większych witryn bardziej opłacalne jest instalowanie oprogramowania do walidacji na samym serwerze [Nielsen 1998].
Every link is a promise
Każdy link jest obietnicą. Każda niespełniona obietnica, duża lub mała, może wpłynąć na utratę zaufania i wiarygodności. Niespełnione obietnice — pobrania pliku, zapoznania się z materiałem wideo lub określonym tekstem mogą sprawić, że użytkownik poczuje się poirytowany, rozczarowany, a nawet oszukany. Zepsute linki mogą także wywoływać wrażenie, że strona jest zaniedbana i nie jest obsługiwana — aktualizowana i odświeżana. Ponadto niedziałające linki mogą negatywnie wpłynąć na plasowanie witryny w wynikach wyszukiwania. Z drugiej strony, gdy linki spełniają swoją rolę, użytkownicy poruszają się po witrynie płynnie i pewnie [Pernice 2014]. Regularna konserwacja witryny powinna obejmować audyt linków, w szczególności po większych aktualizacjach/modernizacjach. Częstotliwość audytu linków powinna zależeć od wielkości i złożoności witryny oraz częstości wprowadzanych zmian.
Zobacz czy twoja strona cierpi na zgniliznę linków. Zwisające linki i rozpad linków…
Short cut! Causes of broken links — przyczyny „martwicy linków”
1. URL misspelling — najczęstszą przyczyną zerwania linków i szerzenia się zjawiska link rot jest człowiek, i to bez względu na witrynę [Berners-Lee (1998, W3C): What makes a cool URI? A cool URI is one which does not change. What sorts of URI change? URIs don’t change: people change them.]. Nieprawidłowy adres URL w menu, brakująca litera, niewłaściwy znak lub niepoprawna pisownia (literówka) będą generować błąd 404.
2. Change of the site structure — równie często niedziałające linki pojawiają się w wyniku zmiany struktury witryny np. migracji treści na inny CMS. Never let any URL die — nie pozwól aby twoje linki umarły (popsuły się) [Nielsen 1998].
3. Content no longer exists — (patrz punkt pierwszy). Z różnych przyczyn dana strona lub zasób mogą nie być już dostępne pod danym adresem np. z powodu zmiany nazwy pliku.
Czym są wtyczki? Co to są pluginy?
Znakomita większość użytkowników Internetu korzysta z przeglądarek internetowych. Te z kolei mają określone przeznaczenie i funkcjonalności, które z niego wynikają. Standardowo przeglądarki nie są wyposażane w specjalistyczne narzędzia i różnego rodzaju dodatki, np. „blokery” reklam lub programy ułatwiające czytanie tekstu (np. Tranquility Reader). Pewne urozmaicenie w tym zakresie wnoszą rozszerzenia (browser extension), które są bardzo popularne. Już w 2009 roku co trzeci użytkownik przeglądarki Firefoks posiadał co najmniej jedno rozszerzenie przeglądarki [Utakrit 2009]. Popularność dodatków do przeglądarek sprawiła, że każdego roku rośnie ich liczba. Jednocześnie jednak niewiele uwagi poświęca się bezpieczeństwu rozszerzeń (rozszerzenia przeglądarek często nie są tworzone przez ekspertów od bezpieczeństwa, a wiele rozszerzeń zawiera luki w zabezpieczeniach) [Barth i in. 2009].
Wyszukiwarka to nie to samo, co przeglądarka internetowa. Wyszukiwarki uruchamiane są w oknie przeglądarek internetowych. Przykładem wyszukiwarek są Google lub Bing. Przykładowe przeglądarki to Opera lub Chrome.
Rozszerzenie to mała aplikacja, która zapewnia dodatkowe funkcje przeglądarkom [Blum i LeBlanc 2009]. Rozszerzenia przeglądarek można podzielić na cztery zasadnicze typy: (1) dodatki (add-ons), (2) wtyczki (plugins), (3) obiekty pomocnicze przeglądarki (browser helper objects, BHOs, charakterystyczne dla przeglądarki IE), oraz (4) ‘zewnętrzne’ wtyczki (unplugs) [Croll i Power 2009]. Vugt [2009, s. 80] zauważył, że „Add-on jest terminem utożsamianym z wszystkimi rozszerzeniami przeglądarek” (Add-on is a catch-all term that includes extensions). Pogue [2004, s. 330] skonkludował, że „Dodatek może być dowolnym oprogramowaniem, które wzmacnia przeglądarkę internetową.” (An add-on can be any bit of software that beefs up the Web browser.). Wtyczki (plugins) to samodzielne oprogramowanie o nieograniczonym dostępie do przeglądarki, które może np. odtwarzać plik audio lub wideo np. Java, QuickTime, Windows Media Player, Adobe Acrobat lub Flash [Croll i Power 2009]. ‘Unplug’ extension pozwala użytkownikom na np. zapisywanie osadzonych strumieniowych treści wideo, takich jak YouTube i MySpace w formie pliku wideo na komputerze [Blum i LeBlanc, 2009].
Pstryczek–elektryczek (?)
Aplikacja Check My Links (Chrome Extension) przeszukuje stronę w poszukiwaniu uszkodzonych linków (martwych linków). Aplikacja działa w trybie graficznym. Linki wyróżniane są na wzór „zakreślacza” znanego z edytorów tekstu. Stosownie do wyniku audytu, linki oznaczane są kolorem — począwszy od odcieni zieleni (kod 200), skończywszy na bordowym ostrzeżeniu (ryc. 1).
Rycina 1. Okno dialogowe aplikacji Check My Links
Źródło: zrzut ekranu
Aplikacja Check My Links „znakuje” (komunikatem ostrzeżenia) także linki: (1) bez wyraźnego wskazania zasobu tj. wypełnione kratką (#), (2) linki puste (empty href tag), oraz (3) niekompletny znacznik zakotwiczenia (no href tag). Linki „nofollow” są sprawdzane po zmianie ustawień domyślnych aplikacji.
Broken Link Checker (Chrome Extension), podobnie jak aplikacja Check My Links „koloruje linki”. Okno dialogowe aplikacji umiejscowione jest po prawej stronie okna przeglądarki (ryc. 2). Audyt wykonywany przez rozszerzenie jest skromny. Użytkownicy zainteresowani dokładniejszym testem zmuszeni są skorzystać z walidatora, który przyjmuje postać aplikacji internetowej Atomseo (swoją drogą użyteczne narzędzie, jednak w wersji bezpłatnej z licznymi ograniczeniami). Aplikacja przeglądarkowa zwraca pełny raport opisujący w szczegółach stan linków odnalezionych w strukturze całej witryny, w tym uszkodzone linki wewnętrzne i wychodzące.
Rycina 2. Okno dialogowe aplikacji Broken Link Checker
Źródło: zrzut ekranu
Okno dialogowe aplikacji Link Checkr (Chrome Extension) umiejscowione jest po lewej stronie okna przeglądarki, jednak co użyteczne, można je chwycić i przenieść w dowolne miejsce (ryc. 3). Ma to szczególne znaczenie, gdy uszkodzony link znajduje się dokładnie pod oknem dialogowym aplikacji. W przypadku poprzednich aplikacji brak takiej możliwości. Po kliknięciu w wynik audytu prezentowana jest dyskretna tabela ze szczegółami raportu.
Rycina 3. Okno dialogowe aplikacji Link Checkr
Źródło: zrzut ekranu
Automatic Backlink Checker (Chrome Extension) to podręczne rozszerzenie przeglądarki (ryc. 4). Kiedy pozostaje w trybie włączonym, skanuje i oznacza wskazanym kolorem wszystkie linki na stronie, z podziałem na uszkodzone, follow oraz nofollow. Jednak mozaika kolorów utrudnia jednoznaczną identyfikację linków uszkodzonych, które są oznaczane przekreśleniem. Aplikacja nie raportuje też „rodzaju” uszkodzenia.
Rycina 4. Okno dialogowe aplikacji Automatic Backlink Checker
Źródło: zrzut ekranu
Audyt linków za pomocą aplikacji internetowej
Audyt linków wewnętrznych i wychodzących umożliwiają także aplikacje uruchamiane w oknie przeglądarki internetowej (tab. 1). Czy są bardziej użyteczne od rozszerzeń przeglądarek?
Tabela 1. Wyniki audytu linków wewnętrznych witryny A — zestawienie wybranych aplikacji
Online application | Total scaned links | Errors | Satus raports (code 200, 404, 403 etc.) | Test links to files or graphics that are links | Broken link location on the HTML code |
Atomseo Broken Links Checker | 678 | 7 | + | + | — |
Dead link checker | 976 | 109 | + | + | — |
Online Broken Link Checker | No data | 1 | + | — | + |
Dr. Link Check | Zachęcam do testów | ||||
W3C Link Checker | Zachęcam do testów |
Źródło: opracowanie własne
Czym jest aplikacja internetowa? What is a web application (web app)?
Aplikacja internetowa to program komputerowy wykonany w architekturze klient-serwer, w przypadku którego klient (w tym interfejs użytkownika) działa w przeglądarce internetowej. Komputer użytkownika występuje w tej relacji jako tzw. cienki klient (thin client). Infrastrukturę niezbędną do uruchomienia aplikacji zapewnia usługodawca. Przeglądarka jest w tym przypadku uniwersalnym programem, który umożliwia korzystanie z aplikacji internetowej. Żadne dodatkowe oprogramowanie nie jest wymagane.
Trudno jednoznacznie wskazać różnicę między dynamiczną stroną internetową a aplikacją internetową, choć można w tym miejscu zwrócić uwagę na wyróżnik, jakim może być zakres funkcjonalności danego serwisu. Jeżeli funkcjonalność witryny jest zaawansowana i porównywalna do możliwości programów komputerowych lub aplikacji mobilnych, to taka witryna jest przeważnie określana jako aplikacja internetowa. Ewolucja standardów tworzenia aplikacji internetowych wynika w dużej mierze z dostępności szerokiej gamy edytorów internetowych i systemów zarządzania treścią (CMS). Platformy oparte na kolekcjach graficznych kontrolek lub bibliotekach predefiniowanych elementów pozwalają w prosty sposób komponować dokument hipertekstowy z interaktywnymi elementami bez edytowania kodu źródłowego. Dokumenty statyczne zostały zastąpione interaktywnymi, które zapewniają zestaw funkcjonalności niemal identyczny z oprogramowaniem instalowanym lokalnie [Latorre i in. 2014].
From Java Servlet Technology Overview: Aplikacja internetowa to zbiór serwletów, stron HTML, klas i innych zasobów, które można łączyć i uruchamiać w wielu pojemnikach (kontenerach) od wielu dostawców. Aplikacja internetowa jest zakorzeniona w określonej ścieżce na serwerze sieciowym {A web application is a collection of servlets, html pages, classes, and other resources that can be bundled and run on multiple containers from multiple vendors. A web application is rooted at a specific path within a web Server [Chaffee 2012]}.
Wstęp do encyklopedii linków (Audyt linków — wskazówki, ciekawostki, zalecenia)
Narzędzia pomocne w charakterystyce witryny internetowej (część II)
Wstęp do encyklopedii linków to syntetyczne opracowanie, które przedstawia wybrane, kluczowe zagadnienia związane z zarządzaniem profilem linków.
Atomseo Broken Links Checker (free online SEO tool)
Atomseo to użyteczne narzędzie. W wersji bezpłatnej dostępnych jest 5 raportów dziennie, w tym jeden raport dla jednej domeny (audyt obejmuje 1000 stron danej witryny). Plan darmowy ma więcej ograniczeń zatem może służyć do okazjonalnego testowania niedużych stron. Prezentacja wyników audytu jest ograniczona do adresu URL, który jest uszkodzony, miejsca gdzie występuje uszkodzenie, rodzaju uszkodzenia (kod błędu) oraz oceny stopnia „powagi uszkodzenia” (impact).
Dead link checker (Site Checker: Free Broken Link Tool)
Na wstępie użytkownik ma do dyspozycji opcję audytu całej witryny lub tylko wskazanej strony. Narzędzie Dead link checker jest udostępniane bezpłatnie. Umożliwia testowanie wielu witryn jednocześnie, lecz po utworzeniu konta użytkownika. Prezentacja wyników jest zrozumiała, jednak wskazanie lokalizacji uszkodzonego linku w kodzie byłoby pomocne przy jego lokalizacji.
Online Broken Link Checker
Aplikacja Online Broken Link Checker jest udostępniana bezpłatnie. Testy wykonywano w trybie pełnym – „Zgłoś wszystkie wystąpienia każdego martwego łącza”. Analizie poddawane są linki tekstowe prowadzące do witryn internetowych (dokumentów hipertekstowych). Ogólnodostępna wersja aplikacji Broken Link Checker nie umożliwia weryfikacji linków odsyłających do dokumentów (PDF, DOC, XLS itp.). Ponadto aplikacja nie weryfikuje „uszkodzeń” linków przyjmujących postać obrazów, plików graficznych (linków obiektowych). Zaletą aplikacji Online Broken Link Checker jest dokładne wskazanie uszkodzonego linku w kodzie HTML.
Rekapitulacja
Zasada działania testowanych rozszerzeń jest podobna (tab. 2). Linki są kolorowane tzw. zakreślaczem. Bywają też opisywane kodem błędu. Rozszerzenia przeglądarki wykonujące audyt linków wewnętrznych i wychodzących to właściwie takie swoiste „pstryczki-elektryczki”, doraźne zajawki (zabawki?). Ich zaletą jest to, że są zawsze pod ręką. Dodatki te przeważnie jedynie sygnalizują wystąpienie problemu z linkiem. Brak tu wskazania precyzyjnej lokalizacji „uszkodzenia” linku w kodzie. Ponadto audytowana jest jedynie aktualnie przeglądana strona, a nie wszystkie strony witryny. Użyteczność rozszerzeń byłaby większa po umożliwieniu przesuwania okna dialogowego. W dniu testu umożliwiała to jedynie aplikacja Link Checkr.
Tabela 2. Wyniki audytu linków wewnętrznych witryny A — zestawienie wybranych aplikacji
Chrome Extensions (browser extensions) | Total scaned links (on this page) | Errors | Status (code 200, 404, 403 etc.) |
Check My Links | 142 | 4 | — |
Broken Link Checker | 140 | 4 | + |
Link Checkr | 142 | 6 | + |
Checkbot | n/d | Odsyła do aplikacji internetowej | |
Automatic Backlink Checker | 142 | 4 | — |
Źródło: opracowanie własne
Zdecydowanie większe możliwości testowania profilu linków wewnętrznych i wychodzących mają aplikacje internetowe. Stosując walidację krzyżową można wychwycić większą liczbę uszkodzonych linków i je naprawić. Może to wpłynąć to na użyteczność serwisu (UX) oraz tzw. machine experience.
Źródła
- Barth, A., Felt, A. P., Saxena, P., Boodman, A. (2009). Protecting Browsers from Extension Vulnerabilities. Technical Report No. UCB/EECS-2009-185. Electrical Engineering and Computer Sciences University of California at Berkeley.
- Blum, R., LeBlanc, D.-A. (2009). Linux for dummies: For Dummies. Wiley Publishing, Inc.
Chaffee, A. (2012). What is a web application (or „webapp”)? jGuru, http://www.jguru.com/faq/view.jsp?EID=129328 - Berners-Lee, T. (1998). Cool URIs don’t change. www.w3.org/Provider/Style/URI
- Croll, A., Power, S. (2009). Complete Web Monitoring. O’Reilly Media, Inc.
- Latorre, M., Robles-Gómez, A., Rodriguez, L., Orduna, P., San Cristobal, E., Caminero, A. C., … & Castro, M. (2014). A review of webapp authoring tools for e-learning. IEEE Global Engineering Education Conference (EDUCON), pp. 770-777). DOI: 10.1109/EDUCON.2014.6826181
- Nielsen, J. (1998). Fighting Linkrot. Nielsen Norman Group, https://www.nngroup.com/articles/fighting-linkrot/ (29.12.2018)
- Pernice, K. (2014). A Link is a Promise. Nielsen Norman Group, https://www.nngroup.com/articles/link-promise/ (29.12.2018)
- Pogue, D. (2004). Windows XP home edition: the missing manual: O’Reilly Media, Inc.
- Utakrit, N. (2009). A Review of Browser Extensions, a Man-in-the-Browser Phishing Techniques Targeting Bank Customers. Proceedings of the 7th Australian Information Security Management Conference, Perth, Western Australia. DOI: 10.4225/75/57b4164330df2
- Vugt, S. v. (2009). Ubuntu Netbooks: The Path to Low-cost Computing. Expert’s Voice in Open Source. Apress.
Pingback: Deep Web i Dark Web: niewidoczne zasoby Internetu – Karol Król