Klasyczne Black Hat SEO to przeszłość
Search Engine Optimization (SEO) to szereg działań, które pozwalają zwiększyć widoczność stron internetowych dla użytkowników wyszukiwarek. White Hat SEO to działania ukierunkowane na poprawę doświadczeń użytkownika (user experience, UX) z uwzględnieniem algorytmów wyszukiwania. Z kolei Black Hat SEO (Black Hat Search Engine Optimization) obejmuje aktywności ukierunkowane na tzw. machine experience, które mają na celu „przechytrzenie” algorytmów indeksujących.
W erze Web 1.0 niezwykle szybko popularne stały się zabiegi z rodzaju ilościowych, które w sztuczny sposób windowały pozycję witryn internetowych w rankingach wyszukiwarek. Znaczenie miała ilość, a nie jakość. W konsekwencji na czołowych miejscach wyników wyszukiwania pojawiały się rezultaty niezgodne z oczekiwaniami użytkowników – treści mało wartościowe lub bezwartościowe. Wtedy też powszechnie stosowane były systemy wymiany linków oraz tzw. farmy linków – cyfrowe ekosystemy, gdzie przechowywano niezliczoną liczbę hiperłączy, którymi karmić miały się algorytmy wyszukiwarek. W sztuczny sposób podbijało to pozycję witryny w wynikach wyszukiwania w myśl „im więcej linków polecających, tym lepsza strona”. Powszechnie wykorzystywano także zduplikowane i nienaturalne treści przesycone słowami kluczowymi. Zmiany w algorytmach wyszukiwarek ukróciły te praktyki, sprawiając że linki ze źródeł słabej jakości stały się bezużyteczne.
Black Hat SEO
Zasadniczo techniki Black Hat SEO (black hat SEO tricks) można podzielić na off-page (poza witryną) oraz on-page (w obrębie witryny, na stronie) [Malaga 2010]. Do technik Black Hat SEO zaliczane są m.in.: 1) keyword stuffing, czyli tzw. upychanie słów kluczowych, które sprawia, że tekst traci walory naturalnej wypowiedzi, 2) cloaking, czyli maskowanie, ukrywanie treści, która przygotowywana jest w wariantach dla użytkownika i dla robota sieciowego, 3) ukrywanie treści i linków poprzez np. manipulacje kolorami lub wielkością czcionek oraz 4) stosowanie wszelkiego rodzaju zaplecza słabej jakości typu „thin content”, zawierającego treści zduplikowane, wygenerowane automatycznie lub nienaturalne. Są to jednak praktyki powszechnie znane i stosunkowo łatwe do zidentyfikowania w sposób zautomatyzowany. Konsekwencją ich stosowania może być (znaczące) obniżenie miejsca w rankingu lub nawet całkowite usunięcie witryny z indeksu wyszukiwarki.
Grey Hat SEO
Wyszukiwarki stale ulepszają algorytmy, aby dostarczać użytkownikom najtrafniejsze wyniki wyszukiwania. Optymalizacja pod kątem wyszukiwarek ewoluuje razem z nimi. Toporne, „starodawne” i łatwe w zidentyfikowaniu techniki czarnego kapelusza odeszły do lamusa, ale w ich miejsce pojawiły się nowe, bardziej wyszukane.
Istnieje wiele wysublimowanych technik wpływania na miejsce witryny w wynikach wyszukiwania, które są przez niektórych zaliczane do tzw. Grey Hat SEO. Stosowanie technik szarego kapelusza polega na maksymalnym wykorzystaniu możliwości jakie daje cyfrowy ekosystem, mieszcząc się jednak w granicach rekomendacji Google Developers [Duk i in. 2013]. Jednocześnie ciągle pojawiają się coraz to nowe techniki z pogranicza Black Hat SEO oraz Grey Hat SEO, jak np. Spider Pools [Du i in. 2016].
Twórcy tzw. „pętli” używają domen o niskiej jakości do budowania sieci linków i zatruwania słów kluczowych typu longtail (słowa kluczowe z długiego ogona wyszukiwania). W dużym uproszczeniu działanie to polega na konstruowaniu skomplikowanej, zapętlonej struktury, aby zmusić roboty indeksujące do ciągłego odwiedzania danej strony [Du i in. 2016].
Stealthy Defacement (Web Site Defacement) to działania polegające na starannym wyborze kilku obszarów witryny internetowej mających największy wpływ na jej miejsce w rankingu i wprowadzeniu niewielkich modyfikacji tylko w tych obszarach. Jest to na tyle dyskretne działanie, że może pozostać niezauważone, a dzięki niemu witryna będzie plasowana na wysokich miejscach w wynikach wyszukiwania. Coraz powszechniej stosowane są także zabiegi z zakresu Keyword Obfuscation, tj. zaciemniania słów kluczowych nielegalnych produktów, aby ominąć blokady wyszukiwarek [Yang i in. 2021]. Z kolei tzw. Search Poisoning (search engine poisoning) to techniki „zatruwania wyników wyszukiwania” w celu przekierowania jak największej liczby użytkowników do (tymczasowych) witryn internetowych, które generują duży ruch w „złośliwych celach” [Lu i in. 2011]. Osoby atakujące tworzą strony internetowe o nazwach i opisach powiązanych z popularnymi lub modnymi tematami. Przykładowo w tygodniach przedświątecznych tworzone są witryny z tematyką prezentów, kulinariów lub wystroju świątecznego. Witryny mogą zawierać treści skradzione, a ich celem jest zainfekowanie złośliwym oprogramowaniem lub pozyskanie poufnych informacji. Bardziej wyszukanym działaniem typu Black Hat SEO jest także Semantic Confusion [Yang i in. 2021].
Zaawansowane techniki są stosowane przeważnie przez bardziej doświadczonych użytkowników Internetu. Są trudniejsze w zidentyfikowaniu i bliżej im do działań przestępczych, niż nadużyć typu Black Hat SEO.
Źródła
- Du, K., Yang, H., Li, Z., Duan, H., Zhang, K. (2016). The Ever-Changing Labyrinth: A Large-Scale Analysis of Wildcard {DNS} Powered Blackhat {SEO}. In 25th {USENIX} Security Symposium ({USENIX} Security 16) (pp. 245-262).
- Duk, S., Bjelobrk, D., Čarapina, M. (2013). SEO in e-commerce: balancing between white and black hat methods. In 2013 36th International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO) (pp. 390-395). IEEE.
- Lu, L., Perdisci, R., Lee, W. (2011). Surf: detecting and measuring search poisoning. In Proceedings of the 18th ACM conference on Computer and communications security (pp. 467-476). https://doi.org/10.1145/2046707.2046762
- Malaga, R. A. (2010). Search engine optimization—black and white hat approaches. In Advances in Computers, 78, 1-39. http://dx.doi.org/10.1016/S0065-2458(10)78001-3
- Yang H. et al. (2021). Mingling of Clear and Muddy Water: Understanding and Detecting Semantic Confusion in Blackhat SEO. In: Bertino E., Shulman H., Waidner M. (eds) Computer Security – ESORICS 2021. ESORICS 2021. Lecture Notes in Computer Science, vol 12972. Springer, Cham. https://doi.org/10.1007/978-3-030-88418-5_13
- Yang, R., Wang, X., Chi, C., Wang, D., He, J., Pang, S., Lau, W. C. (2021). Scalable Detection of Promotional Website Defacements in Black Hat {SEO} Campaigns. In 30th {USENIX} Security Symposium ({USENIX} Security 21).