Webometrics, Bibliometrics, and Informetrics
Webometria (lub cybermetria, ang. webometrics or cybermetrics) to badanie zawartości, struktury i technologii World Wide Web przy użyciu przede wszystkim metod ilościowych. Webometria obejmuje mniej lub bardziej ogólne (zaawansowane) analizy Internetu.
Webometria i cybermetria są terminami często stosowanymi w kontekście bibliotekoznawstwa i informatyki. Webometria i cybermetria czerpią z dziedzictwa badań bibliometrycznych, które można wykorzystać w badaniach Internetu [Björneborn i Ingwersen 2001]. Ogólnie terminy te są powiązane i często używane jako synonimy [Björneborn i Ingwersen 2004].
Webometria
Webometria, tj. ilościowe badanie zjawisk zachodzących w sieci, wyłoniła się ze świadomości, że metody pierwotnie wykorzystywane w analizie bibliometrycznej, np. wzorców cytowania artykułów w czasopismach naukowych, można zastosować w Internecie, a komercyjne wyszukiwarki dostarczają surowych danych. Jeko metodologia czerpie przede wszystkim z bibliometrii [Thelwall i Vaughan 2004]. Webometria obejmuje badania z dziedzin wykraczających poza informatykę, takich jak komunikacja, fizyka statystyczna i informatyka [Thelwall i in. 2005].
Według Björneborn [2004] webometria to „badanie ilościowych aspektów budowy i wykorzystania zasobów informacyjnych, struktur i technologii w sieci (on the Web), oparte na podejściach bibliometrycznym i informatycznym {The study of the quantitative aspects of the construction and use of information resources, structures and technologies on the Web drawing on bibliometric and informetric approaches}. Webometria jest zatem terminem charakterystycznym dla bibliotekoznawstwa oraz nauk informatycznych (library and information science, LIS) [Björneborn i Ingwersen 2001].
Od czasu opublikowania koncepcji webometrii autorstwa Almind i Ingwersen [1997] badano takie atrybuty sieci jak: struktura linków do stron WWW [Benbow 1998 – jedna z pierwszych prac poświęconych zagadnieniu zgnilizny linków – link rok], wiarygodność stron internetowych, cytowania stron internetowych, dane demograficzne użytkowników [Thelwall 2009], ale także wydajność witryn [Król 2017], przystępność percepcyjną treści [Król 2018a] czy popularność witryn według światowych rankingów [Król 2019a], i wiele innych. Swoistym kompendium wiedzy z zakresu webometrii oraz Analityki 1.0 jest książka K.Króla [2018b], gdzie zaprezentowano wiele metod oraz narzędzi pomiaru licznych atrybutów witryn, na przykładzie zbioru witryn internetowych obiektów turystyki wiejskiej w Polsce.
Cybermetria
Cyber jako przedrostek został użyty po raz pierwszy w słowie cybernetyka, autorstwa Norberta Weinera [np. Weiner 1950]. Przez lata znaczenie tego słowa ewoluowało i obecnie obejmuje technologię informatyczną, Internet i rzeczywistość wirtualną. Cybermetria {’cybermetrics’ are 'cyber’ and 'metrics’} to nauka o pomiarach różnych atrybutów obiektów cybernetycznych. Witryny internetowe mogą być tu określane jako „cyber dokumenty” {Web sites (cyber documents)} [Sen 2004].
Cybermetria to pojęcie nieco szersze od webometrii (zob. ryc. 1), bowiem dotyczy Internetu jako całości: cybermetria to badanie ilościowych aspektów budowy i wykorzystania zasobów informacyjnych, struktur i technologii w całym Internecie, oparte na podejściach bibliometrycznym i informatycznym. {The study of the quantitative aspects of the construction and use of information resources, structures and technologies on the whole Internet drawing on bibliometric and informetric approaches [Björneborn 2004]}. Należy więc odróżnić zasoby WWW od Internetu, co jest zresztą zasadne, bowiem WWW jest częścią Internetu. Cybermetria obejmuje zatem np. badania (statystyczne) grup dyskusyjnych, list mailingowych i innej komunikacji realizowanej za pośrednictwem Internetu, a nie tylko strony internetowe jako takie czy (hiper)powiązania między nimi [Björneborn i Ingwersen 2004].
Rycina 1. Relacje między polami LIS informacji / biblio- / sciento- / cyber- / webo- / metryk
Źródło: opracowanie własne na podstawie: Toward a basic framework for webometrics [Björneborn i Ingwersen 2004]
Cybermetria to gałąź wiedzy, która wykorzystuje techniki matematyczne i statystyczne do kwantyfikacji stron internetowych lub ich komponentów i pojęć; mierzy dynamikę wzrostu ich liczby, stabilność, wykorzystanie; bada autentyczność treści; ustanawia przepisy regulujące te czynniki; bada efektywność informatycznych systemów, usług i produktów; i ocenia wpływ ery cybernetycznej na społeczeństwo [Sen 2004].
Definicja cybermetrii obejmuje aspekty ilościowe, zarówno po stronie konstrukcyjnej (technologicznej), jak i użytkowej, w czterech głównych obszarach [Björneborn 2004]: (1) analizy zawartości strony internetowej; (2) analizy struktury linków; (3) analizy użytkowania sieci, w tym pliku dziennika, który zawiera zapis zachowań użytkowników podczas wyszukiwania i przeglądania (tzw. rejestr zdarzeń) oraz (4) analizy technologii internetowych (w tym wydajność wyszukiwarek).
Webometryki vs Web analytics
Czym różnią się webometryki od analityki internetowej, np. Analytics 3.0 [zob. np. Davenport i Harris 2017]? W opinii prof. Mike Thelwalla webometrics jest terminem nauk społecznych dla analiz internetowych w ogóle, podczas gdy web analytics bardziej skupia się na komercyjnych analizach poszczególnych stron internetowych [korespondencja własna].
Rekapitulacja
Od 1997 roku webometria znacząco się rozwinęła, zarówno w zakresie metodologii, jak i narzędzi pomiaru. Badano różne typy obiektów internetowych lub zjawisk zachodzących w sieci, chociaż do tej pory najczęściej badanym obiektem były hiperłącza [Chu 2005, Król 2019b]. Tymczasem Vaughan i You [2010] zaproponowali nową koncepcję pomiaru zależności pomiędzy witrynami (nowy wskaźnik typu webmetrics) opartą na słowach, a nie na linkach. Postawili oni hipotezę, że współwystępowanie słów kluczowych na stronach internetowych może być miarą dla siły powiązań między podmiotami.
Szeroki zasięg cybermetrii i webometrii implikuje dużą liczbę różnych nurtów badawczych w analizach zawartości sieci, struktury linków, wykorzystania sieci i technologii sieciowych. Wiele takich nurtów pojawiło się, począwszy od połowy lat 90., pod takimi nazwami jak cyber-geografia i cyberkartografia {cyber geography and cyber cartography} [np. Dodge i Kitchin 2002], ekologia sieci {Web ecology} [np. Huberman 2001], eksploracja sieci {Web mining} [np. Etzioni 1996], dynamika sieci [np. Levene i Poulovassilis 2001] czy też inteligencja sieci {Web intelligence} [np. Yao i in. 2001].
Źródła
- Benbow, S.M.P. (1998). File not found: the problems of changing URLs for the World Wide Web. Internet Research, 8(3), 247-250. https://doi.org/10.1108/10662249810217867
- Björneborn, L. (2004). Small‐world link structures across an academic Web space: A library and information science approach. Doctoral dissertation, Royal School of Library and Information Science, Copenhagen, Denmark.
- Björneborn, L., Ingwersen, P. (2001). Perspective of webometrics. Scientometrics, 50(1), 65-82. https://doi.org/10.1023/A:1005642218907
- Björneborn, L., Ingwersen, P. (2004). Toward a basic framework for webometrics. Journal of the American Society for Information Science and Technology, 55(14), 1216-1227. https://doi.org/10.1002/asi.20077
- Chu, H. (2005). Taxonomy of inlinked Web entities: What does it imply for webometric research?. Library & Information Science Research, 27(1), 8-27. https://doi.org/10.1016/j.lisr.2004.09.002
- Davenport, T., Harris, J. (2017). Competing on analytics: Updated, with a new introduction: The new science of winning. Harvard Business Press.
- Dodge, M., Kitchin, R. (2002). New cartographies to chart Cyberspace. GeoInformatics, 5(April/May), 38-41.
- Etzioni, O. (1996). The World-Wide Web: quagmire or gold mine?. Communications of the ACM, 39(11), 65-68.
- Huberman, B.A. (2001). The laws of the Web: Patterns in the ecology of information. Cambridge, MA: MIT Press.
- Król, K. (2018a). Przystępność percepcyjna internetowych ofert turystyki wiejskiej. Roczniki Naukowe Ekonomii Rolnictwa i Rozwoju Obszarów Wiejskich, 105(1), 81-91. https://doi.org/10.22630/RNR.2018.105.1.7
- Król, K. (2018b). Jakość witryn internetowych w zarządzaniu marketingowym na przykładzie obiektów turystyki wiejskiej w Polsce. Infrastruktura i Ekologia Terenów Wiejskich, III(2), 181s. Kraków: Komisja Technicznej Infrastruktury Wsi Oddziału Polskiej Akademii Nauk. https://doi.org/10.14597/INFRAECO.2018.3.2.057
- Król, K. (2019b). The link rot phenomenon and its influence on the quality of the websites of rural tourism facilities in Poland. Economic and Regional Studies, 12(1), 68-79. https://doi.org/10.2478/ers-2019-0007
- Levene, M., Poulovassilis, A. (2001). Web dynamics. Software Focus, 2(2), 60-67.
- Sen, B. K. (2004). Cybermetrics-meaning, definition, scope and constituents. Annals of Library and Information Studies, 51(3), 116-120.
- Thelwall, M. (2009). Introduction to webometrics: Quantitative web research for the social sciences. Synthesis Lectures on Information Concepts, Retrieval, and Services, 1(1), 1-116.
- Thelwall, M., Vaughan, L. (2004). Webometrics: An introduction to the special issue. Journal of the American Society for Information Science and Technology, 55(14), 1213-1215. https://doi.org/10.1002/asi.20076
- Thelwall, M., Vaughan, L., Björneborn, L. (2005). Webometrics. Annual Review of Information Science and Technology, 39(1), 81-135. https://doi.org/10.1002/aris.1440390110
- Wiener, N. (1950). Cybernetics. Bulletin of the American Academy of Arts and Sciences, 3(7), 2-4. https://doi.org/10.2307/3822945
- Vaughan, L., You, J. (2010). Word co-occurrences on Webpages as a measure of the relatedness of organizations: A new Webometrics concept. Journal of Informetrics, 4(4), 483-491. https://doi.org/10.1016/j.joi.2010.04.005
- Yao, Y.Y., Zhong, N., Liu, J., Ohsuga, S. (2001). Web intelligence (WI): Research challenges and trends in the new information age. Lecture Notes in Artificial Intelligence, 2198, 1-17.