Konferencja technologie biblioteczne w pandemii

2021-11-18

Big data i my. Jak analizuje się wszystko?



Czy w analizowaniu informacji ilość to nowa jakość? Jak interpretowane są informacje z mediów społecznościowych, Wikipedii i monitoringu w galerii handlowej? I jak można wykorzystać narzędzia big data by stwierdzić, że głosowanie było nie fair?




W sklepie, w smartfonie, na ulicy. Komunikacja sieciowa to codzienność

„Użytkownik sieci wymienia informacje, załatwia wiele podstawowych potrzeb życiowych związanych z prozą dnia codziennego – zakupy, sprawy urzędowe, służbowe, prywatne. Internet jest miejscem spotkań, rozrywki, prowadzenia działalności zawodowej. Każda z tych usług związana jest z informacją i jej przesyłaniem. Z komunikacją”.

A rozwój danych, które publikowane są w Internecie, gwałtownie przyspiesza. Treści, które pojawiają się w otaczającej przestrzeni, te pisane i wizualne, tworzone są już nie tylko przez ludzi, ale także przez komputery. Maszyny zbierają i przetwarzają dostępne informacje, by móc następnie skompilować je w nowy utwór, na przykład relację z meczu piłki nożnej. Bez odpowiedniej analizy danych byłoby to niemożliwe. Dariusz Jaruga w swojej książce pisze o tym, jak działają algorytmy, programy i oprogramowania, na których rolę nie zwracamy w życiu codziennym szczególnej uwagi. Niesłusznie, bowiem informacje, które jako ogół udostępniamy w Internecie, są źródłem użytecznych informacji i „stanowią fundamentalną składową komunikacji sieciowej.”

Źródła informacji. Więcej treści to więcej analiz

„Liczba treści multimedialnych wytworzonych i opublikowanych przez zwykłych ludzi (…) osiągnęła rozmiary, które trudno sobie nawet wyobrazić. (…) Zarejestrowane cyfrowe dane w 2015 roku osiągnęły wielkość 4,1 ZB5. (…) prognozuje się, że w 2025 roku światowe zasoby danych zwiększą się do 175 ZB” – pisze autor.

To wszystko dzieje się na niezmierzonej ilości platform, stron, serwisów, blogów. Autor omawia najważniejsze z nich – od Vimeo po Wikipedię (która pod względem błędów nie odbiega szczególnie od encyklopedii Britannica). Analizuje też (jakże istotne!) różnice pomiędzy mediami masowymi a społecznościowymi oraz klasyfikację tych ostatnich. Przy okazji dowiecie się czym jest Odnoklassniki oraz jaka platforma społecznościowa cieszy się największym zainteresowaniem w Armenii. Dlaczego to takie ważne?

Czym jest big data i dlaczego to takie ważne?  

Ponieważ świadome wykorzystanie tych danych i ich potencjału informacyjnego stanowi o potędze narzędzi big data. Na podstawie informacji zebranych z „(…) forów, blogów i stron internetowych, możliwe było z dużą dokładnością przewidywanie wyników wyborów parlamentarnych, a później prezydenckich w 2015 roku”. Przydatność takiej analizy ma jednak także codzienne zastosowanie. Dzięki niej możemy sprawdzić godziny otwarcia restauracji, ocenić optymalny czas dojazdu i utrudnienia na drodze czy sprawdzić aktualną jakość powietrza w naszej okolicy. „Powyższe przykłady badań nad wykorzystaniem zasobów Big Data pokazują, w jak różnorodnym zakresie analiza dużych zbiorów danych może przynieść konkretne korzyści.” – pisze autor. „(…) dane stały się wartościowym surowcem do dalszego przetwarzania w biznesie, naukach społecznych, medycynie itp. Analiza danych może być cennym źródłem dotychczas nieznanych informacji”.

Czym jednak jest Big Data? Jak definiuje się to pojęcie i co ono oznacza w praktyce?  W jaki sposób zbiera się dane i jak są one zarządzane?

Ale także: jaki wpływ ma to na bezpieczeństwo użytkowników? Np. elektroniczne chipy „(…) wbudowywane są w coraz większą liczbę przedmiotów takich jak ubrania, urządzenia elektroniczne, karty płatnicze, okresowe bilety komunikacji miejskiej, sklepowe karty lojalnościowe, dokumenty tożsamości”.

System Jazon – „uszlachetnianie” informacji i złote runo

Cały czas wytwarzamy więc informacje – mniej lub bardziej świadomie. Szukamy produktów w Internecie, piszemy posty na Facebooku czy po prostu przemieszczamy się z włączoną w telefonie usługą lokalizacyjną. To, jakiego prezentu na święta szukamy dla krewniaka, o której godzinie ustawiamy budzik w tygodniu oraz jakie wakacyjne miejscowości oznaczamy na instagramowym profilu, może, wraz z innymi śladowymi informacjami, stać się imponującym zbiorem informacji dotyczących naszych zwyczajów, pracy, zamożności i poglądów na świat. A nawet z dużym prawdopodobieństwem stwierdzić na kogo oddamy głos w najbliższych wyborach.

Ale to dopiero początek, bowiem zbiór „surowych” danych musi jeszcze zostać poddany obróbce. Dopiero wówczas możliwe jest wyłuskanie z nich odpowiednich informacji. Tutaj wkracza big data i zaczyna się rafinowanie zebranych danych, oczyszczanie ich ze zbędnych informacji, „uszlachetnianie”. Nie bez przyczyny więc system, który został do tego celu zaprojektowany, nazywa się Jazon – tak, jak mitologiczny bohater, który wyruszył na poszukiwanie złotego runa. Bo w dzisiejszym świecie to informacja jest nowym złotem.