Wydanie: PRESS 11-12/2025
Warsztat: Pasażerowie na gapę
Jak się bronić przed zassaniem przez AI treści wytworzonych przez dziennikarzy?
Modele sztucznej inteligencji muszą się karmić ogromnymi zasobami treści. W ich poszukiwaniu roboty automatycznie przeczesują cały internet. Efektem tzw. crawlingu (pełzania) jest duży zbiór dokumentów. Z kolei w trakcie scrapingu (zeskrobywania) pobiera się i przetwarza konkretne, wybrane informacje ze stron, często już po crawlowaniu.
Poprosiłem ChatGPT o wyjaśnienie, jak modele AI pobierają dane z sieci. Odpowiedział, że każdy model językowy ma statyczną wiedzę, którą zdobył podczas trenowania na dużych zbiorach danych. Ta wiedza jednak nie aktualizuje się automatycznie. Jeśli model decyduje, że potrzebuje aktualnych danych, wysyła zapytanie np. do wyszukiwarki. Gdy otrzymuje wyniki, wybiera kilka źródeł i pobiera pełną treść. Później streszcza lub interpretuje wyniki, a następnie łączy je ze zdobytą wcześniej wiedzą i w efekcie generuje odpowiedź.
W tym procesie wykorzystywany jest shadow-cache, rodzaj inteligentnej pamięci podręcznej, w której model językowy lub obsługujący go system tymczasowo przechowuje wyniki wcześniejszych zapytań i danych, które już przetworzył. Dzięki temu w przypadku kolejnych podobnych żądań nie musi wykonywać całej pracy od nowa.
W październiku Google wprowadziło do swojej wyszukiwarki m.in. w Polsce dodatkowy tryb AI, mocniej stawiający na bezpośrednie odpowiedzi przygotowane przez sztuczną inteligencję, a mniej na linkowanie do innych stron. „Tryb AI to nowe, intuicyjne rozwiązanie pozwalające zadawać złożone, wieloczęściowe pytania, które w bardziej kompleksowy sposób zaspokajają ciekawość. Dzięki niestandardowej wersji naszego najnowszego modelu Gemini możesz zadawać szczegółowe pytania, które wcześniej wymagały wielu wyszukiwań” – pisano z tej okazji na blogu Google Polska.
Jak dodano, tryb AI wykorzystuje technikę rozgałęzienia zapytania, a więc dzieli pytanie na podtematy i jednocześnie wysyła wiele zapytań. Według Google dzięki temu wyszukiwarka może przeszukiwać internet dokładniej niż w tradycyjny sposób. Firma zapewnia, że użytkownicy otrzymują odpowiedzi na pytania na podstawie wyszukiwań z wielu zróżnicowanych stron. „Kliknięcia w linki z przeglądów od AI mają wyższą trafność wyszukiwania, co oznacza, że spędzasz na wskazanych stronach więcej czasu, ponieważ są to witryny jakościowe i mogą prezentować interesujący cię aspekt dogłębniej” – zapewnia Google. Wydawcy raczej nie potwierdzają jednak tej opinii.
Michał Niedbalski
Aby przeczytać cały artykuł:
Zapisz się na nasz newsletter i bądź na bieżąco z najświeższymi informacjami ze świata mediów i reklamy. Pressletter


