biuro@westom.pl     tel. 530 825 825

Google skanuje multimedia

Nowe źródła informacji obsługiwane przez wyszukiwarki

Jednym z podstawowych założeń misji Google jest „uporządkowanie informacji z całego świata, udostępnienie jej wszystkim i uczynienie jej użyteczną”.

Na drodze do tego celu stoi bezsprzecznie fakt, że wciąż nie wszystkie informacje ze świata są w internecie dostępne. Konieczne zatem się staje poszukiwanie alternatywnych miejsc pozyskiwania dodatkowych danych.

Google skanuje książki

Spore dokonanie można zapisać na konto Google, które w 2004 rozpoczął przenoszenie olbrzymiej ilości danych pochodzących z zeskanowanych książek. Ogromna biblioteka utworzona w ten sposób (nie bez protestów i procesów wytoczonych przez pisarzy) jest dostępna pod adresem https://books.google.com/. Sukces tego przedsięwzięcia był kontynuowany poprzez digitalizację także innych dokumentów, głównie historycznych. W tym celu Google posłużył się zakupionym narzędziem reCaptcha (https://www.google.com/recaptcha/intro/android.html), a już w 2014 roku dokonał kolejnego znaczącego ulepszenia w tej materii, by poprawić dostępność i wygodę dla użytkownika.

Twórczość w internecie

By nie udostępniać za darmo całej treści skanowanych dokumentów i książek, w wynikach wyszukiwania dostępne są jedynie wybrane fragmenty twórczości.

By zwiększyć widoczność w internecie danego tekstu, taki fragment musi być szeroko udostępniany, optymalnie przez każdy sklep internetowy sprzedający dane opracowanie. W tym celu Google zaprojektowało usługę FirstClickFree, dzięki której użytkownik może przejrzeć fragment książki bez potrzeby zakładania konta, logowania, czy wykupywania subskrypcji.

Kolejnym źródłem nowych treści są dane przesyłane wyszukiwarkom przez portale informacyjne, blogerów, fora dyskusyjne w postaci kanałów RSS. Bezpośrednie dostarczenie wybranych przez webmasterów informacji może znacząco przyspieszyć indeksowanie, głównie poprzez ograniczenie jego zasięgu, ale z drugiej strony Google jest tutaj bardzo ostrożne. Okazuje się bowiem, że przez wspomniane kanały wystawiane są także dane błędne, niemoderowane. Nakłady na ochronę przed skutkami przedostawania się takich informacji do wyszukiwarki mogą przewyższyć potencjalne korzyści. Użytkownik powinien wszak, zgodnie z misją Google, otrzymywać dane sprawdzone i użyteczne.

Spora część informacji, niedostępna w sieci, jest także indeksowana na podstawie zwieranych z posiadaczami takiej bazy, umów. Zdarza się do dość często.

Innym, bardzo użytecznym z punktu widzenia wyszukiwarki internetowej jest wiedza posiadana przez jej użytkowników. Istnieje wiele sposobów na sprowokowanie ich do podzielenia się informacjami. W tym celu została przez Google stworzona gra wyszukiwarkowa Google Image Labeler.

Obecnie już niedostępna, gra ta była jedyną tego typu produkcją giganta. Chodziło w niej o jak najszybsze dopasowanie właściwej etykiety do zdjęcia. Szybszy zawodnik otrzymywał punkty. Próby wpisywane w czasie gry były następnie analizowane przez Google i miały wspomagać wyszukiwarkę między innymi w rozpoznawaniu obrazów, odkrywania sposobów obserwacji i perspektywy postrzeganej przez użytkowników w czasie oglądania zdjęcia.

Skanowanie multimediów

Rosnące zapotrzebowanie na wyszukiwanie różnego rodzaju danych niebędących tekstem pcha producentów wyszukiwarek do prób zindeksowania także takich treści.

Wciąż bardzo trudno przetwarzać dane z wnętrza plików filmowych czy muzycznych. Google’owi udało się posunąć jednak do przodu. Opracował technologię indeksowania metadanych, w których znajdują się informacje opisujące plik i jego zawartość.

Na podstawie znaczników, etykiet i opisów, wyszukiwarka Google jest w stanie przypisać plikom multimedialnym pozycję rankingową. Silne prace trwają także nad rozwojem narzędzi do rozpoznawania obrazów. Wyszukiwarka integruje w wielu miejscach ćwiczenia, w których użytkownik ma wskazać obrazy przedstawiające na przykład samochód. W ten sposób na podstawie milionów takich wskazań algorytmy sztucznej inteligencji Google uczą się coraz lepiej rozpoznawać podstawowe obiekty. Z czasem proces nauki powinien przyspieszyć. Na podstawie wspomnianego algorytmu działa wyszukiwarka na podstawie zdjęć https://images.google.com/?gws_rd=ssl.

Gazety papierowe vs treści online

Kolejną próbą opanowania mediów jest strona dedykowana przenoszeniu treści pochodzących z zeskanowanych wydań gazet i innych dokumentów (https://www.google.com/recaptcha/intro/android.html).

Witryna wykorzystuje skanery oraz oprogramowanie typu OCR (ang. optical character recognition), które ma za zadanie rozpoznać zapisane w obrazie znaki i zamienić je na plik tekstowy. Takie dane łatwo już zaindeksować i zwracać w wynikach zapytań. Oczywiście oprogramowanie OCR ma swoje wady, a ponieważ działa na standardowych algorytmach, miewa także wpadki w postacie nieprawidłowo rozpoznanych reśc, słów czy wyrażeń. Problematyczne są także niestandardowe układy strony, liczne grafiki i temu podobne. W takich sytuacjach niezbędna jest ingerencja człowieka, któremu łatwiej rozpoznać tekst. Dane o nowym wystąpieniu są dodawane do bazy danych i w kolejnym podobnym przypadku człowiek nie będzie musiał weryfikować danego zapisu.

reCAPTCHA działa w następujący sposób:

  • Problematyczne słowo jest zapisywane w bazie danych.
  • Na witrynach, które korzystają z rozwiązania reCAPTCHA w celu weryfikacji i zabezpieczenia przed botami, to słowo pojawia się jako jedno z dwóch, które należy wpisać by zwalidować swoją tożsamość. Drugim słowem jest takie, co do którego system nie ma wątpliwości. W ten sposób, niejako przy okazji, słowo staje się rozpoznawalne dla narzędzia.

Zebrane w ten sposób informacje automatycznie przekładają się na lepsze rozpoznawanie tekstu i lepszej jakości, zdigitalizowane treści. W skanowanych publikacjach mniej będzie literówek, błędów logicznych i rzeczowych. Ulepszany w ten sposób algorytm OCR staje się także bardziej wydajny.

Obecnie zauważalna jest zmiana priorytetów i przeniesienie większej uwagi na rozpoznawanie obrazów przez reCAPTCHA. I tak zamiast słów, które należy wpisać, spotykamy coraz częściej obrazy, które należy doprecyzować, na przykład wskazać obrazy na których przedstawiona jest góra. Charakterystyczny kształt góry opisywany za pomocą tysięcy różnych obrazów i milionów wskazań użytkowników jest coraz dokładniejszy. W przyszłości Google będzie potrafił rozpoznać górę, na zdjęciu, którego nigdy wcześniej nie analizował. Być może będzie nawet w stanie wskazać, gdzie ta góra się znajduje, jaką ma wysokość i w której epoce się wypiętrzyła.

Sztuczna inteligencja

Uczenie maszynowe jest wykorzystywane także do rozpoznawania mowy i zapisywania jej w postaci tekstu. Zastosowanie takiego procesu wiąże się jednak z ogromnymi wymaganiami, co do mocy obliczeniowej i w związku z tym, nadal jest ograniczone.

Używa się różnych innych metod niewymagających uczenia się tekstu „w ciemno”. Na przykład umieszczając film w serwisie YouTube, użytkownik może dołączyć do niego zapis tekstowy wypowiadanych podczas filmu słów i zaproponować Google, by przeprocesował plik pod kątem rozpoznawania mowy.

Maszyna łatwo porówna się do zapisu tekstowego i jakość nauki będzie wysoka. Z transkrypcją mowy na tekst wiążą się liczne inne problemy.

Głównym jest mnogość różnych akcentów, możliwych intonacji, wad wymowy. Wszystkie one mogą się przeplatać lub nakładać lub występować okresowo.

Polecenia głosowe

Mimo to coraz bardziej popularne stają się narzędzia umożliwiające bezpośredni kontakt głosowy z maszyną. System Siri w urządzeniach Apple, czy Google Voice w Google, a także Cortana w systemie operacyjnym Windows coraz lepiej radzą sobie z tym zadaniem. Dziś możliwe jest częściowe zautomatyzowanie prostej obsługi klienta, który w pierwszej linii jest kontaktowany z botem, a dopiero w przypadku trudności łączony jest z ludzkim konsultantem. Przykład takich oszczędności biznesowych jest jednym z wielu i jest ściśle powiązany z umiejętnością indeksowania treści multimedialnych.

Coraz większa presja rynku w tym kierunku sprawia, że dotychczas zwracane przez wyszukiwarki dane w postaci tekstowej są postrzegane jako coraz mniej potrzebne czy trafne. Staje się jasne, że kto pierwszy i lepiej poradzi sobie z automatycznym procesowanie treści innych formatów, ten znacząco zwiększy swój udział w rynku. Kto natomiast nie będzie tego potrafił, z rynku może zniknąć całkowicie. Stawka jest więc ogromna.

Interaktywność

Warto zauważyć, że rośnie też presja na interaktywność. Coraz mniejszym uznaniem cieszą się treści statyczne, coraz chętniej widziana jest za to zawartość modyfikowalna, interaktywna właśnie. Staje się przez to ciekawsza, bardziej interesująca, użyteczna. Jest też lepiej zapamiętywana i chętniej użytkownik do niej wraca.

W związku z tym już w perspektywie kilku lat możemy się spodziewać interaktywnych filmów, w których to oglądający będą mogli decydować o dalszych postępach w fabule, oni będą ją tworzyć. Wszelkie gry komputerowe także staną się jeszcze bardziej modyfikowalne. Już dziś gracz, oprócz gry, dostaje do dyspozycji pełny zakres edytorów, dzięki którym może zaprojektować nowy poziom, strój dla bohatera, czy wręcz nową grę. Na dzień dzisiejszy nie ma to jeszcze bezpośredniego związku z SEO, ale z pewnością mieć będzie i to już niedługo. Nowe trendy z pewnością staną się nowymi wyzwaniami dla całej branży SEO, ale też jej szansą.

Tomasz Węsierski

Latest posts by Tomasz Węsierski (see all)