Prije dva dana, Google je objavio veliki pomak u načinu pretraživanja, odnosno – načinu na koji njihovi sustavi razumiju što korisnici zapravo traže. Predstavljaju BERT (eng. Bidirectional Encoder Representations from Transformers). Slobodan prijevod glasio bi: “dvosmjerne reprezentacije enkodera iz transformera”. Otprilike tako.

O čemu se radi? Transformeri, odnosno pretvarači koji se navode su zapravo modeli koji vrše obradu svih riječi u rečenici prema ukupnom sadržaju – kontekstu, a ne samo prema svom redoslijedu. Što to znači? Sustav može prepoznati kontekst i prema njemu dati relevantniji odgovor na upit. Pogledajmo primjer:

google bert brazil traveler
Upit je postavljen u smislu da u 2019. godini putnik iz Brazila želi znati da li mu je potrebna viza za SAD (slika preuzeta sa blog.google)

Vidimo da je prvi odgovor (bez BERT-a) dan kao da stanovnik SAD-a putuje u Brazil (a ne obrnuto). Prepoznat je kontekst pitanja. Nismo proveli detaljnija ispitivanja, ali s obzirom na kompleksnost hrvatskog jezika (uzmimo samo padeže za primjer), zanimalo bi nas da li bi sustav prepoznao “daj auto” u odnosu na “daj autu” (plastični primjeri, ali shvaćate razliku … u prvome bi moglo biti da netko traži od nekoga drugoga da mu da auto – na korištenje, a u drugome da samome automobilu treba nešto dati – da odmori recimo).

Varijacija na temu

BERT može razlikovati i važnost određenih riječi u rečenici, odnosno, na koji način”višak” mijenja kontekst, te prema tome sugerirati relevantniji rezultat pretraživanja.

google bert medicine pharmacy
Na upit “Da li možete za nekog preuzeti lijekove u ljekarni”, bez BERT-a odgovor je općeniti, dok je sa BERT-om odgovor vezan na “preuzimanje od strane druge osobe” (slika preuzeta sa blog.google)

Idemo isprobati sa našim upitom, kakav ćemo rezultat dobiti ukoliko postavimo kompleksnije pitanje. Pretpostavljamo da se BERT neće uključiti, razlog ćemo objasniti kasnije:

google bert pretraga
Nice try, Google … odi doma.

Možemo vidjeti da nismo dobili traženo, odnosno niti blizu da bi Google pokušao ugraditi nama najvažniji detalj – “nekog drugog”, u postupak izdavanja, odnosno preuzimanja lijekova.

Način primjene

Iz Google-a kažu da će za sada tek 1 od 10 upita biti “preusmjeren” na BERT algoritam. Razlog leži u potrebnoj računalnoj snazi za obradu takvih upita. Uzmemo li u obzir da je trenutni prosjek 63.000 pretrage svake sekunde, sve je jasno. Pored toga, u početnoj fazi će samo upiti na engleskom jeziku i oni iz SAD-a biti uzimani u obzir. No dobro je znati da se radi na razumijevanju jezika na način kao nikada do sada.

Za korisnike to znači da će ovakve automatizirane sustave uskoro moći pitati na isti način kao da pitaju čovjeka. Za one koji stvaraju sadržaj to znači da više neće morati izbacivati širi kontekst iz rečenica radi boljeg SEO rezultata. Konačna implementacija BERT-a očekuje se kada se potvrdi da sa njim ljudi dobivaju relevantnije odgovore na njihove upite. Koliko će za to biti potrebo vremena, za sada nije poznato.

Dugoročni cilj Google-a je razvoj sustava koji će moći razumjeti što točno od njega korisnik traži. To nije nimalo jednostavno, jer se ponekad ni dvoje ljudi ne može dogovoriti – što točno netko želi ili traži. Spomenuli smo hardverske zahtjeve za pogon ovakvih složenih upita. Više o tome možete pročitati na Google-ovoj objavi o Cloud TPU v3.

Facebook komentari

© 2022. leramis d.o.o. | Sva prava pridržana | Pravila korištenja | Izjava o privatnosti

“Kolačići” na ovoj web stranici koriste se za postavke prikaza (jezik), kako bi web stranica bila bolje prilagođena potrebama korisnika. Pored toga, moguće je da se koriste sustavi za praćenje korištenja web stranice (poput Google Analytics ili sličnih), koji također koriste “kolačiće”, kako bi se korisnika moglo pratiti na razini stranice. View more
Cookies settings
Prihvaćam
Odbijam
Privacy & Cookie policy
Privacy & Cookies policy
Cookie name Active
“Kolačić” je mala datoteka koja traži Vaše dopuštenje da bude smještena na Vaš tvrdi disk na računalu. Jednom kada ga prihvatite, ta datoteka se smješta na Vaš tvrdi disk te pomaže analizirati web promet ili Vas obavještava o posjetima određenim web stranicama. “Kolačići” omogućuju web aplikacijama da odgovaraju na Vaše individualne potrebe. Web aplikacija može prilagoditi svoje djelovanje Vašim potrebama i željama tako da prikuplja i pamti podatke o Vašim interesima i navikama. Mi koristimo tzv. “tracking cookie” kako bismo identificirali stranice koje koristite i posjećujete. To nam pomaže analizirati podatke o Vašim navikama koje koristimo kako bismo poboljšali našu web stranicu i kako bi je prilagodili potrebama korisnika. Mi koristimo ove podatke za statističke analize, a zatim se ti podaci uklanjaju iz sustava. “Kolačići” nam pomažu pružiti bolju web stranicu, omogućuju nam pratiti koje stranice su Vam korisne, a koje ne. “Kolačići” nam ni na koji način ne daju pristup Vašem računalu ili bilo kakve informacije o Vama, osim podataka koje ste odabrali podijeliti s nama. Možete prihvatiti ili odbiti “kolačiće” prilikom prvog posjeta ovoj web stranici. Većina web preglednika automatski prihvaća “kolačiće”, ali uobičajeno je da možete podesiti web preglednik da odbije “kolačiće” koje želite odbiti. To Vas može spriječiti da u najvećoj mogućoj mjeri iskoristite mogućnosti i funkcionalnosti web stranica.
Save settings