Povratak na objave

Upoznajte Google-ov BERT

Prije dva dana, Google je objavio veliki pomak u načinu pretraživanja, odnosno – načinu na koji njihovi sustavi razumiju što korisnici zapravo traže. Predstavljaju BERT (eng. Bidirectional Encoder Representations from Transformers). Slobodan prijevod glasio bi: “dvosmjerne reprezentacije enkodera iz transformera”. Otprilike tako.

O čemu se radi? Transformeri, odnosno pretvarači koji se navode su zapravo modeli koji vrše obradu svih riječi u rečenici prema ukupnom sadržaju – kontekstu, a ne samo prema svom redoslijedu. Što to znači? Sustav može prepoznati kontekst i prema njemu dati relevantniji odgovor na upit. Pogledajmo primjer:

google bert brazil traveler
Upit je postavljen u smislu da u 2019. godini putnik iz Brazila želi znati da li mu je potrebna viza za SAD (slika preuzeta sa blog.google)

Vidimo da je prvi odgovor (bez BERT-a) dan kao da stanovnik SAD-a putuje u Brazil (a ne obrnuto). Prepoznat je kontekst pitanja. Nismo proveli detaljnija ispitivanja, ali s obzirom na kompleksnost hrvatskog jezika (uzmimo samo padeže za primjer), zanimalo bi nas da li bi sustav prepoznao “daj auto” u odnosu na “daj autu” (plastični primjeri, ali shvaćate razliku … u prvome bi moglo biti da netko traži od nekoga drugoga da mu da auto – na korištenje, a u drugome da samome automobilu treba nešto dati – da odmori recimo).

Varijacija na temu

BERT može razlikovati i važnost određenih riječi u rečenici, odnosno, na koji način”višak” mijenja kontekst, te prema tome sugerirati relevantniji rezultat pretraživanja.

google bert medicine pharmacy
Na upit “Da li možete za nekog preuzeti lijekove u ljekarni”, bez BERT-a odgovor je općeniti, dok je sa BERT-om odgovor vezan na “preuzimanje od strane druge osobe” (slika preuzeta sa blog.google)

Idemo isprobati sa našim upitom, kakav ćemo rezultat dobiti ukoliko postavimo kompleksnije pitanje. Pretpostavljamo da se BERT neće uključiti, razlog ćemo objasniti kasnije:

google bert pretraga
Nice try, Google … odi doma.

Možemo vidjeti da nismo dobili traženo, odnosno niti blizu da bi Google pokušao ugraditi nama najvažniji detalj – “nekog drugog”, u postupak izdavanja, odnosno preuzimanja lijekova.

Način primjene

Iz Google-a kažu da će za sada tek 1 od 10 upita biti “preusmjeren” na BERT algoritam. Razlog leži u potrebnoj računalnoj snazi za obradu takvih upita. Uzmemo li u obzir da je trenutni prosjek 63.000 pretrage svake sekunde, sve je jasno. Pored toga, u početnoj fazi će samo upiti na engleskom jeziku i oni iz SAD-a biti uzimani u obzir. No dobro je znati da se radi na razumijevanju jezika na način kao nikada do sada.

Za korisnike to znači da će ovakve automatizirane sustave uskoro moći pitati na isti način kao da pitaju čovjeka. Za one koji stvaraju sadržaj to znači da više neće morati izbacivati širi kontekst iz rečenica radi boljeg SEO rezultata. Konačna implementacija BERT-a očekuje se kada se potvrdi da sa njim ljudi dobivaju relevantnije odgovore na njihove upite. Koliko će za to biti potrebo vremena, za sada nije poznato.

Dugoročni cilj Google-a je razvoj sustava koji će moći razumjeti što točno od njega korisnik traži. To nije nimalo jednostavno, jer se ponekad ni dvoje ljudi ne može dogovoriti – što točno netko želi ili traži. Spomenuli smo hardverske zahtjeve za pogon ovakvih složenih upita. Više o tome možete pročitati na Google-ovoj objavi o Cloud TPU v3.

Facebook Komentari