Ugrás a fő tartalomra

DOTKOMÚj algoritmust vezetett be a Google – Jön a BERT

DOTKOM

Új algoritmust vezetett be a Google – Jön a BERT

A Google folyamatosan finomhangolja algoritmusát, hogy minél relevánsabb találatokkal szolgálja ki a webet. Egy ilyen algoritmusfrissítés történt 2019. október 25.-én is, amikor bemutatták a BERT algoritmust.
A BERT a keresőóriás szerint az utóbbi 5 év legnagyobb előrelépése a Rankbrain óta. A frissítés Amerikában 10-ből 1 keresési találatot érint, és bár Magyarországon egyelőre még nem érhető el, fontos tisztában lenni vele.

Mi az a BERT, és miért van rá szükség?

A BERT nem más, mint a Google neurális hálózaton alapuló modellje, melynek célja a természetes nyelv feldolgozása. Az algoritmus az angol Bidirectional Encoder Representations from Transformers kifejezés rövidítése. Az új frissítés alapjaiban formálja át a Google-ben látott keresési találatokat, és jelentős hatása van a keresőoptimalizálással foglalkozó marketingesek munkájára is.
Nem más a keresőmotorok célja, minthogy a lehető legjobban tudják kiszolgálni a keresési szándékot. Ehhez elengedhetetlen, hogy felismerjék a felhasználó keresése mögötti információigényt, melyhez a legjobb eszköz a konkrét szavak értelmezése. Ez eddig ismerősen hangzik, hiszen a Google eddig is a szavak alapján adta vissza a találatokat. Akkor mi változott?
Míg korábban a szavakat egyesével elemezték a keresőrobotok, a BERT-nek köszönhetően ez már a kontextus vizsgálatával történik meg. Gondoljunk csak arra, milyen komplex például a magyar nyelv: rengeteg kötőszót és ragot használunk nap mint nap, melyek adott esetben teljesen módosíthatják a kifejezés jelentését. Nem mindegy, hogy valami felé vagy valamitől el szeretnénk utazni, ahogyan az sem lényegtelen, hogy valamiről vagy valakitől szeretnénk olvasni.
Míg az esetleges elgépeléseket az esetek túlnyomó részében már hosszú ideje helyesen ismeri fel a Google és felajánlja a megfelelő alakot, addig a szabad beszédhez hasonló szófordulatok értelmezésével még bőven vannak hiányosságok. Nem véletlen, hogy átszoktunk a kulcsszó-alapú keresésre, azaz egy kérdés feltétele helyett általában inkább néhány főnevet írunk egymás után.
Jellemző jelenség, hogy ahelyett, hogy “mikor indul a vonat Bécsbe” azt írjuk be a keresőmezőbe, hogy “bécs vonat menetrend”. Érezhetjük, hogy a második verzió nagyon távol áll a természetes beszédtől, mégis túlnyomórészt ezt választjuk remélve, hogy így pontosabb találatokat kaphatunk. Pontosan emiatt lett létrehozva a BERT algoritmusa.

Hogyan működik az algoritmus?

Ahogy azt már említettük, a BERT rövidítés tartalmazza a bidirectional, azaz kétoldalú szót. Ez a gyakolatban azt jelenti, hogy az algoritmus megvizsgálja a kifejezésben az előtte és utána található szavakat is, ezzel megértve a kontextust. A mesterséges intelligencia mindehhez a Wikipedia szócikkeinek elemzését használta fel az úgynevezett masking, azaz álcázás taktika alkalmazásának segítségével.
Az volt az algoritmus feladata, hogy egy szó kitakarásával, pusztán a kifejezés kontextusából jósolja meg a lefedett szót. Például abból, hogy “bevertem a [_] a plafonba” kitalálja a modell, hogy a kitakart szó a fejem.
Mindez azt eredményezi, hogy még pontosabb keresési eredményeket kapunk. Erre a Google hoz is egy látványos angol nyelvű példát: ha azt írjuk be a keresőbe, hogy “2019 brazil traveler to usa need a visa”, akkor a BERT algoritmusfrissítés előtt merőben eltérő találatokat láttunk volna, mint amikkel jelenleg találkozhatunk.
Tudjuk, hogy az angol nyelv megértésében rendkívül nagy jelentősége van az elöljárószavaknak, jelen esetben a “to”-nak. A fenti kifejezés arról szól, hogy brazilok utaznának Amerikába, nem pedig fordítva. 2019. október 25. előtt az algoritmus nem tulajdonított volna jelentőséget az elöljárószónak, ezért a keresési eredmények arról szóltak volna, hogy mit kell tudniuk a Brazíliába utazó amerikaiaknak a vízumról. Szerencsére a BERT óta a Google képes értelmezni a kifejezés teljes egészét, ezért megérti, hogy a “to”-nak kiemelt szerepe van a jelentés értelmezésében. Ennek következtében a konkrét keresési találatok is merőben más találatokat adnak vissza a frissítés óta.

Megjegyzések

Népszerű bejegyzések ezen a blogon

Az IT és információbiztonsági szakma tetoválásainak jelentésmorfológiája

Az IT és információbiztonsági szakma tetoválásainak jelentésmorfológiája Blogzóna IT Itt az ideje, hogy az IT és a biztonsági szakmán belül elterjedt és gyakori tetoválásokat összegyűjtsük és közelebbről megvizsgálva a képi világukat, leírjuk, milyen jelentéssel bírnak, mit is jelképeznek, kik és hogyan, hol viselik őket. 1-89-19-68 A hackerek kedvelt tetoválása. A számok a periódusos rendszer elemein keresztül a HACKER feliratot adják ki (H- 1 Hidrogén, AC- 89  Aktínium, K- 19  Kálium, ER- 68  Erbium). Az öt pont jelentheti a feketekalapos hacker börtönviseltségét (bérletvásárlás után), etikus hacker esetében azonban az éles projekteken edződést és a field tapasztalatot szimbolizálja. Más értelmezésben az éles projekt során az etikus hackert (középső pont) bekeríti saját projektvezetője és salese, az ügyfél projektvezetője és az ügyfél biztonsági vezetője. Vörös háromszög a bal mellbimbó körül, „People, Process, Technology” felirattal az élek...

Mesterséges intelligencia startupot vett a Nike

A cég azért hajtotta végre a felvásárlást, mert szeretné megfejteni, hogy mit akarnak az ügyfelei. A tengerentúli székhelyű edzőcipő-, sportruházat- és sportszergyártó  megvásárolta  a  Celect nevű bostoni székhelyű mesterséges intelligencia startupot. A Nike azért döntött a tranzakció mellett, mert úgy érezte, hogy a vállalkozásban ott van a potenciál arra, hogy többet tudhasson meg az ügyfeleiről és arról, hogy miért döntenek egy adott termék megvétele mellett. A Celect a megadott kiskereskedelmi adatok alapján készíti el a számításait, amelyek komoly segítséget jelenthetnek akkor, ha például egy sportszergyártó költség-haszon elemzéseket akar elvégezni. Eric Sprunk, a Nike ügyvezető igazgatója kijelentette, hogy miután a termékeik iránt egyre nagyobb a kereslet, ezért kiemelten fontos számukra az adatok optimalizálása és az, hogy reagálni tudjanak a fogyasztói magatartásokra. Így nagyon is személyre szabott módon tudják kiszolgálni a vásárlóikat. A két fél az ü...

Sziszifuszi robotok és túlontúl menő házak az IKEA központjában

CSURGÓ DÉNES KÖVETÉS 2018.06.17. 17:11 Van valami gyermekien lenyűgöző, ugyanakkor szomorkás egy robot látványában, amelynek az a dolga ezen a világon, hogy nagyon finoman, óvatosan kinyisson majd becsukjon egy kutyafej formájú uzsonnásdobozt, és ezt elismételje úgy 15-20 ezerszer. Pedig ez az egyszerre mechanikus és egyszerre drámai látvány fogadott, amint beléptem az IKEA teszlaborjába a festőien semmi közepén lévő Älmhult városában, ahol az IKEA központja is van. Itt a tesztlabor mellett megnézhettem, hogy hogyan is rendezik be a lakásukat az IKEA dizájnerei, vagy hogy milyen bútorokat tervez a cég egy Mars-expedícióra. Az IKEA volt olyan kedves, hogy még vagy 200 másik újságíróval együtt meghívott a Democratic Design Days nevű rendezvényére, ami valójában egy kétnapos PR esemény, amelyen a világ talán legnagyobb bútorgyártója megmutatja, hogy mik kerülnek majd a boltokba jövőre, bejelenti, hogy milyen menőséget tervez a...