Nová funkce v hledání na Google.cz a Google.sk
20. července 2007
Opravy pravopisu v češtině a slovenštině spuštěny 2. července.

Jsme toho přesvědčení, že vyhledávač by se měl co nejvíce snažit, aby uhádl, co má uživatel na mysli, a dokonce by se měl pokoušet opravovat drobné překlepy, kterých se mohou uživatelé dopustit. Ušetří to spoustu času i frustrací a zároveň jde o užitečnou funkci pro kontrolu pravopisu pro uživatele, kteří si nejsou jisti, jak se některá slova správně píší. Je pravdou, že mnoho lidí tuto funkci využívá jako slovník, aniž by se zajímali o nalezené výsledky vyhledávání na webu.
V březnu mě kontaktoval jeden ze členů týmu pro kontrolu pravopisu, který se snažil získat nějaké odborné jazykové znalosti, aby mohl přidat opravy českého pravopisu. Jako členka jazykové menšiny s nedostatečným zastoupením jsem s radostí přijala jeho žádost o schůzku v naději, že pomohu vylepšit zkušenosti českých (a později i slovenských) uživatelů.
S touto přidanou funkcí tedy nově rozpoznáváme překlepy jako prohození dvou písmen (například intrenet) či chybějící písmeno (například intrnet).
Nenabízíme však gramatické varianty stejného slova (například květ oproti květy).
Oprava pravopisu také nenabízí navrhované opravy, pokud se slova liší pouze diakritikou. Vyhledávání slov partneri a partneři proto vede ke stejným či podobným výsledkům.
Rovněž rozpoznáváme situace, kdy slovo a jeho oprava znějí stejně, i když rozdíl v pravopisu nemusí být zanedbatelný (bestarostny).
Víme, že máme širokou skupinu uživatelů, včetně dětí, takže děláme vše pro to, aby naše návrhy nezahrnovaly obscénní nebo urážlivá slova.
Model pro opravy českého pravopisu se trénoval na provozu, který pocházel z domény google.cz, díky čemuž dokáže česká kontrola pravopisu opravovat i nesprávně napsané slovenské a anglické dotazy a naopak. Algoritmy pro kontrolu pravopisu nevyužívají detekci jazyka, ve kterém je dotaz zadán. Jde o dodatečnou výhodu, která nevyžadovala žádné úsilí navíc.
Spuštění této důležité funkce pro nás hodně znamená a rádi uvítáme jakékoli názory od vás – našich českých uživatelů. Pro zaslání zpětné vazby a návrhů prosím použijte náš kontaktní email - vizte pravý sloupec.
7 komentářů :
Před nějakou dobou (řádově měsíce) se mi začalo např. vyhledávání termínů fffilm kamera automaticky "opravovat", jako kdybych chtěl hledat "film kamera". Což nechci. Vím, že to můžu napravit zadáním "+fffilm kamera", ale tohle podle mě už přesahuje meze "user friendliness" a dost mě to otravuje.
Pom2rn2 často se mi stává že mám zapnutou anglickou klávesnici a napíšu český vyhledávácí termín obsahující diakritiku... To by tam přidat nešlo?
Osobně se mi moc nelíbí text „Měli jste na mysli: internet“, který uvozuje nabízenou opravu vyhledávaného textu. Nevnímám to jako zdvořilý dotaz, ale jako strohé oznámení až rozkaz – sice jsi napsal intrenet, ale já vyhledávač vím líp než ty, že jsi myslel internet. Myslím, že by stačilo přidat za text otazník (a odstranit dvojtečku): „Měli jste na mysli internet?“ Případně „Chtěli jste vyhledat internet?“ A text na konci stránky (s nabídnutou opravou hledání) by mohl být stejný, jako na začátku stránky…
Mě se tato funkce určitě libí. Je to krok správným směrem. Z textu mi vyplynulo, že opravy navrhované vyhledávačem jsou prozatím pouze výsledkem obecných statistických metod. Čeština je složitý jayzk. Až to bude Google s analýzou češtiny myslet opravdu vážně, tak jsem zvědav, co vznikne ;-)
Trochu mi schází přímé hlášení nesprávného odhadu - na jeden odkaz. Vhodné pro přihlášené uživatele, možná je spolupracující alfa-testeři.
Některá nahrazení jsou opravdu kuriozitní. Při hledání "GWT element getId" je nabízeno "Měli jste na mysli: GET element getId".
PS: GWT je Google Web Toolkit ;)
Opravy v pravopise jsou dobré, ale ještě užitečnější by bylo skloňování a časování slov.
Ac drive jsem na Google nedal dopustit, po techto zmenach s nim zacinam docela valcit... chtelo by to nejakou moznst si v preferencich vypnout tyhle featury... kdyz hledam "text", nechci hledat "textový", ani "teletext" ...
Okomentovat