Archive

Archive for October, 2008

Google med talegjenkjenning i YouTube-søk

October 31st, 2008 tord No comments

Etter en lang stund med relativt lite artige nyheter hos Google Labs dukket Gaudi opp her om dagen. Det er ikke et søk om den katalanske arkitekten, men en forkortelse for Google Audio Indexing, en test av talegjenkjenning og hvordan dette kan brukes til å søke etter innhold.  Foreløpig er søket begrenset til å gjelde kanaler på Youtube med amerikansk politisk innhold, åpenbart i anledning det amerikanske presidentvalget.Søket er en videreføring av Google election video serch gadget’en for iGoogle de lanserte tidligere i år.

Talegjenkjenning er ikke noe nytt. Men hittil har det vært små søkeselskaper som har hatt dette som nisjeprodukt med tildels små indekser. En gratis søketjenste som podzinger som var veldig bra, ble dessuten endret til en lukket betalingsjeneste under navnet Everyzing.

En raskt test av Gaudi viser at talegjekjenningen er overraskende god. Selv fyllord som «hum» og «um» blir funnet med god presisjon, og den finner forskjell på ord som lyder likt men skrives forskjellig, som «hart» og «heart».  Det ser også ut til at de vanlige boolske operatørene virker. En annen kjekk funksjon er muligheten til å søke videre i enkeltvideoene du finner.

For flere detaljer, sjekk ut faq’en hos Google.

Categories: Søkemotorer Tags: , ,

Dagsrevyen = rugby leauge player! Youtubes automatiske oversettelse tuller det til

October 23rd, 2008 tord No comments

Automatisk oversettelse er nyttig i mange tilfeller, selv om den litterære kvaliteten på resultatet ofte varierer. Youtube har begynt med automatisk oversettelse av en del ting på sidene siden, blant annet søkeresultat som du kan få på «ditt eget språk».

Jeg har så langt jeg vet ikke bedt om annet enn engelsk, men får likevel dette pussige resultatet.  Youtube insisterer nemlig på at dagsrevyen skal oversettes til engelsk som «rugby» eller i noen tilfeller «rugby leauge player». Stusset litt over dagsrevyens åpenbart noe heftige rugbydekning på youtube før jeg fant på å slå av autooversetteren. (Jeg har ikke klart å finne noen rugbyspiller med navn som ligner på Dagsrevyen, men det finnes kanskje?) Read more…

Categories: språk Tags: , ,

Oslo blir søkehovedstad

October 2nd, 2008 tord No comments

Microsoft legger hovedkontoret for søkemotorer til Oslo, skriver NRK Beta. Norge har allerede en sterk posisjon innen søkebransjen, mye takket være miljøet på NTNU. Fast, Google, Yahoo og Microsoft har alle kontorer i Trondheim og nå kommer altså også hovedkontoret for MSsøk i Oslo. Jeg håper at dette også betyr at de kommer til å jobbe mer med å tilpasse søkemotorene norsk språkoppbygning (eller et hvilket som helst annet språk som i likhet med vårt har mange sammensatte ord og varianter av endelser.)

Categories: Søkemotorer Tags:
Switch to our mobile site