For et par dager siden skrev jeg litt om Gaudi, Googles nye talegjenkjenningssøk. Da nevnte jeg også Everyzing, men det finnes flere måter å søke etter lyd på. Lydsøk faller i to hovedkategorier: de som lar deg søke etter det som faktisk sies i lydklippet (og her er normalt en eller annen form for talegjenkjenning med i bildet) og de som bare lar deg søke i taggene eller metainformasjonen til lydklippet. Sistnevnte er det flest av.
Her er et par:
- Yahoo Audio: Mest orientert mot musikkbutikker, men man kan også velgesøk “on the web”
- Altavista Audio: I bunn samme base som Yahoo Audio men annet brukergrensesnitt. Altavista lar deg velge filtype, mer orientert mot den åpne webben.
- Findsounds.com: Mest orientert mot lydeffekter. Du har muligheter for å begrense etter en rekke tekniske parametere som filtype, sample rate og stereo/mono.
Ellers er bittorrent-søk som thepiratebay.org selvsagt et godt utgangspunkt for å finne lyd. Der, som ellers, bør du sørge for å avklare rettighetsspørsmålet før du publiserer/bruker lydklippene selv.
Ellers er Sesams Nett-tv-søk bra for norske nyheter både video og radio. Også her er det snakk om søk i tagger og metainformasjon.
Viewzi.com er et artig nettsted som eksperimenterer i forskjellige måter å vise søkeresultater fra Google, Yahoo og et par andre. Blant visningene er timeline view – som vist her for søkeordene Jens Stoltenberg. Det er åpenbart at de er inspirert av cooliris – eller i det minste deler inspirasjonskilde med dem.
I daglig bruk har det kanskje ikke så mye apell for den jevne bruker, men det er interessant å se dette som en mulig vei videre fra nettpresentasjon slik vi hittil har kjent den: I stor grad tekst eller lister nedover på en skjerm. Vi er vant til å scrolle nedover sidene. Men hos Viewzi blar man altså.
Og jeg kan ikke fri meg fra å se likheter med denne måten å presentere stoffet på og brukergrensesnittet i Ipod touch og Iphone.

Etter en lang stund med relativt lite artige nyheter hos Google Labs dukket Gaudi opp her om dagen. Det er ikke et søk om den katalanske arkitekten, men en forkortelse for Google Audio Indexing, en test av talegjenkjenning og hvordan dette kan brukes til å søke etter innhold. Foreløpig er søket begrenset til å gjelde kanaler på Youtube med amerikansk politisk innhold, åpenbart i anledning det amerikanske presidentvalget.Søket er en videreføring av Google election video serch gadget’en for iGoogle de lanserte tidligere i år.
Talegjenkjenning er ikke noe nytt. Men hittil har det vært små søkeselskaper som har hatt dette som nisjeprodukt med tildels små indekser. En gratis søketjenste som podzinger som var veldig bra, ble dessuten endret til en lukket betalingsjeneste under navnet Everyzing.
En raskt test av Gaudi viser at talegjekjenningen er overraskende god. Selv fyllord som «hum» og «um» blir funnet med god presisjon, og den finner forskjell på ord som lyder likt men skrives forskjellig, som «hart» og «heart». Det ser også ut til at de vanlige boolske operatørene virker. En annen kjekk funksjon er muligheten til å søke videre i enkeltvideoene du finner.
For flere detaljer, sjekk ut faq’en hos Google.
Automatisk oversettelse er nyttig i mange tilfeller, selv om den litterære kvaliteten på resultatet ofte varierer. Youtube har begynt med automatisk oversettelse av en del ting på sidene siden, blant annet søkeresultat som du kan få på «ditt eget språk».
Jeg har så langt jeg vet ikke bedt om annet enn engelsk, men får likevel dette pussige resultatet. Youtube insisterer nemlig på at dagsrevyen skal oversettes til engelsk som «rugby» eller i noen tilfeller «rugby leauge player». Stusset litt over dagsrevyens åpenbart noe heftige rugbydekning på youtube før jeg fant på å slå av autooversetteren. (Jeg har ikke klart å finne noen rugbyspiller med navn som ligner på Dagsrevyen, men det finnes kanskje?) Read more…
Microsoft legger hovedkontoret for søkemotorer til Oslo, skriver NRK Beta. Norge har allerede en sterk posisjon innen søkebransjen, mye takket være miljøet på NTNU. Fast, Google, Yahoo og Microsoft har alle kontorer i Trondheim og nå kommer altså også hovedkontoret for MSsøk i Oslo. Jeg håper at dette også betyr at de kommer til å jobbe mer med å tilpasse søkemotorene norsk språkoppbygning (eller et hvilket som helst annet språk som i likhet med vårt har mange sammensatte ord og varianter av endelser.)
September 17th, 2008
tord
For en tid tilbake skrev jeg om nye Google Chrome og hvorfor jeg synes Firefox er et bedre verktøy for research. I den posten listet jeg opp noen tillegg til Firefox som jeg synes er kjekke å bruke.
I dag oppdaget jeg at “ie tab”-tillegget er tilbake. Dette kjekke lille programmet som sparer deg for mye gremmelse når du surfer sluttet å virke da Firefox ble oppdatert i vår og sommer. Nå har folkene bak fått laget en versjon til nye Firefox.
Men hva består nå kjekt å ha-faktoren i spør du deg sikkert. Jo – tillegget gjør det mulig å kjøre et Internet Explorer-vindu i Firefox. Altså: Når du kommer over sider som bare fungerer skikkelig i IE, som min arbeidsgiver www.ij.no, bare høyreklikker du på siden og velger “show page in ie tab”.
Innmari kjekt å ha.

Lanseringen av nettleseren Chrome er fulgt av masse hype og diskusjon som alltid når Google lanserer nye ting. I skrivende stund gir Sesams norske bloggsøk 594 treff på navnet.
Det er en del gilde funksjoner i Chrome. Men driver du, som jeg, mye med research på nettet er det likevel gode grunner til fortsatt å bruke Firefox. Hovedgrunnen, og dette er neste utrolig, er at Google ikke har laget noen Chrome-utgave av sine eminente verktøylinje. Vel har lagt søkefunksjonalitet i adresselinja, men for å få spesialsøk må du først legge til søkemotorene manuelt og så bruke spesielle kodeord når du søker.
Jeg opplever det som langt mer tungt enn bare å klikke på ikoner på verktøylinja. Uansett får du ikke kjekke vertøy som ordmarkeringen, oversettelser, direktetilgang til Googles cachede utgave av siden, og ikke minst “søk på denne siden”-knappen.
Firefox rager dessuten himmelhøyt over på grunn av alle tilleggsprogrammene som gjør livet og research så mye lettere. Noen av mine favoritter er:
Update scanner – enkel og grei nettsidetracker
Scrap Book – Utklippstavle på steroider
Gspace – som lar deg bruke gmailområdet ditt til lager for filer som er større en det du kan sende som vedlegg
Fast video download – Lar deg laste ned youtube-filer som flashvideo-filer
Download embedded – som lar deg laste ned embeddede mediefiler som ikke er flash
En ok funksjon i Chrome er inkognitomodus. Her kan du surfe uten at det etterlates spor på din maskin etter hvilke sider du har vært på. Dersom utviklerne i tillegg hadde sørget for å ikke legge igjen spor på serverne du besøker hadde dette vært skikkelig nyttig for journalister.
Telegraph.co.uk har laget en anmeldelse av anmeldelsene av Google Chrome.

Søkemotoren Cuil fikk litt oppmerksomhet i norske medier i sommer. Blant andre Aftenposten skrev på papir om Cuil og deres innmari store index. En haug med bloggere har mer eller mindre spådd Cuils undergang allerede, mest på grunn av Googles markedsposisjon. Men heller ikke søkefunksjonaliteten levner Cuil livets rett, minst av alt som journalistisk arbeidsredskap.
Cuil sier de er den søkemotoren som har indeksert mest av webben, og har en uttalt ambisjon om å indeksere alt. De andre store søkemotorene har sluttet å skryte av størrelsen på indexene sine og det med en viss grunn. Det er nemlig ikke så viktig hvor mye av webben du har indexert bare du har indexert de rette delene. Dessuten må du la folk kunne sortere og begrense treffene. For det hjelper lite om du har mer informasjon i basen din enn andre om det er umulig å finne fram i den. Det er på dette punktet Cuil sliter. Her er noen søk hvor jeg sammenligner Cuil og Google. Klikk på lenkene for å gjøre søket selv.
Søkeord: jens stoltenberg
Resultat: cuil (124 670 treff) google (664 000 treff).
Søkeord: jens OR camilla stoltenberg
Resultat: cuil (5 treff) google (708 000 treff)
Og etter det gadd jeg ikke prøve stort flere søk. Det viser seg nemlig at standard søkeoperatører som OR, NOT eller minustegn ikke virker i Cuil. Heller ikke er det mulig å begrense til språk, land eller bestemte domener slik de fleste andre større søkemotorer lar deg gjøre.
Når du ikke får noen muligheter til å begrense søket er det liten nytte i en stor index. Andre funksjonaliteter jeg savner er muligheten til å se i hurtigbufferen eller søke på filtype.
I skrivende stund 121,6 milliarder websider. Men størrelsen er, som alltid, ikke alt.
I mai lanserte Google automatisk oversettelse til norsk, både i språkverktøyene og med translate this page-lenker i resultatlista.
Nå har de også begynt med automatisk oversettelse fra norsk til engelsk. Gjør du et søk der du får treff på norske sider, som for eksempel et søk på ordet ferievær ser du at translate this page lenkene dukker opp.
Automatisk oversettelse er aldri helt bra. Stort sett er det beste du kan håpe på en sånn passe forståelig tekst. Enn så lenge ser det ut til at de sliter med ordforrådet i databasen. Det kan bli bedre, men aldri helt bra siden norsk behandler sammensatte ord helt anderledes enn engelsk, noe følgende tekstprøve viser:
Googles versjon:
Svenskene would end in October-november of last year’s journey to Thailand’s capital Bangkok and to the small Kingdom of Bhutan further north in Asia. They asked the tour operators pick and choose more specific destination for them, wrote the Stockholm-newspaper Svenska Dagbladet on Thursday.
The choice fell on the island of Koh Samui in Thailandbukta. But when they arrived there, it turned out that the island had been hit by strong monsunregn in more than a week, and according to the Swedish tourists were oversvømt the streets and entrances to shops and restaurants closed with sandsekker.
Originalen fra NTB:
Svenskene skulle i månedsskiftet oktober-november i fjor reise til Thailands hovedstad Bangkok og til det lille kongedømmet Bhutan lenger nord i Asia. De ba turoperatøren velge ut mer konkrete reisemål for dem, skrev Stockholm-avisen Svenska Dagbladet torsdag.
Valget falt på øya Koh Samui i Thailandbukta. Men da de kom dit, viste det seg at øya hadde vært rammet av sterkt monsunregn i mer enn en uke, og ifølge de svenske turistene var gatene oversvømt og inngangene til butikker og restauranter stengt med sandsekker.
En ekstra bug er at oversetteren tok med originalsetningene i resultatet. I teksten over har jeg fjernet dem manuelt. Resultatet fra Google var opprinnelig som dette:
Svenskene would end in October-november of last year’s journey to Thailand’s capital Bangkok and to the small Kingdom of Bhutan further north in Asia. De ba turoperatøren velge ut mer konkrete reisemål for dem, skrev Stockholm-avisen Svenska Dagbladet torsdag. They asked the tour operators pick and choose more specific destination for them, wrote the Stockholm-newspaper Svenska Dagbladet on Thursday. Osv…
Microsofts søkemotor Live legger ned både boksøket sitt og vitenskapssøket Live Academic. Grunnen er, i følge Live-bloggen, at de tjener for dårlig på disse søkemotorene:
For example, this past Wednesday we announced our strategy to focus on verticals with high commercial intent, such as travel, and offer users cash back on their purchases from our advertisers.
Heretter blir bok- og vitenskapsresultater blandet inn i det vanlige nettsøket. Dermed står Google Scholar og Books
Live Academic var langt bedre enn Google Scholar. Først og fremst fordi Live oppga hvilke kilder de indexerte innhold fra. Det gjør ikke Google Scholar der du kan risikere å få treff på alt fra en seminaroppgave fra en fersk bachelorstudent til epokegjørende avhandlinger fra Nobelprisvinnere. Heretter blir det opp til deg selv å skille skitt og kanel.
Nye kommentarer