Hvordan lærer Siri et nytt språk? I dagens intervju med Reuters tilbød Apples taleteamsjef Alex Acero et bak kulissene å se på hvordan Siri læres nye språk, en prosess som involverer manusskriving, fanger stemmer i flere aksenter og dialekter og bruker maskinlæring og kunstig intelligens for å bygge og utvikle nye språkmodeller over tid. Systemet krever et team av mennesker som har til oppgave å lese passasjer med manuelt transkribert tekst.
Før Apple faktisk oppdaterer Siri, lanserer Apple først Dictation-støtte for et nytt språk.
Siri snakker for tiden 21 språk i 36 land. Til sammenligning støtter Microsofts Cortana åtte språk skreddersydd for tretten land, Google Assistant snakker fire språk mens Amazons Alexa bare fungerer på engelsk og tysk.
Å lære Siri et nytt språk innebærer følgende trinn:
- Folk les tilpassede passasjer med tekst i en rekke aksenter og dialekter
- Innspillinger blir transkribert for hånd slik at Siri vet nøyaktig hva den skal lære
- De fanger også lyder i en rekke stemmer
- Det bygges en ny språkmodell som prøver å forutsi ordssekvenser
Apple ruller ut Diktasjonsstøtte for det nye språket før det legges til Siri - det er grunnen til at Diction-funksjonen støtter flere språk enn Siri (den kommende macOS Sierra 10.12.4 programvareoppdateringen, for eksempel, vil aktivere Diktasjonsstøtte for Shanghainese, en kinesisk dialekt som snakkes bare rundt den byen).
Diktasjon lar Apple fange opp anonymiserte lydopptak, komplett med bakgrunnsstøy og mumlede ord. Lyden blir transkribert manuelt av mennesker, en prosess som Acero hevder hjelper med å kutte talegjenkjenningsfeilrenten til halvparten.
Det er først etter at det er samlet nok data til at Apple gir en skuespiller oppdrag for å spille inn stemmer for Siri. Når et nytt Siri-språk er klart for prime time, frigis det med svar på hva Apple estimerer vil være de vanligste spørsmålene.
Apple investerte store summer i kunstig intelligens og maskinlæring for å hjelpe språkmodellene med å utvikle seg over tid mens Siri lærer mer om hva brukere spør.
De oppdaterer Siri annenhver uke med flere finjusteringer, sa Acero.
Abonner på iDownloadBlog på YouTube
Et mulig problem med Apples tilnærming, ifølge Charles Jolley, skaper av en intelligent assistent ved navn Ozlo, er at du ikke kan ansette nok forfattere til å komme opp med systemet du trenger på alle språk.
Andre personlige assistenter, inkludert Google Now og Microsoft Cortana, demper skaleringsproblemet ved å syntetisere svarene, noe Siri ikke er veldig god på.
Viv, en oppstart grunnlagt av Siris originale skapere som Samsung kjøpte i fjor, jobber med akkurat det. "Den eneste måten å hoppe over dagens begrensede funksjonalitetsversjoner er å åpne systemet og la verden lære dem."
Selv om Siri nå snakker flere språk enn hennes rivaler (Google og Amazon sa at de planlegger å bringe flere språk til sine respektive assistenter), sitter brukeren fortsatt med en underopplevelse fordi, som jeg nevnte, andre assistenter er bedre til å forstå kontekst og gi flere samtale svar.
Cupertino-selskapets anskaffelse av $ 200 millioner dollar av Australia-basert maskinlæring oppstart Turi i august 2016 skulle bidra til å forbedre Siris språk og kunnskapsmodeller.
Apple forventes å vise frem forbedrede Siri-funksjoner (som kanskje eller ikke er eksklusivt for iPhone 8) på sin årlige pilegrimsreise for utviklere som starter med en hovednote 5. juni. Siri-forbedringer kan omfatte flerspråklig støtte.
iOS 10 støtter å skrive på to språk uten å måtte bytte tastatur, så kanskje Siri snart vil forstå flere språk uten å kreve at du manuelt velger et på Innstillinger → Siri → Språk?
En flerspråklig Siri skal også fungere bra på Apple TV.
Et intervju i november 2015 med flere Apple TV-prosjektledere antydet at Apple i utgangspunktet begrenset Siri på set-top-boksen til bare åtte land på grunn av forskjellene i uttalen av skuespillernavn, filmer og regissører på forskjellige språk og dialekter..
Kilde: Reuters