Bloomberg tusenvis av Amazon-ansatte hører på Echo-stemmeopptak

Amazon har tusenvis av ansatte lytter til Echo-lydklipp som et ledd i å forbedre Alexa's maskinlæring, slik at den personlige assistenten bedre kunne svare på stemmekommandoer.

Disse menneskene lytter til hva noen Alexa-eiere forteller assistenten, gjennomgår, transkriberer og kommenterer lydopptak for å hjelpe opplæring av Alexas maskinlæringsmodell.

Bloomberg har historien:

Arbeidet er stort sett dagligdags. En arbeider i Boston sa at han har utvunnet akkumulert stemmedata for spesifikke ytringer som 'Taylor Swift' og kommentert dem for å indikere at søkeren mente musikalartisten.

Så langt så bra, men ...

Noen ganger hører lytterne ting Echo-eiere sannsynligvis heller vil holde seg privat: en kvinne som synger dårlig av nøkkelen i dusjen, eller et barn som skriker om hjelp. Lagene bruker interne chatterom for å dele filer når de trenger hjelp til å analysere et forvirret ord - eller komme over en morsom innspilling.

Jeg får dele en kundes lydopptak med en medarbeider for å få jobben gjort. Men å dele et lydklipp med en kollega bare fordi brukeren kan ha tilfeldigvis sagt noe morsomt eller dumt føles helt galt og uprofesjonelt for meg.

Noen ganger hører de innspillinger de synes er opprørende, eller muligens kriminelle. To av arbeiderne sa at de hentet det de mener var et seksuelt overgrep. Når noe sånt skjer, kan de dele opplevelsen i det interne chatterommet som en måte å lindre stress på.

Mens Amazon har en prosess på plass for at arbeiderne skal følge hver gang de hører noe urovekkende, ble noen ansatte avvist på ingen usikre vilkår med forklaringen om at det ikke var Amazons jobb å blande seg inn.

For de som er bekymret for personvern hevder rapporten at folk i dette teamet lytter til bare noen av taleopptakene som ble tatt i Echo-eiernes hjem og kontorer..

En talsperson for Amazon kommenterte:

Vi tar sikkerheten og personvernet til kundenes personopplysninger på alvor. Vi kommenterer bare et ekstremt lite utvalg av Alexa stemmeopptak for å forbedre kundeopplevelsen.

For eksempel hjelper denne informasjonen oss med å trene talegjenkjenning og naturlige språkforståelsessystemer, slik at Alexa kan bedre forstå forespørslene dine, og sikre at tjenesten fungerer bra for alle.

Sudio-filer blir fjernet av identifiserbar informasjon som brukerens fulle navn og adresse. Når det er sagt, kunne Amazon ha vært mer oversiktlig med datainnsamlingen:

Stemmevurderingsprosessen Alexa, beskrevet av syv personer som har jobbet med programmet, belyser den ofte oversett menneskelige rollen i trening av programvarealgoritmer. I markedsføringsmateriell sier Amazon at Alexa 'lever i skyen og blir alltid smartere.' Men som mange programvareverktøy bygd for å lære av erfaring, gjør mennesker noe av undervisningen.

Brukere kan justere innstillingene for å hindre Amazon i å bruke stemmeopptakene sine for å forbedre Alexa.

Den nettbutikkgiganten erkjenner at Alexa-forespørsler blir brukt “for å trene opp talegjenkjenning og naturlige språkforståelsessystemer”, men dette ligger begravet i en liste med ofte stilte spørsmål på deres nettsted. Uansett hvordan du ser på det, er kontekstuell stemmegjenkjenning en tøff nøtt å knekke, men maskinlæring lover å være den rette løsningen. Problemet er at modeller for maskinlæring må trenes.

Amazon har team av mennesker som merker og kategoriserer Alexa stemmespørsmål

For eksempel har Apple trent Face ID med mer enn en milliard fotografier av folks ansikter. Når det gjelder talegjenkjenning, krever å oppnå høy nøyaktighet store mengder merkede data.

Derfor er det ikke mulig å lansere Siri på et nytt språk uten å ha nok data til å trene de akustiske modellene, og at data må komme fra virkelige mennesker som utfører ekte stemmespørsmål. Den eneste forskjellen mellom Amazon og Apple er at førstnevnte har mennesker som lytter til noen av disse innspillingene, mens den sistnevnte, antagelig, ikke.

Nå som du vet at Amazon har et globalt team som lytter til Alexa lydklipp, er det mer eller mindre sannsynlig at du fortsetter å bruke Echo-produkter?

Gi oss beskjed ved å legge igjen en kommentar nedenfor.