Noen Amazon-ansatte som lytter til Alexa-forespørsler har tilgang til brukernes hjemmeadresser

Bloomberg rapporterte nylig at Amazon har et prosjekt med noen av sine ansatte som lytter til noen av lydopptakene som ble gjort av Alexa-høyttalere når brukere samhandler med dem, men det ser ut til at de menneskene også har tilgang til kundenes hjemmeadresser..

En ny Bloomberg-rapport fra i morges siterer fem anonyme ansatte i Amazons Alexa Data Services-team som bekrefter at de lett kan finne en kundes hjemmeadresse ved å skrive informasjon om breddegrad og lengdegrad i kartleggingsprogramvare som Google Maps..

Selv om det ikke er noen indikasjon på at Amazon-ansatte med tilgang til dataene har forsøkt å spore opp enkelte brukere, uttrykte to medlemmer av Alexa-teamet Bloomberg bekymring for at Amazon ga unødvendig bred tilgang til kundedata som ville gjøre det enkelt å identifisere en enhets eier.

Det høres absolutt ikke lovende ut.

Noen av arbeiderne som er siktet for å analysere innspillinger av Alexa-kunder bruker et Amazon-verktøy som viser lydklipp sammen med data om enheten som fanget innspillingen. Mye av informasjonen som er lagret av programvaren, inkludert en enhets-ID og kundeidentifikasjonsnummer, kan ikke lett kobles tilbake til en bruker.

Slik skal det være.

Imidlertid samler Amazon også posisjonsdata slik at Alexa kan mer nøyaktig svare på forespørsler, for eksempel å foreslå en lokal restaurant eller gi været i Ashland i nærheten, Oregon, i stedet for fjerne Ashland, Michigan.

Det var ikke noe galt med at Alexa samler posisjonsdata fra brukere for å forbedre tjenesten deres, hvis det ikke var fordi noen av de ansatte får lov til å se dem i utgangspunktet.

I en demonstrasjon sett av Bloomberg limte et Amazon-teammedlem en brukers koordinater, lagret i systemet som breddegrad og lengdegrad, inn i Google Maps. På mindre enn ett minutt hadde den ansatte hoppet fra et opptak av en persons Alexa-kommando til det som så ut til å være et bilde av huset deres og tilhørende adresse.

Det er absolutt urovekkende, men alle kan slå opp en persons beliggenhet i Google Maps så lenge de har breddegrad og lengdegrad, det er ikke noe spesielt med det. Det som er urovekkende er det faktum at brukerkoordinater er tilgjengelige for noen Amazon-ansatte.

Et annet internt verktøy som de bruker lagrer mer personlig data.

Etter å ha stukket inn et kunde-ID-nummer, kan de ansatte, kalt kommentatorer og verifiserere, se hjemmet og arbeidsadressene og telefonnumrene kundene skrev inn i Alexa-appen når de satte opp enheten, sa den ansatte. Hvis en bruker har valgt å dele kontaktene sine med Alexa, vises navn, nummer og e-postadresser også i dashbordet.

Ja, men hvorfor vise all den informasjonen i dashbordet?

Disse dataene er i systemet, slik at hvis en kunde sier 'Send en melding til Laura', kan menneskelige korrekturlesere sørge for at transkribenter skrev navnet riktig slik at programvaren lærer å koble den forespørselen med Laura i kontaktlisten..

Det er uklart fra rapporten hvor mange ansatte og entreprenører som kan ha tilgang til disse funksjonene. To Amazon-ansatte sa at de trodde de aller fleste arbeidere i Alexa Data Services-gruppen var i stand til å bruke den programvaren for omtrent ett år siden.

En annen ansatt sa at "inntil nylig" viste systemet fulle telefonnumre med noen sifre skjult. “Inntil nylig,” som betyr etter at Bloomberg rapporterte om dette, ikke sant?

Amazon begrenset tilgangen til data ytterligere etter Bloombergs 10. april-rapport, sa to av de ansatte. Noen datapartnere, som transkriberer, kommenterer og verifiserer lydopptak, kom for å finne ut at de ikke lenger hadde tilgang til programvareverktøy de tidligere hadde brukt i jobbene sine, sa disse menneskene.

Fra pressetiden hadde ikke tilgangen blitt gjenopprettet.

Bekymringsfullt inkluderte den opprinnelige rapporten en uttalelse tilskrevet en talsperson fra Amazon som benektet at folk som hørte på Alexa-innspillinger har tilgang til annen informasjon.

Ansatte har ikke direkte tilgang til informasjon som kan identifisere personen eller kontoen som en del av denne arbeidsflyten. All informasjon behandles med høy konfidensialitet, og vi bruker multifaktorautentisering for å begrense tilgang, servicekryptering og revisjoner av vårt kontrollmiljø for å beskytte den.

I en ny uttalelse som reagerer på historien, har Amazon imidlertid endret sin posisjon og kaller nå tilgang til interne verktøy "høyt kontrollert":

Tilgang til interne verktøy er sterkt kontrollert og gis kun til et begrenset antall ansatte som trenger disse verktøyene for å trene og forbedre tjenesten ved å behandle et ekstremt lite utvalg av interaksjoner.

Våre retningslinjer forbyr strengt ansattes tilgang til eller bruk av kundedata av andre årsaker, og vi har en nulltoleranse for misbruk av systemene våre. Vi kontrollerer regelmessig ansattes tilgang til interne verktøy og begrenser tilgangen når og hvor det er mulig.

Før vi hopper til for tidlige konklusjoner, bærer det gjentagende at dette ikke er et slags hemmelig prosjekt - Amazon legger ikke skjul på at det lønner seg å lytte på kundesamtaler. I likhet med Apple og andre teknologiselskaper holder Amazon anonyme fragmenter av lydopptak på serverne i en periode for å forbedre stemmegjenkjenningen og AI.

"Vi bruker forespørslene dine til Alexa for å trene opp systemene våre for anerkjennelse av tale og naturlige språk," sier selskapet i en liste med ofte stilte spørsmål.


Det er et faktum i teknologiverdenen at kunstige intelligenssystemer som hjelper maskiner med å forstå betydningen bak talte ord, må trenes regelmessig ved å bruke virkelige opptak, som er den eneste pålitelige måten å forbedre nøyaktigheten på.

Som Amazon-talsperson forklarte til Bloomberg:

Vi kommenterer bare et ekstremt lite utvalg av Alexa stemmeopptak for å forbedre kundeopplevelsen. Denne informasjonen hjelper oss med å trene talegjenkjenning og naturlige språkforståelsessystemer slik at Alexa bedre kan forstå dine forespørsler og sikre at tjenesten fungerer bra for alle.

Apple gjør akkurat det samme - Siri har menneskelige hjelpere som lytter til noen av klippene, bundet til en tilfeldig identifikator og lagret på servere i seks måneder.

Etter dette fjernes den tilfeldige identifikatoren fullstendig, men dataene beholdes i lengre perioder for å forbedre Siris stemmegjenkjenning. Ja, Google har også korrekturlesere som har til oppgave å lytte til noen av assistentens utdrag for å hjelpe deg med å trene og forbedre tjenesten. Googles innspillinger blir fjernet av all personlig identifiserbar informasjon og selve lyden er forvrengt.

Som Florian Schaub, en professor ved University of Michigan som har forsket på personvernproblemer knyttet til smarte høyttalere, sa det pent:

Du tenker ikke nødvendigvis på et annet menneske som lytter til det du forteller din smarte høyttaler i hjemmet ditt. Jeg tror vi har blitt betinget av at disse maskinene bare lærer magiske maskiner.

Men faktum er at det fortsatt er manuell behandling involvert.

Om det er en personvernhensyn eller ikke, avhenger av hvor forsiktige Amazon og andre selskaper er i hvilken type informasjon de har merket manuelt, og hvordan de presenterer den informasjonen til noen.

For sammenheng er her et utdrag fra den opprinnelige historien:

Noen Alexa-korrekturlesere har til oppgave å transkribere brukernes kommandoer, sammenligne opptakene med Alexas automatiserte transkripsjon, si eller kommentere samspillet mellom bruker og maskin. Hva spurte personen? Ga Alexa et effektivt svar?

Andre legger merke til alt taleren tar opp, inkludert bakgrunnssamtaler - også når barn snakker. Noen ganger hører lytterne brukere diskutere private detaljer som navn eller bankinformasjon; I slike tilfeller er det meningen at de skal krysse av i en dialogboks som angir kritiske data. De går deretter videre til neste lydfil.

I følge Amazons hjemmeside lagres ingen lyd med mindre Echo oppdager våkne ordet eller aktiveres ved å trykke på en knapp. Men noen ganger ser det ut til at Alexa begynner å spille inn uten noen spørsmål i det hele tatt, og lydfilene starter med et uskarpt fjernsyn eller uforståelig støy. Hvorvidt aktiveringen blir feil eller ikke, må kontrollørene transkribere den. En av personene sa at revisorene transkriberer hver opp til 100 innspillinger om dagen når Alexa ikke får noen våkne-kommando eller blir utløst ved et uhell.

Bloombergs opprinnelige rapportering hevdet at “de tusenvis av ansatte” som jobber med dette prosjektet noen ganger også må gjennomgå klipp som kan være ganske urovekkende - og til og med noen som kan være kriminelle. I en rapportert sak hørte to Amazon-ansatte hva de mener var seksuelle overgrep, men ble bedt av arbeidsgiveren deres om ikke å rapportere hendelsen, fordi det “ikke var Amazons jobb å blande seg inn.”

I slike ekstreme tilfeller er det veldig mye Amazons jobb å blande seg inn.

Hvorfor vil ikke selskapet tillate de ansatte som hører på Alexa-opptak å rapportere disse hendelsene til rettshåndhevelse og potensielt redde liv? Hvis noen bryter inn i huset mitt og holder meg på skuddveksling, vil jeg at den som kanskje hører på, får lov til å se min hjemmeadresse og til og med varsle politiet, om nødvendig.

tanker?