Apples har holdt sin selvkjørende forskning hemmelig i mange år, men nå har selskapet offentliggjort noen av sine autonome teknikker for kjøreprogramvare som forbedrer hindringsdeteksjon.
Publisert 17. november på det modererte vitenskapelige forhåndsutskriftsdatabanken arXiv av Apples kunstige intelligens- og maskinlæringseksperter Yin Zhou og Oncel Tuzel, skisserer papiret å oppdage små hindringer ved bruk av lysdeteksjonsmetode (LiDAR).
I stedet for å stole på håndlagde funksjonsrepresentasjoner (for eksempel et fugleperspektiv), foreslår Apples forskere en ny trenbar dyp arkitektur fra ende til ende for punktskybasert 3D-deteksjon. Det kalles VoxelNet, og kan fungere direkte på sparsomme 3D-punkter og fange 3D-forminformasjon effektivt.
Tidlig eksperimentering med VoxelNet-teknologi har vist at den overgår topp moderne LiDAR-baserte 3D-deteksjonsmetoder med stor margin. På mer utfordrende oppgaver, som 3D-deteksjon av fotgjengere og syklister, demonstrerte VoxelNet-tilnærmingen oppmuntrende resultater, og viste at den gir en bedre 3D-representasjon og deteksjon.
Grønne 3D-bokser angir potensielle hindringer oppdaget ved bruk av LiDAR
Evnen til å oppdage objekter nøyaktig i 3D-punktskyer er avgjørende for å unngå hindringer.
Fra papiret:
VoxelNet deler en poengsky i like store avstander fra 3D-voxels og transformerer en gruppe av punkter i hver voxel til en enhetlig funksjonsrepresentasjon gjennom det nylig introduserte laget for voxel-funksjonskoding (VFE). På denne måten blir punktskyen kodet som en beskrivende volumetrisk representasjon, som deretter kobles til en RPN for å generere deteksjoner.
Eksperimenter med KITTI-bildeteksjonsberegningen viser at VoxelNet overgår de toppmoderne LiDAR-baserte 3D-deteksjonsmetodene med stor margin. Videre lærer nettverket vårt en effektiv, diskriminerende representasjon av objekter med forskjellige geometrier, noe som fører til oppmuntrende resultater i 3D-deteksjon av fotgjengere og syklister, basert på bare LiDAR.
VoxelNet-arkitekturen, illustrert toppen av innlegget, har et læringsnettverk som tar en rå punktsky som input, og deretter deler opp plassen til voxels og transformerer punkter i hver voxel til en vektorrepresentasjon som karakteriserer forminformasjonen.
Det er flott at Apple begynner å åpne seg når det kommer til sin autonome kjøreforskning, som sies å være rettet mot turgåingsmarkedet og selskapets interne campus-skytteltjeneste.
IPhone-produsenten har tilsynelatende gjort en stor investering i autonom kjøring og har “et stort prosjekt som går” på det stedet, ifølge administrerende direktør Tim Cook.