Riepilogo: La distribuzione e la composizione di elementi visivi come marciapiedi, vegetazione, facciate di edifici, automobili e pedoni catturati nelle immagini stradali avevano un elevato potere predittivo per molti attributi urbani come l’uso dei trasporti, la povertà, i tassi di criminalità e i livelli di attività fisica.
Gli algoritmi di visione artificiale sono stati in grado di trovare e quantificare queste relazioni solo a partire dai dati dell’immagine e, per molti aspetti, hanno sovraperformato i mezzi più convenzionali per raccogliere tali dati.
Le città sono sistemi complessi, ma i loro attributi fisici offrono indizi sulla vita al loro interno.
Un nuovo studio, intitolato “Urban visual intelligence: Uncovering hidden city profiles with street view images” e pubblicato il 23 giugno su Atti dell’Accademia Nazionale delle Scienzedimostra come gli algoritmi di deep learning possono analizzare le immagini di Street View per scoprire profili socioeconomici nascosti dei quartieri degli Stati Uniti.
I ricercatori dell’Università di Hong Kong, dell’Università della Scienza e della Tecnologia di Hong Kong, della Jiangxi Normal University e del MIT hanno raccolto oltre 27 milioni di immagini di Google Street View da 80 contee degli Stati Uniti in 7 principali aree metropolitane.
Utilizzando un modello di visione artificiale, hanno estratto caratteristiche urbane da queste immagini come alberi, marciapiedi, facciate di edifici e automobili.
Le aree metropolitane incluse nello studio erano Miami–Fort Lauderdale–Pompano Beach; Los Angeles–Long Beach–Anaheim; Chicago–Naperville–Elgin; Filadelfia–Camden–Wilmington; New York–Newark–Jersey City; Boston–Cambridge–Newton; e San Francisco-Oakland-Berkeley.
Questa selezione di aree metropolitane copre una vasta gamma di contesti geografici e dimensioni della popolazione, dalle principali città costiere come New York alle aree metropolitane dell’entroterra come Chicago.
I ricercatori hanno scelto queste particolari regioni per acquisire dati di street view che rappresentano la varietà di ambienti urbani negli Stati Uniti.
La distribuzione spaziale di queste caratteristiche da sola rappresentava fino all’83% della varianza nelle miglia percorse dai veicoli, il 64% nei crimini violenti e il 68% nell’inattività fisica.
La distribuzione di questi elementi visivi catturati dagli algoritmi di visione artificiale era fortemente correlata con la criminalità ufficiale e i dati economici.
E il i modelli di immagine spesso hanno sovraperformato i modelli che utilizzavano dati demografici e demografici più convenzionali.
Ad esempio, quando si prevedono i tassi di povertà, i modelli che utilizzano le immagini di Street View potrebbero rappresentare il 62% della varianza, mentre i modelli che si basano sulla popolazione e sui dati demografici catturano solo circa il 56% della varianza.
Che aspetto hanno gli alti tassi di criminalità
I ricercatori hanno scoperto che le aree con tassi più elevati di criminalità violenta avevano facciate di edifici più anonime e meno finestre visibili dalla strada.
In altre parole, una minore “permeabilità visiva” è associata a un aumento della criminalità.
Al contrario, le aree con edifici contenenti più finestre e trasparenza a livello stradale, consentendo la sorveglianza naturale, tendevano ad essere più ricche.
Ambienti stradali disordinati con scarsa manutenzione, mancanza di investimenti e minori servizi pedonali erano predittivi di quartieri con livelli più elevati di criminalità e svantaggio economico.
Al contrario, le strisce pedonali, gli isolati di piccole dimensioni e la segnaletica pedonale erano correlati a una minore criminalità.
Non sorprende che il deterioramento delle facciate degli edifici e i segni di abbandono (ad esempio la vernice scrostata, le finestre rotte, ecc.) fossero predittivi di tassi di povertà più elevati.
E la presenza di edifici vuoti, abbandonati o fatiscenti visibili dalla strada era indicativa di un aumento dei livelli di povertà e criminalità.
Allo stesso modo, un maggior numero di graffiti e spazzatura nelle strade è stato collegato all’aumento dei livelli di criminalità e povertà.
E la mancanza di illuminazione stradale, panchine, pensiline degli autobus e altro arredo urbano è stata associata a tassi più elevati di criminalità e povertà.
Le aree con marciapiedi mal mantenuti o prive di caratteristiche di accessibilità pedonale presentavano tassi di povertà e criminalità più elevati.
E meno verde e meno alberi nelle immagini sono anche correlati a tassi più elevati di criminalità e povertà.
“Proponiamo l'”intelligenza visiva urbana” come un processo per scoprire profili nascosti di città, dedurre e sintetizzare informazioni urbane con la visione artificiale e immagini di street view”, hanno spiegato gli autori dell’articolo.
Un modo migliore di raccogliere dati urbani
L’analisi degli ambienti urbani attraverso le immagini street view offre numerosi notevoli vantaggi rispetto ai tradizionali metodi di raccolta dati.
La visione artificiale applicata alle scene di street view potrebbe integrare le tradizionali fonti di dati urbani catturando attributi soggettivi ed esperienziali del luogo che sono difficili da quantificare altrimenti, ma che tuttavia influenzano la vita e le percezioni del quartiere.
La tecnologia consente di ridimensionare queste analisi soggettive precedentemente realizzabili solo attraverso l’osservazione di persona.
Le caratteristiche visive estratte dalle immagini forniscono un modo oggettivo e scalabile per misurare gli attributi dell’ambiente costruito, mentre le misure convenzionali come le indagini sull’uso del territorio e gli audit di persona richiedono più tempo, lavoro e portata limitata rispetto a quelle automatizzate. analisi di visione artificiale di scene stradali.
Con l’espansione dei set di dati di immagini provenienti da fonti come Google Street View, questo approccio consente di studiare le aree urbane a livello globale scala molto più ampia e risoluzione spaziale più fine di quanto precedentemente fattibile.
La capacità di discernere modelli visivi cattura anche dettagli impliciti e qualità intangibili non pienamente trasmesse da set di dati statistici o indagini.
Inoltre, poiché le immagini possono essere catturate ripetutamente per un lungo periodo di tempo, le tecniche di visione artificiale offrono il potenziale per valutare i cambiamenti nel tempo più facilmente rispetto agli sporadici studi sul campo.
Integrando gli indicatori tradizionali con l’intelligenza visiva automatizzata, ricercatori e progettisti possono acquisire una comprensione più completa e sfumata delle tendenze socioeconomiche e delle relazioni con l’ambiente costruito.
Questo nuovo metodo promette di sbloccare nuove intuizioni urbane riduzione dei costi e degli sforzi rispetto ai metodi esistenti.
Intelligenza visiva urbana: prossimi passi
“Con l’aumento degli strumenti di visione artificiale e dei dati urbani disponibili, i ricercatori possono estrarre ulteriormente significati semantici dalle immagini e dai video delle città”, hanno scritto gli autori. “Questi strumenti e dati consentono agli studi urbani di catturare microvariazioni su larga scala nelle città, sintetizzare informazioni nascoste nelle città e dedurre tendenze future”.
L’analisi delle immagini di queste 7 aree metropolitane ha fornito un solido set di dati per testare la capacità degli algoritmi di visione artificiale di scoprire caratteristiche socioeconomiche dagli attributi visivi di diverse città e quartieri.
I risultati coerenti nelle diverse regioni dimostrano anche la potenziale generalizzabilità dell’uso delle immagini di Street View e della visione artificiale per comprendere la vita urbana.
Lo studio fornisce una base per sfruttare le immagini di Street View e la visione artificiale per comprendere le città.
Come hanno riassunto i ricercatori, “qui si dimostra che l’aspetto dell’ambiente urbano è fortemente connesso con il benessere di una città”.
I pianificatori urbani possono adottare interventi tempestivi basati su segnali visivi piuttosto che attendere risultati di indagini approfondite.