Algoritmo di rilevamento di oggetti abbandonati nei sistemi metropolitani

Ottobre 8, 2025

Industry applications

rilevamento oggetti nei sistemi metropolitani: sfide e ambito

Gli oggetti lasciati in banchine affollate rappresentano rischi per la sicurezza e il servizio. Ad esempio, una borsa personale lasciata su una banchina può ostacolare il flusso, ritardare i treni e provocare evacuazioni. Inoltre, borse incustodite talvolta contengono materiali pericolosi, quindi una segnalazione rapida è importante per la sicurezza dei passeggeri. Anche le banchine affollate modificano i movimenti delle persone. Perciò gli operatori devono stimare il numero di oggetti incustoditi e reagire rapidamente.

Il monitoraggio manuale si affida a operatori umani che guardano i sistemi CCTV e effettuano segnalazioni. Tuttavia, l’attenzione umana diminuisce e la fatica legata ai turni riduce la vigilanza. Inoltre, la revisione manuale non scala quando grandi numeri di passeggeri affollano un nodo durante le ore di punta. Per esempio, in sistemi metropolitani congestionati le squadre umane possono perdere eventi brevi quando il flusso di passeggeri aumenta. Pertanto il rilevamento automatico può colmare le lacune di copertura e ridurre i tempi di attesa per la risposta agli incidenti.

Il rilevamento automatizzato offre velocità e copertura costante. Ad esempio, il sistema automatico può segnalare la presenza di oggetti estranei, tracciare il movimento degli oggetti e notificare gli operatori entro pochi secondi. Inoltre, i sistemi automatizzati permettono ai gestori della metropolitana di contare il numero di passeggeri vicino a un incidente. Di conseguenza il personale può indirizzare i soccorritori in modo più efficiente. Inoltre, gli strumenti automatici aiutano con la riscossione dei biglietti e il controllo delle folle in banchina fornendo dati sugli eventi alle dashboard operative.

I ricercatori hanno valutato il TRL per gli strumenti di rilevamento di oggetti incustoditi e hanno evidenziato i passaggi dai laboratori al dispiegamento. L’indagine osserva “Automatic unattended object detection is not only a security imperative but also a critical enabler for the future of smart urban transit systems” (fonte). Per contesto, alcuni team combinano video e dati di tracciamento dei treni per modellare gli incidenti da oggetti lasciati utilizzando stime di massima verosimiglianza e per stimare i parametri del modello per la pianificazione della risposta specifica per stazione (fonte). Nel frattempo, gli operatori che vogliono un roll-out pratico dovrebbero testare sulle sorgenti dati esistenti e su configurazioni a singola fonte prima di scalare a due sorgenti per ridondanza. Inoltre, Visionplatform.ai converte le CCTV esistenti in una rete di sensori live così i team possono contare il numero di passeggeri e creare conteggi dei passeggeri da video senza vincoli con i fornitori.

tecniche AI per il rilevamento oggetti: deep learning per oggetti lasciati

Le reti neurali convoluzionali profonde guidano il moderno rilevamento oggetti. In primo luogo, le DCNN apprendono caratteristiche spaziali dalle immagini e poi classificano le regioni in classi di oggetti. Successivamente, le pipeline di addestramento richiedono frame etichettati, set di validazione e la messa a punto degli iperparametri. Per esempio, i team etichettano borse, valigie e pose umane per aiutare il modello a distinguere un oggetto estraneo dal bagaglio di routine. Inoltre, l’augmentazione espande piccoli dataset capovolgendo, ritagliando e variando la luminosità. Di conseguenza il modello impara a gestire variazioni di illuminazione e diverse angolazioni della camera.

Famiglie di modelli popolari includono YOLO e SSD. Inoltre, i rivelatori a due stadi come Faster R-CNN restano utili per compiti ad alta precisione. Per i dispiegamenti, gli ingegneri bilanciano velocità e accuratezza. Per esempio, le varianti di YOLO scambiano un po’ di precisione per latenze molto basse, il che si adatta alle necessità in tempo reale delle metropolitane. In pratica, il TRL per molti algoritmi di rilevamento oggetti è migliorato e alcuni sono pronti per la produzione. La ricerca sui sistemi di rilevamento e tracciamento di persone lasciate mostra che la fusione tra visione e radar può aumentare l’affidabilità in scene affollate (fonte).

L’addestramento richiede attenzione ai parametri del modello. Inoltre, i team devono evitare l’overfitting a una singola configurazione di stazione. Pertanto la validazione cross-stazione è importante. Inoltre, il transfer learning riduce la necessità di grandi insiemi etichettati. Per esempio, backbone pre-addestrati accelerano la convergenza e riducono i requisiti di calcolo. Inoltre, i team regolano le soglie e implementano un algoritmo di rilevamento che considera la persistenza temporale. Così il sistema riduce i falsi positivi quando un oggetto caduto è solo momentaneo. Infine, i sistemi di deep learning mostrano guadagni misurabili: le DCNN basate sulla visione possono ridurre la revisione manuale e migliorare le prestazioni di rilevamento rispetto ai metodi classici basati su feature (fonte). Visionplatform.ai supporta strategie di modello flessibili così gli operatori possono scegliere, adattare o costruire un modello proposto sui propri dati mantenendo l’elaborazione on-premise o all’edge per conformità e velocità.

Banchina della metropolitana con borsa incustodita

AI vision within minutes?

With our no-code platform you can just focus on your data, we’ll do the rest

flusso video e raccolta dati: impostare la sorveglianza in tempo reale

Il posizionamento delle telecamere determina il successo del rilevamento. Per prima cosa, montare le telecamere per coprire i bordi delle banchine, le scale e i concorsi con campi visivi sovrapposti. Successivamente, scegliere risoluzione e frame rate in base alle esigenze del compito. Per esempio, uno stream 1080p a 15–25 fps spesso bilancia dettaglio e larghezza di banda. Inoltre, alcuni siti utilizzano frame rate più alti dove il movimento degli oggetti è rapido. In aggiunta, le impostazioni di compressione dell’immagine devono preservare i dettagli per il rilevamento di oggetti piccoli mantenendo gestibile lo storage.

Il design della rete deve evitare colli di bottiglia. Pertanto gli ingegneri pianificano VLAN, QoS e link dedicati per il video in tempo reale. Inoltre, l’elaborazione all’edge aiuta. Per esempio, eseguire modelli su dispositivi della classe NVIDIA Jetson riduce il carico di rete e abbassa la latenza. Inoltre, Visionplatform.ai può essere distribuito su server GPU o dispositivi edge e trasmettere eventi tramite MQTT così i sistemi operativi ricevono eventi strutturati invece del video grezzo.

Il lavoro di etichettatura e dataset è importante. Prima, i team definiscono le classi e le regole di annotazione. Poi gli annotatori segnano box di delimitazione, stati degli oggetti ed etichette temporali per lo stato di incustodito. Per l’addestramento, i dati raccolti dovrebbero includere variazioni di illuminazione, occlusione e densità di folla. Inoltre, l’augmentazione simula condizioni avverse. La privacy è una priorità. Pertanto applicare sfocature o anonimizzazione dei volti durante la raccolta e l’analisi dei dati. Inoltre, conservare i dati localmente per supportare la conformità al GDPR e all’AI Act dell’UE quando necessario.

La conservazione continua dei flussi video solleva questioni di storage e ciclo di vita. Per esempio, politiche di retention ad alta risoluzione e lunga durata possono richiedere più petabyte. Quindi implementare livelli di retention e cancellazione automatica. Successivamente, integrare con il VMS in modo che il sistema riutilizzi gli archivi esistenti per il riaddestramento dei modelli. Infine, combinare il video con altri tipi di dati come orari di arrivo e partenza o dati di tracciamento dei treni per arricchire le etichette e stimare la probabilità che i passeggeri rimangano quando le porte si chiudono.

progettazione dell’algoritmo per rilevare oggetti estranei e bagagli incustoditi

La progettazione di un algoritmo di rilevamento efficace inizia con la modellizzazione dello sfondo. Per prima cosa, calcolare un modello di sfondo dinamico e sottrarlo per trovare candidati in primo piano. Poi applicare operazioni morfologiche e filtri per dimensione per escludere piccoli artefatti irrilevanti. Inoltre, eseguire un modello di riconoscimento degli oggetti sui candidati per classificare borse, valigie o oggetti tenuti in mano da persone. Inoltre, il tracciamento attraverso i frame stabilisce la persistenza. Per esempio, se un oggetto rimane fermo per un tempo di attesa configurato il sistema lo segnala come incustodito.

La regolazione delle soglie influisce sui falsi positivi. Pertanto calibrare le soglie per ogni telecamera e per ogni tipo di area. Per esempio, soglie sulla persistenza temporale, area minima e prossimità al bordo della banchina sintonizzano la sensibilità. Inoltre, Visionplatform.ai supporta la calibrazione locale così i team possono regolare in loco. Successivamente, livelli di rilevamento anomalo possono individuare movimenti insoliti di oggetti o apparizioni improvvise in zone riservate. Di conseguenza, combinare logica basata su regole con modelli appresi riduce gli allarmi spurii.

Gestire occlusioni e il rilevamento di oggetti piccoli richiede strategie multi-scala. Prima, applicare piramidi di caratteristiche nel backbone neurale per mantenere indizi ad alta risoluzione. Poi usare il contesto temporale così una borsa parzialmente occultata che appare attraverso i frame attiva comunque il rilevamento. Inoltre, la fusione multi-camera aiuta. Per esempio, telecamere con viste sovrapposte forniscono prospettive diverse per risolvere le occlusioni. Anche la fusione con radar a microonde può rilevare il volume dell’oggetto anche quando la vista della telecamera è bloccata, il che migliora l’affidabilità in scene affollate (fonte).

Infine, la riduzione dei falsi positivi beneficia del post-processing e del feedback degli operatori. Per esempio, consentire agli operatori di confermare gli avvisi; quindi inserire quella conferma nel ciclo di riaddestramento del modello. Inoltre, usare revisioni periodiche per regolare i parametri del modello e migliorare l’accuratezza dei rilevamenti attraverso le configurazioni di stazione. Questi passaggi aiutano il sistema di rilevamento a rimanere robusto man mano che il flusso di passeggeri e le configurazioni delle banchine cambiano.

AI vision within minutes?

With our no-code platform you can just focus on your data, we’ll do the rest

architettura del sistema di rilevamento: integrare il rilevamento automatizzato nelle metropolitane

Le scelte architetturali determinano latenza, costi e resilienza. Per prima cosa, i progettisti devono decidere tra edge e cloud. Il dispiegamento all’edge riduce la latenza e conserva i dati localmente, mentre il cloud può centralizzare gli aggiornamenti dei modelli. Per le operazioni metropolitane la bassa latenza è importante per gli avvisi di sicurezza. Pertanto molti operatori eseguono l’inferenza all’edge. Inoltre, Visionplatform.ai consente elaborazione on-premise o all’edge con integrazioni ai principali VMS in modo che gli operatori mantengano il controllo e soddisfino gli obiettivi di conformità UE.

La fusione di sensori aumenta l’affidabilità. Per esempio, abbinare flussi video con radar a microonde permette al sistema di rilevamento di verificare gli oggetti anche in condizioni di scarsa illuminazione. Inoltre, i dati di tracciamento dei treni e gli orari di arrivo e partenza aiutano a correlare gli oggetti incustoditi con la chiusura delle porte e i conteggi dei passeggeri. Successivamente, integrare gli eventi di rilevamento automatizzato nello stack operativo. Per esempio, trasmettere eventi strutturati tramite MQTT a dashboard, gestione incidenti e sistemi SCADA così le squadre reagiscono più rapidamente.

I dispositivi edge devono soddisfare requisiti di calcolo e rete. Pertanto prevedere server GPU o acceleratori specializzati in base alla densità delle telecamere. Inoltre, proteggere i modelli sui dispositivi e applicare versioning. In aggiunta, implementare storage ridondante e failover per i siti critici. Per l’ottimizzazione della larghezza di banda, inviare solo metadati degli eventi ai server centrali e mantenere il video completo negli archivi VMS locali quando necessario. Questo schema riduce il trasferimento continuo dei flussi video e supporta un roll-out scalabile su tutta la rete metropolitana.

I flussi di allerta dovrebbero essere semplici e guidati. Per prima cosa, il sistema di rilevamento invia avvisi graduati al personale in turno. Poi gli operatori ricevono contesto come ID telecamera, classe dell’oggetto, frame con timestamp e risposta suggerita. Successivamente, integrare con i turni di servizio e gli alberi di escalation così gli avvisi arrivano al giusto rispondente. Inoltre, consentire agli operatori di annotare gli avvisi per reinserirli nell’addestramento del modello. Infine, formare gli operatori sulla gestione dei falsi positivi per mantenere alta la performance del rilevamento. Per indicazioni pratiche sui casi d’uso ferroviari e le integrazioni, vedere le pagine sulla gestione della folla in piattaforma e sull’AI per le stazioni come gestione della folla sulla piattaforma e rilevamento bagagli abbandonati nelle stazioni.

Dashboard operatore con anteprime degli avvisi

valutazione delle prestazioni e futuri aggiornamenti per il sistema di rilevamento metropolitano

Definire le metriche prima del pilot. Per prima cosa, precisione e richiamo misurano correttezza e copertura. Successivamente, la latenza cattura la rapidità con cui un avviso raggiunge un operatore. Inoltre, monitorare il risparmio di lavoro confrontando le ore di revisione manuale prima e dopo il dispiegamento. Per esempio, il monitoraggio basato su DCNN vision ha ridotto il carico di revisione umano fino al 70% in scenari di test, mantenendo o migliorando le prestazioni di rilevamento (fonte).

I pilot nel mondo reale forniscono dati pratici. Per esempio, alcuni dispiegamenti combinano conteggi delle telecamere con dati di tracciamento dei treni e modelli di flusso passeggeri per stimare il numero di passeggeri lasciati durante le ore di punta. Inoltre, il modello proposto può utilizzare la stima di massima verosimiglianza per calibrare la probabilità che i passeggeri vengano lasciati quando le porte si chiudono. Per maggiori informazioni sulla modellizzazione del rischio di passeggeri lasciati e sull’estimazione, vedere la ricerca che deduce i passeggeri lasciati in reti congestionate (fonte). Inoltre, sistemi in città come la metropolitana di Beijing hanno testato analisi della folla e rilevamento di oggetti abbandonati per modulare le operazioni.

Misurare il ROI considerando l’evitamento degli incidenti, la riduzione dei ritardi e il calo del personale manuale. Includere anche il miglioramento dell’esperienza del passeggero quando i tempi di attesa diminuiscono e la variabilità del tempo di viaggio si riduce. Inoltre, i futuri aggiornamenti aggiungeranno sensori più ricchi. Per esempio, l’aggiunta di layer radar e sensori ambientali aumenta la resilienza alle occlusioni e al buio (fonte). Successivamente, i team utilizzeranno il federated learning per mantenere i modelli adattivi tra le stazioni preservando la privacy.

Infine, pianificare aggiornamenti iterativi. Per prima cosa, raccogliere i dati generati durante le operazioni live per il riaddestramento. Poi, affinare i parametri del modello e riaddestrare su dati specifici del sito. Inoltre, testare metodi avanzati per il rilevamento di oggetti piccoli e nuove funzioni di perdita per migliorare il rilevamento di oggetti estranei compatti. In aggiunta, integrare con le operazioni di stazione per suggerimenti di deviazione automatica basati sui conteggi dei passeggeri e sui modelli di scelta del percorso. Visionplatform.ai aiuta i gestori delle metropolitane a dispiegare sulle VMS esistenti, mantenere i modelli locali e trasmettere eventi utilizzabili così le piattaforme possono passare da telecamere passive a sensori attivi che riducono i tempi di attesa e supportano sistemi di trasporto pubblico più sicuri ed efficienti.

FAQ

Che cos’è il rilevamento di oggetti lasciati negli ambienti metropolitani?

Il rilevamento di oggetti lasciati utilizza telecamere e modelli per individuare elementi incustoditi su banchine e atrii. Combina tracciamento, classificazione e logica temporale per decidere quando un oggetto diventa incustodito e richiede attenzione.

In che modo l’AI migliora il rilevamento rispetto al monitoraggio umano?

L’AI funziona in continuo e mantiene sensibilità costante durante i turni, quindi individua eventi di breve durata che gli umani potrebbero non notare. Inoltre, l’AI si integra con gli strumenti operativi per ridurre i tempi di risposta e inviare avvisi strutturati.

Quali modelli funzionano meglio per avvisi in tempo reale nelle stazioni?

Modelli come YOLO e SSD offrono bassa latenza e buon throughput per il rilevamento in tempo reale. Per revisioni ad alta precisione, rivelatori a due stadi come Faster R-CNN possono essere usati in parallelo su frame campionati.

Come gestiscono i sistemi la privacy e la conformità?

Il dispiegamento on-premise e l’anonimizzazione dei volti nei dati di addestramento proteggono la privacy e aiutano a soddisfare i requisiti dell’AI Act dell’UE. Inoltre, mantenere il video localmente e trasmettere solo eventi riduce i rischi di esposizione dei dati.

Il sistema può contare i passeggeri e aiutare con il controllo delle folle?

Sì. I sistemi possono contare il numero di passeggeri e produrre conteggi dei passeggeri da video per alimentare strumenti di gestione della folla. Questi dati aiutano a stimare i tempi di attesa e informano decisioni su instradamento o aperture di banchina.

Che ruolo gioca la fusione di sensori?

La fusione di sensori combina video con radar o dati di tracciamento dei treni per confermare la presenza di un oggetto estraneo anche in condizioni di scarsa visibilità. La fusione migliora la robustezza, specialmente in scene affollate o occluse.

Come riducono gli operatori i falsi positivi?

I team regolano le soglie, usano regole di persistenza temporale e coinvolgono cicli di feedback degli operatori per riaddestrare i modelli. Inoltre, combinare classificatori appresi con filtri basati su regole riduce gli avvisi molesti.

Quali metriche dovrebbero monitorare i responsabili della metropolitana?

Monitorare precisione, richiamo, latenza e risparmio di lavoro per comprendere l’efficacia. Monitorare anche il tempo di risposta agli incidenti e i cambiamenti nei tempi di viaggio o di attesa come esiti operativi.

Ci sono esempi di città che testano questi sistemi?

Città e studi fanno riferimento a trial nella metropolitana di Beijing e a case study in altre grandi reti. La ricerca sul TRL degli oggetti incustoditi e i risultati dei pilot forniscono indicazioni per roll-out graduali (fonte).

Come può Visionplatform.ai aiutare a dispiegare un sistema di rilevamento?

Visionplatform.ai converte le CCTV esistenti in una rete di sensori operativa ed esegue modelli on-premise o all’edge. Inoltre, si integra con i VMS e trasmette eventi così le stazioni possono agire sulle rilevazioni immediatamente mantenendo dati e modelli sotto il controllo dell’operatore.

next step? plan a
free consultation


Customer portal