détection d’objets dans les réseaux de métro : défis et portée
Les objets laissés derrière dans des stations de métro très fréquentées posent des risques pour la sécurité et le service. Par exemple, un sac personnel laissé sur le quai peut gêner la circulation, retarder les trains et déclencher des évacuations. De plus, des sacs sans surveillance contiennent parfois des matières dangereuses, d’où l’importance d’une alerte rapide pour la sécurité des passagers. En outre, des quais bondés modifient les déplacements des personnes. Par conséquent, les exploitants doivent estimer le nombre d’objets abandonnés et réagir rapidement.
La surveillance manuelle repose sur des opérateurs humains qui regardent les caméras de vidéosurveillance et interviennent. Cependant, l’attention humaine faiblit et la fatigue liée aux postes réduit la vigilance. Par ailleurs, la revue manuelle ne peut pas s’adapter lorsque de grands flux de voyageurs envahissent un nœud pendant les heures de pointe. Par exemple, dans des systèmes de métro congestionnés, les équipes humaines peuvent manquer des événements brefs lors des pics de flux. Ainsi, la détection automatisée peut combler les lacunes de couverture et réduire le temps d’attente pour la réponse aux incidents.
La détection automatisée offre rapidité et couverture constante. Par exemple, elle peut signaler la présence d’un objet étranger, suivre le déplacement des objets et avertir les opérateurs en quelques secondes. De plus, les systèmes automatisés permettent aux gestionnaires du métro de compter le nombre de passagers à proximité d’un incident. Par conséquent, le personnel peut orienter les intervenants plus efficacement. De plus, les outils automatisés aident à la perception des tarifs et au contrôle des foules sur les quais en alimentant les tableaux de bord opérationnels avec des données d’événements.
Des chercheurs ont évalué le niveau de maturité technologique (TRL) des outils de détection d’objets abandonnés et mis en évidence les étapes allant du laboratoire au déploiement. La revue note « La détection automatique d’objets sans surveillance n’est pas seulement un impératif de sécurité mais aussi un levier essentiel pour l’avenir des systèmes de transport urbain intelligents » (source). Pour contexte, certaines équipes combinent vidéo et données de suivi des trains pour modéliser les incidents d’objets laissés en utilisant l’estimation du maximum de vraisemblance et pour estimer les paramètres du modèle en vue d’une planification de la réponse spécifique à chaque station (source). Par ailleurs, les exploitants qui souhaitent un déploiement pratique doivent tester sur des sources de données existantes et des configurations à source unique avant de passer à deux sources pour la redondance. En outre, Visionplatform.ai convertit les CCTV existantes en un réseau de capteurs en direct afin que les équipes puissent compter le nombre de passagers et créer des comptages à partir de la vidéo sans dépendance fournisseur.
techniques de détection d’objets par ia : apprentissage profond pour les objets abandonnés
Les réseaux neuronaux convolutifs profonds alimentent la détection d’objets moderne. D’abord, les DCNN apprennent des caractéristiques spatiales à partir des images puis classifient des régions en classes d’objets. Ensuite, les pipelines d’entraînement nécessitent des images annotées, des jeux de validation et l’ajustement des hyperparamètres. Par exemple, les équipes annotent des sacs, des valises et des postures humaines pour aider le modèle à distinguer un objet étranger d’un bagage habituel. De plus, l’augmentation de données étend les petits jeux de données en retournant, recadrant et modifiant la luminosité. En conséquence, le modèle apprend à gérer les variations d’éclairage et les différents angles de caméra.
Parmi les familles de modèles populaires figurent YOLO et SSD. De même, les détecteurs à deux étapes comme Faster R-CNN restent utiles pour les tâches à haute précision. Pour le déploiement, les ingénieurs équilibrent vitesse et précision. Par exemple, les variantes de YOLO sacrifient un peu de précision pour une latence très faible, ce qui convient aux besoins en temps réel du métro. En pratique, le TRL de nombreux algorithmes de détection d’objets s’est amélioré et certains sont prêts pour la production. La recherche sur les systèmes de détection et de suivi des personnes laissées montre que la fusion vision + radar peut accroître la fiabilité dans des scènes encombrées (source).
L’entraînement exige une attention aux paramètres du modèle. De plus, les équipes doivent éviter le surapprentissage à un seul agencement de station. Ainsi, la validation inter-stations est importante. Par ailleurs, l’apprentissage par transfert réduit le besoin de grands jeux annotés. Par exemple, des backbones pré-entraînés accélèrent la convergence et réduisent les besoins en calcul. En outre, les équipes ajustent les seuils et implémentent un algorithme de détection prenant en compte la persistance temporelle. Ainsi, le système réduit les faux positifs lorsqu’un objet tombé est seulement momentané. Enfin, les systèmes d’apprentissage profond montrent des gains mesurables : les DCNN basés sur la vision peuvent réduire la revue manuelle et améliorer les performances de détection par rapport aux méthodes classiques de traitement de caractéristiques (source). Visionplatform.ai prend en charge des stratégies de modèles flexibles afin que les exploitants puissent choisir, adapter ou construire un modèle proposé sur leurs propres données tout en conservant le traitement sur site ou à la périphérie pour la conformité et la rapidité.

AI vision within minutes?
With our no-code platform you can just focus on your data, we’ll do the rest
flux vidéo et collecte de données : mise en place d’une surveillance en temps réel
Le positionnement des caméras conditionne le succès de la détection. D’abord, installez les caméras pour couvrir les bords des quais, les escaliers et les halls avec des champs de vision qui se chevauchent. Ensuite, choisissez la résolution et la fréquence d’images en fonction des besoins de la tâche. Par exemple, un flux 1080p à 15–25 ips équilibre souvent le niveau de détail et la bande passante. De plus, certains sites utilisent des fréquences d’images plus élevées lorsque le mouvement des objets est rapide. En outre, les réglages de compression d’image doivent préserver les détails pour la détection de petits objets tout en gardant un stockage gérable.
La conception réseau doit éviter les goulots d’étranglement. Ainsi, les ingénieurs planifient VLAN, QoS et liaisons dédiées pour la vidéo en temps réel. De plus, le traitement en périphérie est utile. Par exemple, exécuter les modèles sur des appareils de type NVIDIA Jetson réduit la charge réseau et diminue la latence. Par ailleurs, Visionplatform.ai peut être déployé sur des serveurs GPU ou des appareils edge et diffuser des événements via MQTT afin que les systèmes d’exploitation reçoivent des événements structurés plutôt que de la vidéo brute.
Le travail d’annotation et de constitution de jeux de données est important. D’abord, les équipes définissent les classes et les règles d’annotation. Ensuite, les annotateurs marquent les boîtes englobantes, les états des objets et les étiquettes temporelles pour le statut d’abandon. Pour l’entraînement, les données collectées doivent inclure des variations d’éclairage, d’occlusion et de densité de foule. En outre, l’augmentation simule des conditions dégradées. La protection de la vie privée est une priorité. Par conséquent, appliquez un floutage ou une anonymisation des visages lors de la collecte et de l’analyse des données. De plus, conservez les données localement pour soutenir la conformité au RGPD et au règlement européen sur l’IA lorsque cela est nécessaire.
La conservation continue des flux vidéo soulève des questions de stockage et de cycle de vie. Par exemple, des politiques de conservation longue durée en haute résolution peuvent nécessiter plusieurs pétaoctets. Il convient donc de mettre en place des niveaux de rétention et des suppressions automatisées. Ensuite, intégrez le système au VMS afin qu’il réutilise les archives existantes pour le ré-entraînement des modèles. Enfin, combinez la vidéo avec d’autres types de données, comme les heures d’arrivée et de départ ou les données de suivi des trains, pour enrichir les étiquettes et estimer la probabilité que des passagers soient laissés lorsque les portes se ferment.
conception d’algorithme pour détecter les objets étrangers et les bagages abandonnés
La conception d’un algorithme de détection efficace commence par la modélisation de l’arrière-plan. D’abord, calculez un modèle d’arrière-plan dynamique et soustrayez-le pour trouver des objets potentiels au premier plan. Ensuite, appliquez des opérations morphologiques et des filtres de taille pour exclure les petits artefacts non pertinents. Par ailleurs, exécutez un modèle de reconnaissance d’objets sur les candidats pour classer sacs, valises ou objets tenus par des personnes. De plus, le suivi à travers les images établit la persistance. Par exemple, si un objet reste immobile pendant un temps d’attente configuré, le système le signale comme abandonné.
Le réglage des seuils influence les faux positifs. Par conséquent, calibrez les seuils par caméra et par type de zone. Par exemple, des seuils sur la persistance temporelle, la surface minimale et la proximité du bord du quai ajustent la sensibilité. De plus, Visionplatform.ai prend en charge la calibration locale afin que les équipes puissent ajuster sur site. Ensuite, des couches de détection d’anomalies peuvent repérer des mouvements d’objets inhabituels ou une apparition soudaine dans des zones restreintes. Par conséquent, la combinaison d’une logique basée sur des règles et de modèles appris réduit les alertes parasites.
Traiter l’occlusion et la détection de petits objets nécessite des stratégies multi-échelles. D’abord, appliquez des pyramides de caractéristiques dans le backbone neuronal pour conserver des indices à haute résolution. Ensuite, utilisez le contexte temporel afin qu’un sac partiellement occulté et présent sur plusieurs images déclenche toujours la détection. De plus, la fusion multi-caméras aide. Par exemple, des caméras aux vues chevauchantes fournissent des perspectives différentes pour résoudre les occlusions. Par ailleurs, la fusion avec un radar micro-ondes peut détecter le volume d’un objet même lorsque la vue caméra est bloquée, ce qui améliore la fiabilité dans des scènes encombrées (source).
Enfin, la réduction des faux positifs bénéficie du post-traitement et des retours des opérateurs. Par exemple, permettre aux opérateurs de confirmer les alertes ; puis réinjecter ces confirmations pour réentraîner le modèle. De même, effectuez des revues périodiques pour ajuster les paramètres du modèle et améliorer la précision des détections selon les agencements des stations. Ces étapes aident le système de détection à rester robuste à mesure que le flux de passagers et la configuration des quais évoluent.
AI vision within minutes?
With our no-code platform you can just focus on your data, we’ll do the rest
architecture du système de détection : intégration de la détection automatisée dans les métros
Les choix architecturaux déterminent la latence, le coût et la résilience. D’abord, les concepteurs doivent choisir entre edge et cloud. Le déploiement en edge réduit la latence et conserve les données localement, tandis que le cloud peut centraliser les mises à jour de modèles. Pour les opérations de métro, la faible latence est importante pour les alertes de sécurité. C’est pourquoi de nombreux exploitants exécutent l’inférence en périphérie. De plus, Visionplatform.ai permet le traitement sur site ou en edge avec des intégrations aux principales plateformes VMS afin que les exploitants gardent le contrôle et respectent les objectifs de conformité de l’UE.
La fusion de capteurs augmente la fiabilité. Par exemple, l’association des flux caméra avec un radar micro-ondes permet au système de détection de vérifier les objets même en faible luminosité. De plus, les données de suivi des trains et les heures d’arrivée et de départ aident à corréler les objets abandonnés avec la fermeture des portes et les comptages de passagers. Ensuite, intégrez les événements de détection automatisée dans la pile opérationnelle. Par exemple, diffusez des événements structurés via MQTT vers des tableaux de bord, la gestion des incidents et les systèmes SCADA afin que les équipes réagissent plus rapidement.
Les appareils en périphérie doivent répondre aux besoins de calcul et de réseau. Il faut donc prévoir des serveurs GPU ou des accélérateurs spécialisés en fonction de la densité des caméras. De plus, sécurisez les modèles sur l’appareil et appliquez la gestion des versions. En outre, mettez en place un stockage redondant et un basculement pour les sites critiques. Pour optimiser la bande passante, n’envoyez que les métadonnées d’événements aux serveurs centraux et conservez la vidéo complète dans les archives VMS locales si nécessaire. Ce schéma réduit le transfert continu des flux vidéo et facilite un déploiement évolutif sur l’ensemble d’un réseau métropolitain.
Les flux d’alerte doivent être simples et guidés. D’abord, le système de détection envoie des alertes graduées au personnel en service. Ensuite, les opérateurs reçoivent le contexte tel que l’ID de la caméra, la classe d’objet, des images horodatées et la réponse suggérée. Ensuite, intégrez avec les plannings de service et les arbres d’escalade afin que les alertes soient routées vers le bon intervenant. De plus, permettez aux opérateurs d’annoter les alertes pour les réinjecter dans l’entraînement du modèle. Enfin, formez les opérateurs à la gestion des faux positifs pour maintenir des performances de détection élevées. Pour des conseils pratiques sur les cas d’utilisation ferroviaire et les intégrations, voyez les pages de gestion de foule de plateforme et d’IA pour les gares comme gestion de foule sur les quais et détection des bagages abandonnés dans les gares.

évaluation des performances et évolutions futures pour le système de détection en métro
Définissez des métriques avant le déploiement pilote. D’abord, la précision et le rappel mesurent l’exactitude et la couverture. Ensuite, la latence capture la rapidité avec laquelle une alerte atteint un opérateur. Suivez également les économies de main-d’œuvre en comparant les heures de revue manuelle avant et après le déploiement. Par exemple, la surveillance DCNN basée sur la vision a réduit la charge de revue humaine jusqu’à 70 % dans des scénarios tests, tout en maintenant ou en améliorant les performances de détection (source).
Les pilotes sur le terrain fournissent des données pratiques. Par exemple, certains déploiements combinent des comptages caméra avec des données de suivi des trains et des modèles de flux de passagers pour estimer le nombre de passagers laissés derrière pendant les périodes de pointe. De plus, le modèle proposé peut utiliser l’estimation du maximum de vraisemblance pour calibrer la probabilité que des passagers soient laissés lorsqu’une porte se ferme. Pour plus d’informations sur la modélisation du risque de passagers laissés et l’estimation, voyez la recherche qui infère les passagers laissés dans des réseaux congestionnés (source). De plus, des systèmes dans des villes comme le métro de Pékin ont testé l’analyse de foule et la détection d’objets laissés pour ajuster les opérations.
Mesurez le ROI en tenant compte de l’évitement d’incidents, de la réduction des retards et de la diminution du personnel manuel. Incluez également l’amélioration de l’expérience passager lorsque le temps d’attente diminue et que la variabilité du temps de trajet baisse. En outre, les futures mises à niveau intégreront des capteurs plus riches. Par exemple, l’ajout de couches radar et de capteurs environnementaux augmente la résilience face aux occlusions et à l’obscurité (source). Ensuite, les équipes utiliseront l’apprentissage fédéré pour maintenir l’adaptabilité des modèles entre les stations tout en préservant la vie privée.
Enfin, planifiez des mises à niveau itératives. D’abord, collectez les données issues des opérations en direct pour le réentraînement. Ensuite, affinez les paramètres du modèle et réentraînez sur des types de données spécifiques au site. Testez également des méthodes avancées de détection de petits objets et de nouvelles fonctions de perte pour améliorer la détection d’objets étrangers compacts. De plus, intégrez avec les opérations de la station pour des suggestions de réacheminement automatisées basées sur les comptages de passagers et les schémas de choix d’itinéraire. Visionplatform.ai aide les gestionnaires de métro à déployer sur les VMS existants, à garder les modèles locaux et à diffuser des événements exploitables afin que les caméras passent d’un rôle passif à des capteurs actifs qui réduisent le temps d’attente et soutiennent des systèmes de transport public plus sûrs et plus efficaces.
FAQ
Qu’est-ce que la détection d’objets laissés dans les environnements de métro ?
La détection d’objets laissés utilise des caméras et des modèles pour repérer les objets sans surveillance sur les quais et les halls. Elle combine suivi, classification et logique temporelle pour décider quand un objet devient abandonné et nécessite une intervention.
Comment l’IA améliore-t-elle la détection par rapport à la surveillance humaine ?
L’IA fonctionne en continu et maintient une sensibilité constante sur les différents postes, elle détecte donc des événements de courte durée que les humains pourraient manquer. De plus, l’IA s’intègre aux outils opérationnels pour réduire le temps d’attente de la réponse et envoyer des alertes structurées.
Quels modèles fonctionnent le mieux pour les alertes en temps réel dans les stations ?
Des modèles comme YOLO et SSD offrent une faible latence et un bon débit pour la détection en temps réel. Pour une revue à haute précision, des détecteurs en deux étapes tels que Faster R-CNN peuvent être utilisés en parallèle sur des images échantillonnées.
Comment les systèmes gèrent-ils la confidentialité et la conformité ?
Le déploiement sur site et l’anonymisation des visages dans les données d’entraînement protègent la vie privée et aident à répondre aux exigences du règlement européen sur l’IA. De plus, conserver la vidéo localement et ne diffuser que des événements réduit les risques d’exposition des données.
Le système peut-il compter les passagers et aider au contrôle des foules ?
Oui. Les systèmes peuvent compter le nombre de passagers et produire des comptages à partir de la vidéo pour alimenter les outils de gestion de foule. Ces données aident à estimer le temps d’attente et informent les décisions de routage ou d’ouverture de quais.
Quel rôle joue la fusion de capteurs ?
La fusion de capteurs combine la vidéo avec le radar ou les données de suivi des trains pour confirmer la présence d’un objet étranger même en faible visibilité. La fusion améliore la robustesse, notamment dans des scènes encombrées ou occluses.
Comment les opérateurs réduisent-ils les faux positifs ?
Les équipes ajustent les seuils, utilisent des règles de persistance temporelle et impliquent des boucles de rétroaction des opérateurs pour réentraîner les modèles. De plus, la combinaison de classificateurs appris et de filtres basés sur des règles réduit les alertes intempestives.
Quelles métriques les responsables du métro doivent-ils suivre ?
Suivez la précision, le rappel, la latence et les économies de main-d’œuvre pour évaluer l’efficacité. Surveillez également le temps de réponse aux incidents et les variations du temps de trajet ou du temps d’attente comme indicateurs opérationnels.
Y a-t-il des exemples de villes testant ces systèmes ?
Des villes et des études font référence à des essais dans le métro de Pékin et à des études de cas dans d’autres grands réseaux. La recherche sur le TRL des objets sans surveillance et les résultats des pilotes fournit des orientations pour des déploiements par étapes (source).
Comment Visionplatform.ai peut-il aider à déployer un système de détection ?
Visionplatform.ai convertit les CCTV existantes en un réseau de capteurs opérationnel et exécute les modèles sur site ou en edge. De plus, il s’intègre aux VMS et diffuse des événements afin que les stations puissent agir immédiatement sur les détections tout en conservant les données et les modèles sous le contrôle de l’exploitant.