“Таємні маршрути”, які можуть фольгувати системами розпізнавання пішоходів


Нова дослідницька співпраця між Ізраїлем та Японією стверджує, що системи виявлення пішоходів мають притаманні слабкі сторони, що дозволяє добре обізнаним особам ухилятися від систем розпізнавання обличчя, навігаючи ретельно спланованими маршрутами по областях, де мережі спостереження є найменш ефективними.

За допомогою загальнодоступні кадри З Токіо, Нью -Йорка та Сан -Франциско дослідники розробили автоматизований метод обчислення таких шляхів, заснований на найпопулярніших системах розпізнавання об'єктів, які, можливо, використовуються в державних мережах.

Три переходи, що використовуються в дослідженні: перетин Шибуя в Токіо, Японія; Бродвей, Нью -Йорк; і район Кастро, Сан -Франциско. Джерело: https://arxiv.org/pdf/2501.15653

Три переходи, що використовуються в дослідженні: перетин Шибуя в Токіо, Японія; Бродвей, Нью -Йорк; і район Кастро, Сан -Франциско. Джерело: https://arxiv.org/pdf/2501.15653

За допомогою цього методу можна створити Впевненість теплові карти Це розмежування ділянок у кормовому корпусі, де пішоходи, найменше, забезпечать позитивний удар розпізнавання обличчя:

Праворуч ми бачимо, що теплова карта довіри, що утворюється методом дослідників. Червоні області вказують на низьку впевненість та конфігурацію позиції, позу камери та інший фактор, які, ймовірно, перешкоджають розпізнаванням обличчя.

Праворуч ми бачимо, що теплова карта довіри, що утворюється методом дослідників. Червоні області вказують на низьку впевненість та конфігурацію позиції, позу камери та інший фактор, які, ймовірно, перешкоджають розпізнаванням обличчя.

Теоретично такий метод може бути інструменталізований у програмі, що усвідомлює місце, або якусь іншу платформу для розповсюдження найменш «зручних для розпізнавання» шляхів від А до В у будь-якому обчисленому місці.

Новий документ пропонує таку методологію під назвою Техніка підвищення конфіденційності на основі місця розташування (L-PET); Він також пропонує контрзаходження під назвою Адаптивний поріг на основі розташування (L-Bat), який по суті проводить абсолютно однакові процедури, але потім використовує інформацію для посилення та вдосконалення заходів спостереження, а не розробити способи уникнути визнання; І в багатьох випадках такі поліпшення не були б можливими без подальших інвестицій в інфраструктуру спостереження.

Таким чином, стаття створює потенційну технологічну війну ескалації між тими, хто прагне оптимізувати свої маршрути, щоб уникнути виявлення та здатності систем спостереження за повним використанням технологій розпізнавання обличчя.

Попередні методи виявлення фольгування менш елегантні, ніж це, і в центрі уваги змагальні підходинаприклад Атака ТНТі використання Друковані візерунки плутати алгоритм виявлення.

Робота 2019 року «Обдурює автоматизовані камери спостереження: змагальні патчі для нападу на виявлення людини» продемонстрували змагальний друкований візерунок, здатний переконати систему розпізнавання, що жодна людина не виявлена, що дозволяє певну «невидимість. Джерело: https://arxiv.org/pdf/1904.08653

Робота 2019 року «Обдурює автоматизовані камери спостереження: змагальні патчі для нападу на виявлення людини» продемонстрували змагальний друкований візерунок, здатний переконати систему розпізнавання, що жодна людина не виявлена, що дозволяє певну «невидимість. Джерело: https://arxiv.org/pdf/1904.08653

Дослідники, що стоять за новим папером, зауважують, що їх підхід вимагає меншої підготовки, без необхідності розробляти змагальні носячі предмети (див. Зображення вище).

З паперовий має назву Техніка підвищення конфіденційності для ухилення від виявлення вуличних відеокамер без використання змагальних аксесуаріві походить від п'яти дослідників у університеті Бен-Гуріона в Негеві та Фуджіцу Ліміт.

Метод і тести

Відповідно до попередніх творів, таких як Змагальна маска, Адхат, змагальні патчіта різні інші подібні виїзди, дослідники припускають, що пішохідний “зловмисник” знає, яка система виявлення об'єктів використовується в мережі спостереження. Це насправді не є нерозумним припущенням, через широке прийняття найсучасніших систем з відкритим кодом, таких як Yolo в системах спостереження за подібними Cisco і Ультралітика (в даний час центральна рушійна сила в розвитку Йоло).

Документ також передбачає, що пішохід має доступ до прямого потоку в Інтернеті, закріпленому на місцях, що підлягають обчисленню, що, знову ж таки, є Розумне припущення У більшості місць, які можуть мати інтенсивність покриття.

Такі, як 511ny.org, пропонують доступ до багатьох камер спостереження в районі Нью -Йорка. Джерело: https: //511ny.or

Сайти, такі як 511ny.org, пропонують доступ до багатьох камер спостереження в районі Нью -Йорка. Джерело: https: //511ny.or

Окрім цього, пішохід потребує доступу до запропонованого методу та самої сцени (тобто переправи та маршрути, в яких слід встановити «безпечний» маршрут).

Для розробки L-PET автори оцінювали вплив кута пішоходів по відношенню до камери; ефект висоти камери; ефект відстані; і ефект часу доби. Для отримання наземної правди вони сфотографували людину під кутами 0 °, 45 °, 90 °, 135 °, 180 °, 225 °, 270 ° та 315 °.

Основні спостереження за правди, проведені дослідниками.

Основні спостереження за правди, проведені дослідниками.

Вони повторювали ці варіації на трьох різних висотах камери (0,6 м, 1,8 м, 2,4 м) та з різними умовами освітлення (умови ранку, вдень, ніч та «лабораторія»).

Годуючи ці кадри до Швидше r-cnn і Yolov3 Об'єктні детектори, вони виявили, що впевненість об'єкта залежить від гострої кута пішохода, відстані пішохода, висоти камери та умов погоди/освітлення*.

Потім автори перевірили більш широкий спектр детекторів об'єктів в тому ж сценарії: швидший R-CNN; Yolov3; SSD; Трансляція; і Rtmdet.

Автори констатують:

«Ми виявили, що всі п’ять архітектури детектора об'єктів впливають на положення пішоходів та навколишнє середовище. Крім того, ми виявили, що для трьох з п’яти моделей (Yolov3, SSD та RTMDET) ефект зберігається через усі рівні навколишнього світла ».

Щоб розширити сферу застосування, дослідники використовували кадри, зроблені з загальнодоступних камер дорожнього руху в трьох місцях: переправа Шибуя в Токіо, Бродвей у Нью -Йорку та район Кастро в Сан -Франциско.

Кожне місце розташування, розміщене від п'яти до шести записів, приблизно чотири години кадрів на запис. Для аналізу продуктивності виявлення один кадр витягували кожні дві секунди та обробляли за допомогою більш швидкого детектора об'єктів R-CNN. Для кожного пікселя в отриманих кадрах метод оцінював середню впевненість у цьому пікселі, що присутня “особистості” виявлення.

“Ми виявили, що у всіх трьох місцях впевненість детектора об'єкта змінювалася залежно від місця розташування людей у ​​кадрі. Наприклад, у кадрах переходу Шибуї є великі площі з низькою впевненістю далі від камери, а також ближче до камери, де полюс частково затьмарює проходження пішоходів.

Метод L-PET, по суті, є цією процедурою, напевно, «озброєною», щоб отримати шлях через міську область, яка, як мінімум, призведе до успішного визнання пішоходів.

Навпаки, L-BAT дотримується тієї ж процедури, з різницею, що вона оновлює бали в системі виявлення, створюючи цикл зворотного зв'язку, призначене для усунення підходу L-PET та зробить «сліпі області» системи більш ефективним.

(На практиці, однак, вдосконалення покриття на основі отриманих теплових карти потребує більше, ніж просто оновлення камери, що сидить у очікуваному положенні; на основі критеріїв тестування, включаючи місце розташування, це вимагатиме встановлення додаткових камер для покриття занедбаних Області-Тому можна стверджувати, що метод L-PET посилює цю конкретну «холодну війну» у дуже дорогій сценарії)

Середня довіра до виявлення пішоходів для кожного пікселя, через різноманітні рамки детектора, у спостережуваній області вулиці Кастро, проаналізована на п’яти відео. Кожне відео було записано в різних умовах освітлення: схід сонця, денний час, захід сонця та дві чіткі налаштування нічного часу. Результати представлені окремо для кожного сценарію освітлення.

Середня довіра до виявлення пішоходів для кожного пікселя, через різноманітні рамки детектора, у спостережуваній області вулиці Кастро, проаналізована на п’яти відео. Кожне відео було записано в різних умовах освітлення: схід сонця, денний час, захід сонця та дві чіткі налаштування нічного часу. Результати представлені окремо для кожного сценарію освітлення.

Перетворивши представлення матриці на основі пікселів у Представлення графіків Підходить для завдання, дослідники адаптували Алгоритм Дейкстри Для обчислення оптимальних шляхів для пішоходів для орієнтації по ділянках із зменшенням виявлення спостереження.

Замість того, щоб знайти найкоротший шлях, алгоритм був модифікований, щоб мінімізувати довіру виявлення, розглядаючи області з високою впевненістю як області з більшою «вартістю». Ця адаптація дозволила алгоритму визначити маршрути, що проходять через сліпі плями або зони з низьким рівнем виявлення, ефективно керуючи пішоходами по стежках зі зниженою видимістю до систем спостереження.

Візуалізація, що зображує перетворення теплової карти сцени з матриці на основі пікселів у представлення на основі графіків.

Візуалізація, що зображує перетворення теплової карти сцени з матриці на основі пікселів у представлення на основі графіків.

Дослідники оцінювали вплив системи L-BAT на виявлення пішоходів із набором даних, побудованим із вищезгаданих чотиригодинних записів публічного пішохідного трафіку. Для заповнення колекції один кадр обробляли кожні дві секунди за допомогою детектора об'єкта SSD.

З кожного кадру було обрано по одному обмежувальному поля, що містить виявлену людину як позитивну вибірку, а в якості негативного зразка використовувалася інша випадкова область, що не виявлена. Ці зразки-близнюки утворили набір даних для оцінки двох більш швидких моделей R-CNN-один із застосованою L-Bat, і один без.

Продуктивність моделей оцінювалася, перевіряючи, наскільки точно вони ідентифікували позитивні та негативні зразки: обмежувальна скринька, що перекриває позитивний зразок, вважалася справжньою позитивною, тоді як обмежувальна скринька, що перекриває негативний зразок, була позначена помилковим позитивом.

Показники, що використовуються для визначення надійності виявлення L-Bat, були Область під кривою (AUC); Справжня позитивна швидкість (TPR); помилкову позитивну ставку (FPR); і середня справжня позитивна впевненість. Дослідники стверджують, що використання L-BAT посилює впевненість виявлення, зберігаючи високу справжню позитивну швидкість (хоча і з незначним збільшенням помилкових позитивних результатів).

На завершення автори відзначають, що підхід має деякі обмеження. Одне полягає в тому, що теплові карти, що утворюються за їх методом, специфічні для певного часу доби. Хоча вони не пояснюють це, це свідчить про те, що для обліку на час доби знадобиться більший багаторівневий підхід.

Вони також зауважують, що теплові карти не перенесуться в різні архітектури моделі та пов'язані з певною моделлю детектора об'єктів. Оскільки запропонована робота по суті є підтвердженням концепції, для виправлення цього технічного боргу також можуть бути розроблені більш прихильні архітектури.

Висновок

Будь-який новий метод атаки, для якого рішення “оплачується за нові камери спостереження”, має певну перевагу, оскільки може бути розширення мереж громадянських камер у високопосудованих районах політично складноа також представляти помітні громадянські витрати, які зазвичай потребують мандату виборців.

Мабуть, найбільше питання, яке ставить робота, – це “Чи використовують системи спостереження за закритим кодом, які використовують рамки SOTA з відкритим кодом, такі як Йоло?”. Це, звичайно, неможливо знати, оскільки виробники фірмових систем, що живлять стільки державних та громадських мереж камери (принаймні в США) стверджує, що розкриття такого використання може відкрити їх для нападу.

Тим не менш, міграція урядового ІТ та внутрішнього фірмового коду до глобального та відкритого коду дозволить запропонувати кожен, хто перевіряє суперечку авторів, (наприклад) Йоло, цілком може негайно потрапити на джекпот.

* Я, як правило, включаю супутні результати таблиці, коли вони надаються в документі, але в цьому випадку складність таблиць паперу робить їх непорушними до випадкового читача, і тому резюме є більш корисним.

Вперше опублікований у вівторок, 28 січня 2025 року



Джерело

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *