Jak wykrywanie obiektów zdefiniowane przez użytkownika zmieni zasady gry w monitoringu wizyjnym

Complying with the CRA and NIS2 in your CCTV system

Pread Um (Suk Bong), Dyrektor ds. produktów i marketingu spółki Hanwha Vision Europe

Kilka lat temu trudno było sobie wyobrazić, jak bardzo rozpowszechniona stanie się sztuczna inteligencja w naszym życiu. Myśleliśmy, że AI to materiał na powieści science fiction. Obecnie ogromna zmiana w dostępności i łatwości konfiguracji sztucznej inteligencji umożliwiła osobom z niewielką lub żadną wiedzą programistyczną korzystanie ze sztucznej inteligencji w wielu różnych dziedzinach. Ponieważ sztuczna inteligencja staje się coraz łatwiejsza do skonfigurowania nawet dla laików, nic dziwnego, że oczekuje się, iż 1,3 miliona spółek w Wielkiej Brytanii wprowadzi tę technologię do 2040 roku.

Monitoring wizyjny nie jest wyjątkiem, ponieważ wstępnie wytrenowane kamery AI pozwalają operatorom uzyskać lepszy wgląd i kontekst nagrań z kamer. Hanwha Vision poszła teraz o krok dalej, oferując wykrywanie obiektów zdefiniowanych przez użytkownika w niektórych swoich kamerach, umożliwiając zespołom bezpieczeństwa łatwe trenowanie algorytmów za pomocą kilku kliknięć i wgrania obrazów.

Dostosowanie sztucznej inteligencji do różnych potrzeb

To zmiana zasad gry dla zespołów bezpieczeństwa. Ułatwia dostosowanie wykrywania obiektów za pomocą sztucznej inteligencji do konkretnych potrzeb. Podczas gdy większość kamer wideo AI może wykrywać typowe obiekty, takie jak osoby, twarze i pojazdy, nowe rozwiązania AI „wytrenowane przez użytkownika” pozwalają operatorom wytrenować kamery w celu wykrywania obiektów zdefiniowanych przez użytkownika, w tym potencjalnych zagrożeń, takich jak pudła i znaki na podłodze sklepu lub pachołki na drodze.

Nie oznacza to jednak, że takie funkcje uczenia maszynowego można po prostu wprowadzić do swojej organizacji i oczekiwać, że będą działać natychmiast – lub że będą całkowicie dokładne. Twój zespół nadal będzie musiał trenować modele rozpoznawania z najlepszymi dostępnymi obrazami zawierającymi wybrany obiekt i z wystarczającą ilością danych, aby osiągnąć najlepsze wyniki. Pole widzenia kamery i tło muszą być również wystarczająco wyraźne, aby algorytm mógł odróżnić tło od obiektu.

Trzeba wiedzieć, na jakich obiektach trenować

Nowe możliwości kamer, takie jak rozwiązanie WiseDetector spółki Hanwha Vision, oferują elastyczność wykrywania obiektów w oparciu o wymagania projektu i sytuacji. Nie oznacza to jednak, że należy wybierać szeroką gamę obiektów, na których można trenować modele. Zamiast tego należy skupić się na dobrym opracowaniu jednego lub dwóch obiektów, by algorytmy uczenia maszynowego mogły uzyskać dobre wyniki z wielu migawek tych obiektów. Należy ustalić priorytety, które obiekty Twoja organizacja musi wykrywać najczęściej. Na przykład w ograniczonej przestrzeni korzystne może być udoskonalenie kontroli dostępu poprzez wytrenowanie systemu w zakresie wykrywania otwartych i zamkniętych drzwi.

Wykrywanie obiektów zdefiniowanych przez użytkownika ma oczywiście zastosowanie w niemal każdej branży, w tym w handlu detalicznym, sieciach fast food, bankach, transporcie, muzeach, fabrykach i szpitalach. Może wykrywać logo pojazdów wjeżdżających i wyjeżdżających z obiektu, określone pudła i logo w magazynie lub pachołki stanowiące potencjalną przeszkodę na drodze.

Łatwe w użyciu

Rozwiązania takie jak WiseDetector wykorzystują prosty interfejs (w tym przypadku Device Manager), który ułatwia użytkownikom przechwytywanie obrazów zawierających obiekt, który ma zostać wykryty, a następnie oznaczenie obiektu, na podstawie którego model uczenia maszynowego może się uczyć. Dla wytrenowania modelu uczenia maszynowego, użytkownicy muszą zebrać obrazy obiektu docelowego, aby mógł je rozpoznać. Im więcej, tym lepiej, a także należy wziąć pod uwagę jakość wgrywanych obrazów. Powinny one być jak najbardziej wyraźne i idealnie pokazywać obiekt pod różnymi kątami, aby model uczenia maszynowego mógł faktycznie „zrozumieć”, czego ma szukać. Można także ponownie przetrenować system i udoskonalić jego możliwości, aby uzyskać jeszcze lepsze wyniki.

Jedno z wielu osiągnięć

Wytrenowane przez użytkownika funkcje uczenia maszynowego to tylko jedno z wielu osiągnięć, które pojawiają się obecnie w dziedzinie systemu kamer. Uczenie maszynowe i sztuczna inteligencja coraz częściej pojawiają się w systemach monitoringu wizyjnego, co jest pozytywną zmianą ze względu na wiele korzyści, jakie przynoszą dla bezpieczeństwa i szerszej działalności. Obejmują one możliwość łatwego i szybkiego skanowania materiału wideo w celu identyfikacji obiektów i osób będących przedmiotem zainteresowania, a także wykrywania możliwych zachowań antyspołecznych lub przestępczych. Oprócz funkcji wytrenowanych przez użytkownika, należy oczekiwać pojawienie się na rynku większej ilości rozwiązań Edge AI – w których analiza odbywa się lokalnie na urządzeniu – oraz algorytmów głębokiego uczenia. Algorytmy głębokiego uczenia zmniejszają liczbę fałszywych alarmów poprzez dokładne wykrywanie wstępnie zdefiniowanych obiektów, takich jak osoby i pojazdy, jednocześnie ignorując nieistotny ruch, w tym drzewa na wietrze, cienie lub zwierzęta.

Nadszedł czas, aby się zaangażować

Wykorzystanie sztucznej inteligencji do zwiększenia bezpieczeństwa jest niewątpliwie ekscytujące. Może to obejmować wytrenowanie algorytmu uczenia maszynowego w celu wykrywania obiektów lub zainstalowanie urządzeń Edge AI z preinstalowanymi algorytmami. Obecny rozwój to tylko niewielki segment tego, co uczenie maszynowe i sztuczna inteligencja mogą wnieść do branży monitoringu wizyjnego. Ponieważ branża przechodzi szybką transformację, kto wie, co przyniesie następna dekada.