Hanwha-Vision-LOGO

Hanwha Vision SPS-A100M AI skaņas klasifikācija un skaņas virziena noteikšana

Hanwha-Vision-SPS-A100M-AI-skaņas-klasifikācijas-un-skaņas-virziena-noteikšanas-PRODUKTS

Ievads

Skaņa bieži vien ir neievērots, tomēr spēcīgs novērošanas rīks neredzamu draudu apstākļos. Lai gan tradicionālās videonovērošanas sistēmas ir koncentrējušās uz notiekošā vizuālu uztveršanu, mūsdienu drošības vide ir attīstījusies, lai atpazītu ne tikai skaņas notikumu veidus, bet arī to precīzus avotus. Paplašinoties sabiedriskās drošības un aktīvu aizsardzības robežām, audio analīzes tehnoloģijai ir potenciāls sniegt ieguldījumu ne tikai noziegumu novēršanā un ātrā reaģēšanā uz incidentiem.
Šajā kontekstā Hanwha Vision dziļās mācīšanās skaņas klasifikācijas tehnoloģija nodrošina inteliģentas funkcijas, kas precīzi atpazīst konkrētus audio notikumus, piemēram, iepriekš apmācītus kliedzienus un stikla plīšanu, izraisot tūlītējus brīdinājumus. Turklāt skaņas virziena noteikšanas tehnoloģija identificē audio avota atrašanās vietu, sniedzot izšķirošu informāciju ne tikai par to, "kas ir skaņa", bet arī par to, "kur skaņa radusies". Šīs divas tehnoloģijas darbojas sinerģiski, lai maksimāli palielinātu integrētās situācijas izpratnes iespējas, nosakot jaunu standartu nākamās paaudzes drošības sistēmām.
Šajā informatīvajā dokumentā ir padziļināti aplūkotas šīs tehnoloģijas, sniedzot praktiskus norādījumus optimālai ieviešanai un lietošanai dažādās vidēs.

Mākslīgā intelekta balstīta audio analīzes tehnoloģija

  1. Skaņas klasifikācija
    Hanwha Vision skaņas klasifikācijas tehnoloģija ir balstīta uz dziļās mācīšanās pamatmodeli: konvolucionālo neironu tīklu (CNN). Šī tehnoloģija sākas ar abstraktas skaņas informācijas pārveidošanu vizuālā formā, kas pazīstama kā spektrogramma1.
    Spektrogramma darbojas kā akustiska “pirkstu nospiedums”, skaidri parādot konkrētas skaņas unikālos modeļus. CNN izceļas ar to, ka automātiski apgūst un atpazīst smalkas akustiskās iezīmes un modeļus šajos spektrogrammas attēlos, kurus cilvēka ausij bieži vien ir grūti atšķirt. Šis process ļauj precīzi identificēt un klasificēt plašu skaņas notikumu klāstu, tostarp kliedzienus, stikla plīšanu, automašīnu signālus un riepu slīdēšanu.
    Kad skaņa ir noteikta un klasificēta, sistēma automātiski iegūst datus no audio straumes. Tā kā audio dati jau ir iepriekš apstrādāti un...ampvadīts, klasificētā skaņa pēc tam tiek ģenerēta kā audioklips file, komplektā ar metadatiem ērtai lejupielādei un atkārtotai izmantošanaiview.
    Šī tehnoloģija ir pieejama atsevišķos Hanwha Vision produktos.
  2. Skaņas virziena noteikšana
    Hanwha Vision skaņas virziena noteikšanas tehnoloģija atbalsta ātru reaģēšanu, identificējot un paziņojot lietotājiem noteikta audio notikuma virzienu. Tehnoloģija nosaka šo virzienu, izmērot ierašanās laika starpību.
    skaņas signāla TDoA (TDoA), kad tas sasniedz vairākus, fiziski atdalītus mikrofonus.
    TDoA algoritms darbojas, analizējot fāzes starpību laikā, kas nepieciešams, lai skaņa sasniegtu katru mikrofonu, tādējādi novērtējot faktisko attālumu līdz avotam. Šī informācija pēc tam tiek izmantota, lai aprēķinātu skaņas avota leņķi. Kā parādīts 1. attēlā, vairāku mikrofonu sistēma ar mikrofoniem (MIC1, MIC2, MIC3, MIC4), kas izvietoti aplī, var noteikt attāluma starpības (d1, d2, d3, d4) starp skaņas avotu un katru mikrofonu. TDoA algoritma pamatā ir ierašanās laika starpības aprēķināšana, pamatojoties uz šīm attāluma atšķirībām.

2.1. Skaņas klasifikācija Hanwha Vision skaņas klasifikācijas tehnoloģija ir balstīta uz dziļās mācīšanās pamatmodeli: konvolucionālo neironu tīklu (CNN). Šī tehnoloģija sākas ar abstraktas skaņas informācijas pārveidošanu vizuālā formā, kas pazīstama kā spektrogramma1. Spektrogramma darbojas kā akustisks "pirkstu nospiedums", skaidri parādot konkrētas skaņas unikālos modeļus. CNN izceļas ar to, ka automātiski apgūst un atpazīst smalkas akustiskās iezīmes un modeļus šajos spektrogrammas attēlos, kurus cilvēka ausij bieži vien ir grūti atšķirt. Šis process ļauj precīzi identificēt un klasificēt plašu skaņas notikumu klāstu, tostarp kliedzienus, stikla plīšanu, automašīnu signālus un riepu slīdēšanu. Kad skaņa ir noteikta un klasificēta, sistēma automātiski iegūst datus no audio straumes. Tā kā audio dati jau ir iepriekš apstrādāti un...ampvadīts, klasificētā skaņa pēc tam tiek ģenerēta kā audioklips file, komplektā ar metadatiem ērtai lejupielādei un atkārtotai izmantošanaiview. Šī tehnoloģija ir pieejama atsevišķos Hanwha Vision produktos. 2.2. Skaņas virziena noteikšana Hanwha Vision skaņas virziena noteikšanas tehnoloģija atbalsta ātru reaģēšanu, identificējot un paziņojot lietotājiem par noteikta audio notikuma virzienu. Tehnoloģija nosaka šo virzienu, mērot skaņas signāla ierašanās laika starpību (TDoA), kad tas sasniedz vairākus, fiziski atdalītus mikrofonus. TDoA algoritms darbojas, analizējot fāzes starpību laikā, kas nepieciešams, lai skaņa sasniegtu katru mikrofonu, tādējādi novērtējot faktisko attālumu līdz avotam. Šī informācija pēc tam tiek izmantota, lai aprēķinātu skaņas avota leņķi. Kā parādīts 1. attēlā, vairāku mikrofonu sistēma ar mikrofoniem (MIC1, MIC2, MIC3, MIC4), kas izvietoti aplī, var noteikt attāluma starpības (d1, d2, d3, d4) starp skaņas avotu un katru mikrofonu. TDoA algoritma pamatā ir ierašanās laika starpības aprēķināšana, pamatojoties uz šīm attāluma atšķirībām.2. attēlā vizuāli parādīta laika starpība (τij) skaņas signāla pienākšanā pie diviem mikrofoniem (brūnās un zilās viļņu formas). Precīzi izmērot šīs ierašanās laika atšķirības, sistēma var precīzi triangulēt skaņas avota virzienu. Hanwha-Vision-SPS-A100M-AI-skaņas-klasifikācija-un-skaņas-virziena-noteikšana (3)

Skaņas virziena noteikšanas process ir sadalīts četros galvenajos posmos:

  1. Signālu savākšana: Vienlaikus apkopojiet skaņas signālus, izmantojot vairākus mikrofonus.
  2. Signālu apstrāde: Analizējiet savāktos signālus, izmantojot specializētu algoritmu.
  3. Virziena novērtēšana: novērtējiet skaņas virzienu, pamatojoties uz apstrādāto signālu.
  4. Rezultāta izvade: parādīt galīgo noteikto virzienu kā gultņa leņķi.

Šī tehnoloģija ir pieejama Hanwha Vision produktos, kas atbalsta vairākus mikrofonus, piemēram, Audio Beacon (SPS-A100M) un noteiktās ar Wisenet 9 SoC aprīkotās kamerās.

Hanwha-Vision-SPS-A100M-AI-skaņas-klasifikācija-un-skaņas-virziena-noteikšana (4)

Uzstādīšana un vide: optimālas veiktspējas ceļvedis

Hanwha Vision mākslīgā intelekta audio risinājuma efektivitāte ir cieši saistīta ar tā uzstādīšanas vidi. Aktīvi apsverot tālāk minētos punktus, jūs varat maksimāli palielināt sistēmas potenciālu un nodrošināt stabilu veiktspēju.

Optimālas uzstādīšanas vietas izvēle
Lai nodrošinātu uzticamu skaņas klasifikācijas un virziena noteikšanas veiktspēju, ieteicams ievērot šādus nosacījumus:
Skaņas klasifikācija: Sistēma darbojas visuzticamāk, ja attālums starp produktu un skaņas avotu ir vismaz 2 m. Šis attālums ir balstīts uz skaņas avota augstumu. Ja attālums ir pārāk mazs (2 m robežās), pat šķietami klusa skaņa, piemēram, aplaudēšana, var kļūt pārāk skaļa, izraisot kļūdaini pozitīvus rezultātus. Griestu uzstādīšana iekštelpās ir ideāla skaņas klasifikācijas metode, jo tā samazina akustiskās atstarošanās un nodrošina vienmērīgu skaņas noteikšanu plašā teritorijā.

Hanwha-Vision-SPS-A100M-AI-skaņas-klasifikācija-un-skaņas-virziena-noteikšana (5)Skaņas virziena noteikšana: precīzai virziena noteikšanai ieteicamā minimālā telpa ir vismaz 6.0 m plata un 6.0 m gara. Tas samazina skaņas atstarojumu un atbalss ietekmi un nodrošina pietiekamu vietu signāla analīzei starp vairākiem mikrofoniem. Hanwha-Vision-SPS-A100M-AI-skaņas-klasifikācija-un-skaņas-virziena-noteikšana (6)

Pareiza attāluma un krišanas leņķa saglabāšana: Attālums un leņķis starp notikuma skaņas avotu un produktu ir kritiski svarīgi noteikšanas precizitātei. Ja notikuma skaņas krišanas leņķis ir pārāk liels (pārsniedz 20 ∘) vai attālums ir pārāk mazs, noteikšanas precizitāte var samazināties. Zemāk esošajā tabulā ir norādīti ieteicamie minimālie attālumi, pamatojoties uz produkta uzstādīšanas augstumu.

Produkta uzstādīšanas augstums Minimālais virziena noteikšanas attālums
2.3 m ≥ 2.2 m
2.5 m ≥ 2.7 m
2.7 m ≥ 3.3 m
2.9 m ≥ 3.8 m
3.1 m ≥ 4.4 m
3.3 m ≥ 4.9 m
3.5 m ≥ 5.5 m
3.8 m ≥ 6.3 m
4m ≥ 6.9 m
5m ≥ 9.6 m

Skaidra skaņas ceļa nodrošināšana: Fiziski šķēršļi, piemēram, sienas, stikls vai biezi aizkari starp skaņas avotu un produktu, var vājināt vai kropļot signālu. Lai sasniegtu maksimālu veiktspēju, nodrošiniet skaidru, tiešu skaņas ceļu.

Vides analīze efektīvai skaņas noteikšanai un klasificēšanai
Lai precīzi noteiktu un klasificētu skaņu, ņemiet vērā šādus akustiskos apstākļus un apkārtējās vides faktorus.

Skaņas veids dB slieksnis Paredzētais attālums
Kliedziens >70dB 2 m–20 m
Stikla plīšana, automašīnu signāli, riepu slīdēšana >80dB 2 m–16 m

Piemēram,ampPiemēram, kliedziena skaņu var precīzi klasificēt un virzīt, ja tās skaļums pārsniedz 70 dB. Notikuma skaņas skaļumam jābūt arī ievērojami skaļākam par apkārtējo fona troksni (ieteicams: vismaz par 30 dB skaļāks). Lai veiktu precīzu mērījumu un klasifikāciju, fona troksnim ideālā gadījumā nevajadzētu pārsniegt 60 dB, kas nodrošina skaidru atšķirību starp notikumu un apkārtējo troksni.
Tā kā apkārtējais troksnis var ietekmēt veiktspēju, ieteicams iepriekš analizēt sekojošo:

  • Āra vide: ņemiet vērā dabiskos trokšņus (vējš, lietus, pērkons) un mākslīgās skaņas (satiksme, triecieni, automašīnu raustīšanās). Neparedzamā vidē rūpīga analīze var palīdzēt izvēlēties optimālu uzstādīšanas vietu.
  • Iekštelpu vide: Skaņas atstarošanās un atbalss var būt ievērojama atkarībā no materiāliem (sienām, griestiem, grīdām) un telpas lieluma. Skaņas, kas ir līdzīgas mērķa notikumam, piemēram, balona sprāgšanai vai smagas kastes krišanai, var radīt atbalsi, kas izraisa viltus trauksmes. Uzstādot jāņem vērā iekštelpu akustiskās īpašības.

Skaņas klasifikācijas dB sliekšņu konfigurēšana
Lai optimizētu skaņas klasifikācijas funkciju, varat konfigurēt dB slieksni atbilstoši savai konkrētajai videi.

  • Trokšņainā vidē iestatiet augstāku slieksni, lai samazinātu viltus trauksmes signālus.
  • Klusā vidē, kur notikumi ir nemanāmi, iestatiet zemāku slieksni, lai nepalaistu garām svarīgus brīdinājumus.
  • Pēc vidējā fona trokšņa dB pārbaudes ieteicams iestatīt slieksni, kas ir vismaz par 55 dB augstāks par šo vidējo vērtību.

Hanwha-Vision-SPS-A100M-AI-skaņas-klasifikācija-un-skaņas-virziena-noteikšana (7)Kā parādīts 6. attēlā, dB slieksni var intuitīvi pielāgot, izmantojot slīdni vai skaitļu ievades lauku, tieši ietekmējot reāllaika noteikšanas jutību. Grafikā vizuāli tiek attēlotas skaņas dB izmaiņas laika gaitā (melnā līnija) un konfigurētais slieksnis (pelēkā līnija), tāpēc ir viegli redzēt, kad skaņas notikums (oranžā virsotne) pārsniedz slieksni.

Skaņas virziena kalibrēšana un sistēmas konfigurācija
Hanwha Vision produkti nodrošina notikumus kā audioklipus, kas ietver gan skaņas klasifikācijas, gan virziena noteikšanas rezultātus.

Hanwha-Vision-SPS-A100M-AI-skaņas-klasifikācija-un-skaņas-virziena-noteikšana (1)Kā parādīts 7. attēlā, skaņas klasifikācijas rezultāts tiek parādīts ar intuitīvu ikonu apakšā kopā ar skaņas virziena noteikšanas rezultātu. “Virziens (N+301.8∘)” nozīmē, ka skaņas avots atrodas 301.8∘ pulksteņrādītāja virzienā no ziemeļiem (N).
Pievienotā vērtība “Pārliecinātība (0.74)” norāda uz 74 % ticamības līmeni. Tas kopā ar skaņas spiediena līmeni (52 dB) palīdz lietotājiem precīzi novērtēt situāciju un ātri reaģēt.
Sistēmas skaņas virziena informācija laika gaitā vai uzstādīšanas dēļ var atšķirties no patiesā ziemeļu virziena. Tā kā precīza virziena informācija ir būtiska, ir svarīgi kalibrēt ziemeļu atskaites punktu pēc nepieciešamības. To var izdarīt, izmantojot vienu no trim metodēm:

  1. Uzstādiet produktu tā, lai tas būtu vērsts pret ziemeļiem, kā norāda kompass.
  2. Produkta izvēlnē dodieties uz [Sistēma] > [Informācija par produktu] > [Uzstrādes režīms] un ievadiet tieši leņķi, kas izmērīts pulksteņrādītāja virzienā no kompasa ziemeļiem līdz kameras atskaites punktam.
  3. Ērtākai un precīzākai sākotējai iestatīšanai izmantojiet Wisenet instalēšanas rīkā iekļauto kompasa funkciju.

 Padomi sarežģītām akustiskām vidēm

  • Sarežģītas akustiskās vides: vidē ar vairākām vienlaicīgām skaņām mākslīgā intelekta modelis var tās klasificēt kā vienu skaņu vai nepareizi klasificēt. Tā ir dabiska parādība; visaptveroša sistēmas sniegtās informācijas analīze palīdzēs nodrošināt precīzu situācijas izpratni.
    Vides analīze precīziem trauksmes signāliem: skaņas klasifikācijas modelis var ģenerēt trauksmes signālus skaņām, kas ir līdzīgas notikumu skaņām, bet neietilpst klasifikācijas kategorijās, piemēram, metāla priekšmetu berze, dzīvnieku saucieni, mūzikas instrumenti vai citi pēkšņi, spēcīgi trokšņi. Izpratne par šo modeļa raksturlielumu ļauj paredzēt un sagatavoties trauksmēm no šīm ārkārtas skaņām, efektīvi samazinot nevajadzīgu apjukumu.

Secinājums

Pārkāpjot vizuālās novērošanas ierobežojumus, Hanwha Vision mākslīgā intelekta audio risinājums rada patiesi visaptverošu agrīnās brīdināšanas sistēmu, kas inteliģenti analizē skaņu.
Šis informatīvais dokuments kalpo kā praktisks ceļvedis, kas dod jums iespēju ieviest un optimizēt tehnoloģiju jūsu konkrētajai videi — sākot no sākotnējās instalēšanas līdz precīzai noregulēšanai, lai nodrošinātu maksimālu veiktspēju.
Drošības izaicinājumiem attīstoties, Hanwha Vision joprojām ir apņēmies uzlabot savas audio analīzes iespējas, nodrošinot stabilāku, efektīvāku un proaktīvāku drošības pieredzi jebkurā situācijā.

Hanvas vīzija

  • 13488 Hanwha Vision pētniecības un attīstības centrs,
  • 6 Pangyo-ro 319-gil, Bundang-gu, Seongnam-si, Gyeonggi-do, Koreja www.HanwhaVision.com
  • Autortiesības © 2025 Hanwha Vision. Visas tiesības aizsargātas.

Dokumenti / Resursi

Hanwha Vision SPS-A100M AI skaņas klasifikācija un skaņas virziena noteikšana [pdfLietotāja rokasgrāmata
SPS-A100M AI skaņas klasifikācija un skaņas virziena noteikšana, SPS-A100M, AI skaņas klasifikācija un skaņas virziena noteikšana, Klasifikācija un skaņas virziena noteikšana, Skaņas virziena noteikšana, Virziena noteikšana, Noteikšana

Atsauces

Atstājiet komentāru

Jūsu e-pasta adrese netiks publicēta. Obligātie lauki ir atzīmēti *