Analisis teknis & alur keinsinyuran
Dari akuisisi audio mentah, ekstraksi fitur mel, pelatihan jaringan saraf, hingga inferensi 9 milidetik di atas Arduino Nano 33 BLE Sense. Halaman ini membedah seluruh pipeline keinsinyuran dan MLOps, beserta hasil pelatihan yang sebenarnya.
01 · Arsitektur sistem
Seluruh keputusan terjadi langsung di mikrokontroler. Tidak ada server, tidak ada cloud, dan tidak ada ketergantungan jaringan pada jalur kritis: sinyal mikrofon menjadi keputusan prioritas dalam 9 milidetik di atas Arduino Nano 33 BLE Sense.
02 · Ekstraksi fitur
Sirine bukan suara manusia, jadi MFE dipilih karena unggul untuk audio non-voice. Setiap jendela 1 detik menghasilkan spektrogram mel 40 pita yang menonjolkan energi pada rentang frekuensi sirine. Pita fundamental yang kuat di sekitar 1,4 kHz beserta harmoniknya yang menyapu adalah sidik akustik yang dipelajari jaringan.
03 · Alur MLOps
Proyek ini menjalankan siklus MLOps penuh di atas Edge Impulse: akuisisi data berlabel, ekstraksi fitur, pelatihan, evaluasi, optimasi memori, hingga penyebaran dan inferensi tepi. Setiap evaluasi mengumpan balik ke akuisisi data untuk iterasi berikutnya.
04 · Pelatihan
Setelah split data diseimbangkan (1.124 latih / 282 validasi), akurasi validasi melewati 91% sekitar epoch ke-10 dan menetap di pertengahan 90-an, memuncak di 96,8%. Terlihat satu lonjakan sementara pada epoch ke-61 (akurasi validasi sempat turun ke ~73%) yang pulih dalam dua epoch — pola khas ketidakstabilan sesaat pada laju pembelajaran tetap. Data di bawah ini adalah log pelatihan yang sebenarnya.
05 · Evaluasi
Setelah split data diseimbangkan, kelas ambulans terdeteksi sempurna dan tidak pernah tertukar dengan polisi. Kekeliruan yang tersisa murni di perbatasan polisi dan derau, tempat sirine polisi yang jauh atau pelan paling mudah keliru sebagai derau.
06 · Kinerja & penyebaran
Setelah kuantisasi int8 dan EON Compiler, model muat dengan nyaman pada Arduino Nano 33 BLE Sense dan berjalan jauh di bawah anggaran waktu nyata.
Untuk menghidupkannya di web, impulse yang sama diekspor sebagai WebAssembly sehingga DSP dan jaringan berjalan utuh di dalam peramban — itulah yang menggerakkan demo di halaman utama.
07 · Data & reproducibility
Data sirine dikumpulkan dari rekaman publik di YouTube, lalu sebagian direkam ulang di tempat umum untuk meniru kondisi akustik nyata (pantulan, jarak, dan bising latar). Semua sampel diunggah, dilabeli, dan dilatih di Edge Impulse Studio, dan proyeknya terbuka untuk direplikasi.
Catatan: konvensi apakah sirine yelp polisi berbeda dari ambulans tidaklah baku, daerah di luar Magelang atau Jakarta bisa memakai pola berbeda. Yang penting, model dilatih pada konvensi data yang dikumpulkan di sini dan tetap mampu membedakan keduanya pada distribusi tersebut.