Convolutional Neural Networks (CNN) werden häufig für die Bildverarbeitung, speziell für die Detektion
von Objekten, eingesetzt. Ein an der HSLU entwickelter Low-Cost CNN Accelerator soll dabei helfen, diese
auf eingebettete Systeme mit wenig Rechenleistung zu bringen. Die Zielhardware besteht aus einer
Kombination aus Processing System (PS) und Programmierbarer Logik (PL).
Ein einfacher CNN Single-Shot-Detektor (SSD-7) wurde ausgewählt, trainiert und getestet. Er erreichte einen
mAP-Wert («Mean Average Precision») von 0.308. Nach der Umwandlung in eine binär approximierte Form
erreichte der Algorithmus nahezu gleich gute Resultate (0.303). Ein Abschätzung der
Ausführungsgeschwindigkeit dieses Netzwerks auf einer Mid-Range sowie einer Low-End Hardware ergab
Verarbeitungsraten von 99.23 beziehungsweise 6.54 Bilder pro Sekunde. Dies ist ausreichend für viele
Echtzeit-Anwendungen.
Convolutional Neural Networks (CNN) are widely used for image processing and especially object detection.
A Low-Cost CNN Accelerator developed at HSLU aims to bring these algorithms onto embedded systems
with limited computational power. The target hardware consists of a combination of processing system (PS)
and programmable logic (PL).
A lightweight CNN single-shot detector (SSD-7) was selected, trained and tested, achieving a mean average
precision (mAP) of 0.308. This network was converted to a binary approximated form and tested again,
achieving almost the same performance as the original (0.303). For this network, the maximum inference
speed for a mid-range as well as a low-end hardware was estimated. With inference speeds of 99.23,
respectively 6.54 inferences per second, this approach could be useful for many embedded systems which
require a low-cost, low-power object detector with real-time capabilities.