Projekt YOLO: You Only Label Once
Im Rahmen eines Forschungsprojekts hat eine Studierendengruppe des Bachelorstudiengangs Web Business & Technology eine web-basierte Labeling-Software erstellt um die Aufbereitung von Trainingsdaten für künstlich neuronale Netze verwenden zu können.
Die Aufgabenstellung des Praxisprojektes
Im Rahmen der Forschungsprojekte „Digital Sign Post“ und „Digital Frame Lines“ der FH Kufstein Tirol werden Objekte in Bildern mittels künstlich neuronaler Netze gesucht und unterschiedlich klassifiziert. Künstlich neuronale Netze werden über Trainingsdaten trainiert, um ihre Klassifikationsfähigkeit zu erlangen z.B. Objekterkennung in Bildern. Wie gut ein Netzwerk funktioniert, hängt stark von der Güte der Trainingsdaten ab. Deshalb ist es unerlässlich eine verlässliche und effektive Labeling-Software zur Aufbereitung der Trainingsdaten zu haben.
Ziel des Projektes war es, eine web-basierte Labeling-Software zu erstellen, welche zur Aufbereitung von Trainingsdaten für künstlich neuronale Netze verwendet werden kann.
Im ersten Schritt wurde ein Vergleich von bestehender Labeling-Software auf Stärken und Schwächen durchgeführt. Dies zeigte, dass es viele Schwachstellen bestehender Software gibt, vor allem in der Usability und Effizienz der Bedienung.
Folgend erstellten die Studierenden eine Benutzerschnittstelle bzw. eine Software-Architektur für eine optimale Labeling-Software. Im weiteren Projektverlauf wurden die wesentlichen Bestandteile dieser Software umgesetzt. Letztlich wurden die wichtigsten Bedienungsabläufe in einer Benutzerdokumentation beschrieben.
YOLO – das Tool
Der Name „YOLO“ hat sich aus einem Scherz heraus entwickelt und basiert auf dem Spruch „You only live once“ und wurde zum Ausspruch „You only label once“ abgewandelt. Um genaue Trainingsdaten zu liefern, sollte man nur einmal den Aufwand des Labelings betreiben müssen und dabei von einer Software optimal und effektiv unterstützt werden.
Mit Hilfe dieses Tools kann man Objekte auf Bildern durch verschiedene geometrische Objekte hinzufügen. Wird ein Objekt im Bild annotiert, so erscheint eine Typauswahl und die dazu passenden Attribute. Beispielsweise wird das Objekt als Wanderschild definiert, so erscheinen die Attribute Zeilenanzahl, Richtung und Hilfszeile. Anschließend werden die Daten gespeichert und zum nächsten Bild wechseln. Das Tool ist hierbei so aufgebaut, dass es auch für weitere verschiedene Typen weiterentwickelt werden kann, um somit eine möglichst große Anzahl an Trainingsdaten für neuronale Netze zu liefern.
Endergebnis
Dank der guten Zusammenarbeit zwischen den Teil-Teams Backend, Frontend, Testing und Projektmanagement konnte eine Software entwickelt werden, die den Anforderungen entspricht, gut aussieht und eine Basis zur Weiterentwicklung liefert. Lehrveranstalter und Hochschullehrer für Web Business & Technology Stefan Huber, MA begleitete die Studierenden während des Projektes und war letztlich begeistert vom Ergebnis und dem Einsatz der Projektgruppe. Die Studierenden sind ebenso mit dem Ergebnis sehr zufrieden und konnten durch dieses Praxisprojekt viel lernen.