KI

Künstliche Intelligenz zur automatischen Artbestimmung von Insekten?

Nur was wahrgenommen wird, kann bei einer Unterscheidung helfen: Unser System verwendet Aussehen (Kamerabild), Flügelschlagfrequenzen (Leucht- und Fotodiode), die Tages- und Jahreszeit, die Temperatur und vielleicht auch noch mehr (Verweis Sensorseite, Insektenmonitoring). Aus diesen Eingabedaten wird von einem Computerprogramm eine Ausgabe berechnet: Welche Insektenart liegt hier am wahrscheinlichsten vor?  Den wesentlichen Teil dieser Berechnung werden wir mit einem sogenannten künstlichen neuronalen Netz durchführen.

Maschinelles Lernen und künstliche neuronale Netze

Ausgangspunkt ist ein sogenanntes Model: Eine komplizierte Berechnungsvorschrift für die Ausgabe aus den Eingabedaten. Diese Berechnungsvorschrift ist aber nicht vollständig festgelegt: Sie enthält sehr viele noch zu bestimmende Parameter, von deren Werten dann das Verhalten des Models, also die Berechnung, abhängt. In einem sogenannten überwachten Lernverfahren (supervised learning) werden diese Parameter solange immer wieder verändert, bis für eine möglichst große Menge von Beispielen (den Trainingsdaten) fast immer die richtige Art ausgegeben wird. Künstliche neuronale Netze sind spezielle Berechnungsmodelle, die sich sehr gut in diesem Sinne einlernen lassen.

Maschinelles Lernen und künstliche neuronale Netze

Ursprünglich sind diese Berechnungsmodelle aus neurologischen Erkenntnissen über die Arbeitsweise des Gehirns von Lebewesen motiviert. Eingehende Informationen (Sinneswahrnehmungen bzw. Sensordaten) werden in mehreren Stufen verarbeitet. Hierbei entstehen aus rohen Daten immer bedeutungsvollere Merkmale bzw. Muster auf einer höheren Ebene, die dann eine Interpretation des Wahrgenommenen erlauben.

Was ist daran „intelligent“?

Die für eine automatisierte (richtige) Bestimmung der Art wichtigen Merkmale werden nicht vorab festgelegt, so wie das zum Beispiel in einem Bestimmungsbuch für Insekten erfolgt.  Sowohl geeignete Merkmale, als auch Regeln, nach denen eine Bestimmung erfolgt, werden in einem gewissen Sinn von dem Modell aus den Trainingsdaten gelernt. Ein gutes KI-Modell hat dann nicht nur die Trainingsdaten auswendig gelernt, sondern kann auch für neue Datensätze / Eingaben richtige Vorhersagen machen.

Wozu brauchen wir dich?

Es gibt unzählige Möglichkeiten, für KI-Modelle, um unsere Aufgabe der Insektenbestimmung möglichst gut zu lösen. Wir arbeiten an einer. Arbeitest du mit? Arbeitest du an einer anderen? Hast du andere Ideen? Unsere ersten KI-Modelle findest du auf Gitlab.

Wird kein Expert:innenwissen benötigt?

Doch. Dieses steckt in den vielen Trainingsdaten. Für jeden vollständiger Datensatz eines Insekts, aufgenommen mit all unseren Sensoren, wird das Insekt an Hand des Kamerabildes von Expert:innen bestimmt.

Dazu brauchen wir dich

Wenn viele von euch dazu beitragen, haben wir sehr viele Beispieldatensätze. An diesen lernt unser System die wichtigen Muster zur Unterscheidung möglichst vieler Insektenarten. Es werden also nur diejenigen Arten gut erkannt werden können, von denen wir über ausreichend viele Trainingsdaten verfügen. Entscheidend für unser System ist eine gute Datenqualität: Alle Trainingsdaten müssen sorgfältig erhoben werden

Können wir einem solchen „Black Box System“ vertrauen, und wenn ja, warum?

Das ist eine Frage, die auch uns brennend interessiert, und deswegen werden wir auch untersuchen, warum unser KI-Modell sich denn für eine bestimme Art entschieden hat. Diese aktuelle Forschungsrichtung nennt sich „XAI“ (explainable artificial intelligence) oder auch Erklärbarkeit in der KI. Bei einer Insektenbestimmung ist das nicht ganz so wichtig, wie z.B. bei einer automatisierten medizinischen Diagnoseunterstützung. 

Grenzen und Chancen

Wenn viele von euch dazu beitragen, haben wir sehr viele Beispieldatensätze. An diesen lernt unser System die wichtigen Muster zur Unterscheidung möglichst vieler Insektenarten. Es werden also nur diejenigen Arten gut erkannt werden können, von denen wir über ausreichend viele Trainingsdaten verfügen. Entscheidend für unser System ist eine gute Datenqualität: Alle Trainingsdaten müssen sorgfältig erhoben werden

Menü