Nur was wahrgenommen wird, kann bei einer Unterscheidung helfen: Unser System verwendet Aussehen (Kamerabild), Flügelschlagfrequenzen (Leucht- und Fotodiode), die Tages- und Jahreszeit, die Temperatur und vielleicht auch noch mehr (Verweis Sensorseite, Insektenmonitoring). Aus diesen Eingabedaten wird von einem Computerprogramm eine Ausgabe berechnet: Welche Insektenart liegt hier am wahrscheinlichsten vor? Den wesentlichen Teil dieser Berechnung werden wir mit einem sogenannten künstlichen neuronalen Netz durchführen.
Ausgangspunkt ist ein sogenanntes Model: Eine komplizierte Berechnungsvorschrift für die Ausgabe aus den Eingabedaten. Diese Berechnungsvorschrift ist aber nicht vollständig festgelegt: Sie enthält sehr viele noch zu bestimmende Parameter, von deren Werten dann das Verhalten des Models, also die Berechnung, abhängt. In einem sogenannten überwachten Lernverfahren (supervised learning) werden diese Parameter solange immer wieder verändert, bis für eine möglichst große Menge von Beispielen (den Trainingsdaten) fast immer die richtige Art ausgegeben wird. Künstliche neuronale Netze sind spezielle Berechnungsmodelle, die sich sehr gut in diesem Sinne einlernen lassen.
Ursprünglich sind diese Berechnungsmodelle aus neurologischen Erkenntnissen über die Arbeitsweise des Gehirns von Lebewesen motiviert. Eingehende Informationen (Sinneswahrnehmungen bzw. Sensordaten) werden in mehreren Stufen verarbeitet. Hierbei entstehen aus rohen Daten immer bedeutungsvollere Merkmale bzw. Muster auf einer höheren Ebene, die dann eine Interpretation des Wahrgenommenen erlauben.
Die für eine automatisierte (richtige) Bestimmung der Art wichtigen Merkmale werden nicht vorab festgelegt, so wie das zum Beispiel in einem Bestimmungsbuch für Insekten erfolgt. Sowohl geeignete Merkmale, als auch Regeln, nach denen eine Bestimmung erfolgt, werden in einem gewissen Sinn von dem Modell aus den Trainingsdaten gelernt. Ein gutes KI-Modell hat dann nicht nur die Trainingsdaten auswendig gelernt, sondern kann auch für neue Datensätze / Eingaben richtige Vorhersagen machen.
Es gibt unzählige Möglichkeiten, für KI-Modelle, um unsere Aufgabe der Insektenbestimmung möglichst gut zu lösen. Wir arbeiten an einer. Arbeitest du mit? Arbeitest du an einer anderen? Hast du andere Ideen? Unsere ersten KI-Modelle findest du auf Gitlab.
Doch. Dieses steckt in den vielen Trainingsdaten. Für jeden vollständiger Datensatz eines Insekts, aufgenommen mit all unseren Sensoren, wird das Insekt an Hand des Kamerabildes von Expert:innen bestimmt.
Wenn viele von euch dazu beitragen, haben wir sehr viele Beispieldatensätze. An diesen lernt unser System die wichtigen Muster zur Unterscheidung möglichst vieler Insektenarten. Es werden also nur diejenigen Arten gut erkannt werden können, von denen wir über ausreichend viele Trainingsdaten verfügen. Entscheidend für unser System ist eine gute Datenqualität: Alle Trainingsdaten müssen sorgfältig erhoben werden.
Das ist eine Frage, die auch uns brennend interessiert, und deswegen werden wir auch untersuchen, warum unser KI-Modell sich denn für eine bestimme Art entschieden hat. Diese aktuelle Forschungsrichtung nennt sich „XAI“ (explainable artificial intelligence) oder auch Erklärbarkeit in der KI. Bei einer Insektenbestimmung ist das nicht ganz so wichtig, wie z.B. bei einer automatisierten medizinischen Diagnoseunterstützung.
Wenn viele von euch dazu beitragen, haben wir sehr viele Beispieldatensätze. An diesen lernt unser System die wichtigen Muster zur Unterscheidung möglichst vieler Insektenarten. Es werden also nur diejenigen Arten gut erkannt werden können, von denen wir über ausreichend viele Trainingsdaten verfügen. Entscheidend für unser System ist eine gute Datenqualität: Alle Trainingsdaten müssen sorgfältig erhoben werden.
Cookie | Dauer | Beschreibung |
---|---|---|
cookielawinfo-checbox-analytics | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics". |
cookielawinfo-checbox-functional | 11 months | The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional". |
cookielawinfo-checbox-others | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other. |
cookielawinfo-checkbox-necessary | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary". |
cookielawinfo-checkbox-performance | 11 months | This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance". |
viewed_cookie_policy | 11 months | The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data. |