Künstliche Intelligenz

Künstliche Intelligenz für die Artbestimmung von Insekten

33.000 Insektenarten gibt es allein in Deutschland. Wir bei KInsecta wollen ein digitales Insektenmonitoring aufbauen und einige unserer heimischen Insektenarten automatisiert erkennen. Hierbei spielen Methoden der Künstliche Intelligenz (KI) eine zentrale Rolle. 

Auch wenn der Begriff der biologischen Art teilweise kontrovers diskutiert wird, hat sich das Artkonzept für eine Untersuchung bzw. das Monitoring von Biodiversität im Sinne der Artenvielfalt als sinnvoll und praktikabel erwiesen. Allerdings ist selbst für Insektenforscher eine Artbestimmung oft nicht einfach und setzt jahrelange Übung voraus. Die Bestimmung erfolgt meistens auf Grund äußerer Merkmale, von denen manche nur unter einem Mikroskop sichtbar sind. Dies macht ein Insekten-Monitoring im Allgemeinen sehr aufwändig.

Bildquelle: Ilona Schrimpf

Methoden der KI zur automatisierten Artenbestimmung nutzen

Messdaten: Mit einem Sensorsystem werden für jedes besuchende Insekt digitale Messdaten erhoben – in unserem Fall sind das Kamerabilder und opto-akustische Signale (Flügelschlag). Auch Metadaten wie Temperatur, Tages- und Jahreszeiten, etc. werden wir verwenden. So erhalten wir für dieses Insekt einen Datensatz, der ein digitales Bild (eventuell auch mehrere), ein digitales Audiosignal und weitere Metadaten enthält.

Maschinelles Lernen mit einem KI-Modell: Zunächst benötigen wir zu jeder Art, die wir später automatisiert bestimmen wollen, eine größere Anzahl solcher Messdaten. Für diese Datensätze ist uns jeweils die vorliegende Insektenart bereits bekannt. In einem ersten Schritt wird mit diesen Trainingsdaten ein KI-Modell eingelernt.  Ein KI-Modell ist eine komplexe Berechnungsvorschrift, welche bei Eingabe eines digitalen Datensatzes eine geschätzte Wahrscheinlichkeit für das Vorliegen einer der Arten ausgibt. Diese Berechnungsvorschrift ist zunächst nicht vollständig festgelegt und enthält viele freie Parameter. Einlernen bedeutet, dass diese Parameter sukzessive so angepasst werden, dass für möglichst viele Trainingsdaten die uns bereits bekannte richtige Art ausgegeben wird (überwachtes Lernen). Diesen Lernprozess führen wir mit einem Computerprogramm durch, welches wir auf der Basis vorhandener Softwarebibliotheken entwickeln. Der Lernprozess wird also von der Maschine – dem Computer – durchgeführt und deswegen als maschinelles Lernen bezeichnet. Neben einem guten KI-Modell sind vor allem die Anzahl und Qualität der Trainingsdaten entscheidend.

Die Sensormessdaten eines Insekts werden von einem künstlichen neuronalen Netz verarbeitet und zur Prognose der vorliegenden Art verwendet | Bildquelle: Martin Tschaikner

Anwendung des KI-Modells: Im zweiten Schritt wird das fertig eingelernte KI-Modell zur automatisierten Artbestimmung benutzt: Wenn ein Insekt unser Multisensorsystem passiert, dann wird aus den neuen Messdaten eine Prognose berechnet, zu welcher Art das Insekt gehört. Wenn lediglich die Trainingsdaten auswendig gelernt wurden, so führt eine Vorhersage der Art bei einem neuen Datensatz nur selten zum richtigen Ergebnis. Das kann z.B. passieren, wenn die Architektur des KI-Modells nicht gut an das Problem angepasst ist. Die Herausforderung besteht darin, ein KI-Modell zu implementieren, welches gut generalisiert, d.h. auch auf neuen Datensätzen fast dieselbe Erfolgsquote hat wie bei den Trainingsdaten.

Künstliche neuronale Netze (NN)

Die Bauart dieser Klasse von KI-Modellen ist motiviert von neurologischen Erkenntnissen über die Arbeitsweise des Gehirns. In einer vereinfachenden Vorstellung werden im Gehirn eingehende Informationen (Reize, Sinneswahrnehmungen) von elementaren vernetzten Einheiten, den Neuronen, verarbeitet. Die Vernetzung der Neuronen bestimmt, welche Reize wie stark an welche anderen Neuronen weitergeleitet werden. Die Vernetzungsstruktur des Gehirns wird dabei zumindest teilweise durch Erfahrungen verändert, also gelernt. In bestimmten Gehirnregionen entstehen durch diese vernetze Weiterleitung von Signalen Muster, die dann eine Interpretation des Wahrgenommenen erlauben. In einem künstlichen neuronalen Netz ist ein Neuron eine mathematische Funktion, die zu einem Eingabewert einen Ausgabewert festlegt. Die gewichtete Summe solcher Ausgabewerte von zahlreichen Neuronen ist dann wieder ein Eingabewert für andere Neuronen. Die Gewichtswerte sind die einzulernenden freien Parameter und bestimmen die Stärke der Vernetzung der Neuronen. Auf diese Weise entsteht eine komplexe Berechnungsvorschrift. Bei KInsecta untersuchen wir, welche NN für eine Artbestimmung besonders gut geeignet sind. Diese sollen dann für das digitale Insekten-Monitoring zum Einsatz kommen.

Vernetzte Struktur von Neuronenzellen in einem Gehirn | Bildquelle: Santiago Ramón y Cajal, Public domain, via Wikimedia Commons
Künstliches neuronales Netz aus miteinander verbundenen elementaren Berechnungseinheiten. | Bildquelle: Martin Tschaikner

Herausforderungen

Seit einigen Jahren gibt es eine ganze Reihe von etablierten KI-Modellen für die Bilderkennung. Prominente Beispiele sind tiefe NN für die Unterscheidung von über tausend häufigen Objektkategorien, z.B. Goldfisch, Banane, Orange,… . Eine Artbestimmung von Insekten auf Bildern bietet allerdings besondere Herausforderungen: Die Unterschiede (Varianz) zwischen Bildern von Insekten derselben Art sind oft größer als die zwischen Bildern unterschiedlicher Arten (kleine Interspezies-Varianz und große Intraspezies-Varianz, Fine Grained Visual Categoriziation (FGVC)-Problem). Darüber hinaus werden wir in den Trainingsdaten von selten vorkommenden Arten nur sehr wenige Datensätze haben (Long Tail Distribution).  Andererseits haben wir nicht nur Bilddaten zur Verfügung, sondern multimodale Daten, die wir geeignet zusammenfügen müssen in einem KI-Modell. Daher müssen wir problemangepasste KI-Modelle entwerfen.

Gerade arbeiten wir z.B. daran, eine sogenannte hierarchische Klassifikation durchführen, bei der ein Insekt im taxonomischen Baum nicht unbedingt bis zur Art bestimmt wird, sondern nur bis zur Gattung oder Ordnung. Es gibt viele offene Fragen: Ist es sinnvoll, Unternetzwerke für charakteristische Regionen wie Flügel, Hinterleib oder Kopf zu verwenden?  Wie gehen wir mit den stark unbalancierten Trainingsdaten um (Data Augmentation, Few Shot Learning)? Wie berücksichtigen wir Metadaten wie z.B. Temperatur, Tages- oder Jahreszeit zusammen mit Vorwissen über das Verhalten und Vorkommen einzelner Insektenarten?

NNe sollen anatomische Regionen des Insekts erkennen. | Bildquelle: Frank Haußer

Erklärbare KI

Ein mit Trainingsdaten eingelerntes Neuronales Netz ist zunächst eine Black Box: Es ist oft nicht ersichtlich, auf Grund welcher Muster/Merkmale in den Daten das NN eine Prognose trifft. Dies kann aber in weiteren Schritten analysiert werden, zum Beispiel mit sogenannten Heatmaps (Saliency maps): Hier werden Teile der Daten hervorgehoben, die für die Entscheidung besonders wichtig waren. So lässt sich untersuchen, ob eine (richtige) Entscheidung auch auf Grund plausibler Merkmale/Muster erfolgte. Dies erhöht unser Vertrauen in das Modell und ist im Allgemeinen auch ein Hinweis auf eine größere Robustheit des Modells. Auch damit wollen wir uns bei KInsecta beschäftigen (Forschungsrichtung „eXplainable Artificial Intelligence“ oder kurz XAI, Erklärbare KI).

Helle Bereiche in der Heatmap (mitte) waren für die automatisierte Artbestimmung entscheidend. | Bildquelle: Teodor Chiaburu

Grenzen und Chancen der KI-basierten Artbestimmung

Wir werden zunächst nur für einen kleinen Teil aller Insektenarten ein KI-Modell entwickeln und trainieren. Außerdem wird es immer Arten geben, die sich nur von Experten*innen z.B. durch Präparation (mit Mikroskop und Skalpell) oder über DNA-Analysen auseinanderhalten lassen. Hier liegen die Grenzen der Insektenbestimmung mit KI.

Andererseits kann unser KI-Modell zusätzlich zum äußeren Erscheinungsbild weitere Informationen wie das Flügelschlagmuster, die Tages- und Jahreszeit, Temperatur, Helligkeit etc. integrieren. Wir führen zur Artbestimmung Daten aus verschiedenen Quellen zusammen.

Wie du mitmachen kannst

Modellentwicklung: Es gibt viele Lösungsansätze für KI-Modelle zur Insektenbestimmung. Wir arbeiten an einer Lösung – möglicherweise hast du andere Ideen? Unsere ersten KI-Modelle findest du hier.

Trainingsdaten: Um ein gutes KI-Modell zu entwickeln, benötigen wir viele Trainingsdaten. An diesen lernt unser System die wichtigen Muster zur Unterscheidung möglichst vieler Insektenarten. Hilf uns, gute Trainingsdaten zu erstellen. Die erhobenen Trainingsdaten werden wir natürlich wieder öffentlich zugänglich machen, damit sie euch zur Modellentwicklung zur Verfügung stehen. Wie du konkret einsteigen kannst, erfährst du hier.

Wir freuen uns auf gemeinsames Forschen.
Interessierte können uns über info@kinsecta.org erreichen.

Unterschiedliche KI-Modelle wie SVMs (Supportvectormaschinen), Entscheidungsbäume oder CNNs (Convolutional Neural Networks) können zum Einsatz kommen | Bildquelle:
Martin Tschaikner
Menü