Self-Organization of Spiking Neural Networks for Visual Object Recognition

On one hand, the visual system has the ability to differentiate between very similar objects. On the other hand, we can also recognize the same object in images that vary drastically, due to different viewing angle, distance, or illumination. The ability to recognize the same object under differe...

Full description

Saved in:
Bibliographic Details
Main Author: Michler, Frank
Contributors: Wachtler, Thomas (Prof. Dr.) (Thesis advisor)
Format: Doctoral Thesis
Language:English
Published: Philipps-Universität Marburg 2019
Subjects:
Online Access:PDF Full Text
Tags: Add Tag
No Tags, Be the first to tag this record!

Unser visuelles System hat zum einen die Fähigkeit, sehr ähnliche Objekte zu unter- scheiden. Zum anderen können wir dasselbe Objekt wiedererkennen, obwohl sich seine Abbildung auf der Netzhaut aufgrund des Blickwinkels, des Abstandes oder der Beleuchtung stark unterscheiden kann. Diese Fähigkeit, dasselbe Objekt in un- terschiedlichen Netzhaut-Bildern wiederzuerkennen, wird als invariante Objekterken- nung bezeichnet und ist noch nicht sofort nach der Geburt verfügbar. Sie wird erst durch Erfahrung mit unserer visuellen Umwelt erlernt. Häufig sehen wir verschiedene Ansichten desselben Objektes in einer zeitlichen Abfolge, zum Beispiel wenn es sich selbst bewegt oder wir es in unserer Hand be- wegen, während wir es betrachten. Dies erzeugt zeitliche Korrelationen zwischen aufeinander folgenden Netzhaut-Bildern, die dazu verwendet werden können, ver- schiedene Ansichten desselben Objektes miteinander zu assoziieren. Theoretiker ver- muten daher, dass eine synaptische Lernregel mit einer eingebauten Gedächtnisspur (englisch: trace rule) dazu verwendet werden kann, invariante Objektrepräsentatio- nen zu lernen. In dieser Dissertation stelle ich Modelle für impulskodierende neuronale Netze (englisch: spiking neural networks) zum Lernen invarianter Objektrepräsentationen vor, die auf folgenden Hypothesen beruhen: 1. Anstelle einer synaptischen trace rule kann persistente Spike-Aktivität von ver- netzten Neuronengruppen als eine Gedächtnis-Spur für Invarianz-Lernen die- nen. 2. Kurzreichweitige laterale Verbindungen ermöglichen das Lernen von selbst organisierenden topographischen Karten, welche neben räumlichen auch zeit- liche Korrelationen abbilden. 3. Wird ein solches Netzwerk mit Bildern von kontinuierlich rotierenden Objek- ten trainiert, so kann es Repräsentationen lernen, in denen Ansichten dessel- ben Objekts benachbart sind. Derartige Objekttopographien können invariante Objekterkennung ermöglichen. 4. Das Lernen von Repräsentationen sehr ähnlicher Muster kann durch anpas- sungsfähige inhibierende Feedback-Verbindungen ermöglicht werden. Die in Kapitel 3.1 vorgestellte Studie legt die Implementierung eines impulsko- dierenden neuronalen Netzes dar, an welchem die ersten drei Hypothesen überprüft wurden. Das Netzwerk wurde mit Stimulus-Sets getestet, in denen die Stimuli in zwei Merkmalsdimensionen so angeordnet waren, dass sich der Einfluss von zeitli- chen und räumlichen Korrelationen auf die gelernten topographischen Karten tren- nen ließ. Die entstandenen topographischen Karten wiesen Muster auf, welche von der zeitlichen Reihenfolge der beim Lernen präsentierten Objektansichten abhin- gen. Unsere Ergebnisse zeigen, dass durch die Zusammenfassung der neuronalen Aktivitäten aus einer lokalen Nachbarschaft der topographischen Karten invariante Objekterkennung ermöglicht wird. Das Kapitel 3.2 beschäftigt sich mit der vierten Hypothese. In dieser Publikation wurden die Untersuchungen dazu beschrieben, wie adaptive Feedback-Inhibition (AFI) die Fähigkeit eines Netzwerkes verbessern kann, zwischen sehr ähnlichen Mustern zu unterscheiden. Die Ergebnisse zeigen, dass mit AFI schneller stabile Muster-Repräsentationen gelernt wurden und dass Muster mit einem höheren Grad an Ähnlichkeit unterschieden werden konnten als ohne AFI. Die Ergebnisse von Kapitel 3.1 zeigen eine funktionale Rolle für topographische Objekt-Repräsentationen auf, welche aus dem inferotemporalen Kortex bekannt sind, und erklären, wie diese sich herausbilden können. Das AFI-Modell setzt einen Aspekt der Predictive Coding-Theorie um: die Subtraktion einer Vorhersage vom tatsächli- chen Input eines Systems. Die erfolgreiche Implementierung dieses Konzepts in ei- nem biologisch plausiblen Netzwerk impulskodierender Neuronen zeigt, dass das Predictive Coding-Prinzip in kortikalen Schaltkreisen eine Rolle spielen kann.