Inhalt Einleitung Problemstellung Experiment 1  Experiment 2   Experiment 3
Abschließende Diskussion Zusammenfassung Literaturverzeichnis Anhang


2.1 BESONDERHEITEN EINER DOPPELTEN ANPASSUNG
2.1.1 Regelungsanpassung
2.1.2 Modellierung der inversen Werkzeugtransformation
2.1.3 Redundanz in Hybridsystemen

2.2 HYPOTHESE KOMPLEMENTÄREN LERNENS
2.2.1 Bewegungsrückmeldung als spezifischer Anpassungsfaktor
2.2.2 Weitere Einflußmöglichkeiten
2.2.3 Begründung einer einseitigen Wirkungsbetrachtung
2.2.4 Vorhersagen zur Transferleistung

2.3 ASPEKTE DER OPERATIONALISIERUNG


Im vorangegangenen Kapitel wurden die Kontrollmechanismen Regelung und Steuerung insbesondere hinsichtlich ihrer funktionellen Ergänzung betrachtet. Nun führt, unabhängig von der speziellen Architektur gemischter Kontrollsysteme, die Kombination von Regelungs- und Steuerkomponenten wegen der Funktionsüberschneidungen beider Elemente fast unweigerlich zu einer Redundanz der Leistungsmerkmale des Gesamtsystems. Je nach den Bedingungen der Lernsitutation wird sich die Anpassung der beiden Elemente an die Aufgabenstellung unterschiedlich entwickeln. Das Wechselspiel zwischen der Aufgabenanpassung der Regelungs- und Steuerglieder und ihre Abhängigkeit von den Lernbedingungen sind die beiden zentralen Themen dieser Untersuchung. Sie sollen im folgenden Abschnitt diskutiert und in eine überprüfbare Fragestellung überführt werden.

 

2.1 Besonderheiten einer doppelten Anpassung

 

Beim Erlernen der Beherrschung eines Werkzeugs werden sowohl Regelung als auch Steuerung an die jeweilige Aufgabenstellung angepaßt. Entsprechend der schon dargelegten unterschiedlichen Funktionsweisen geschieht die Anpassung der beiden Teilsysteme auf ganz unterschiedliche Art. Dabei unterscheiden sich Regelungs- und Steuerungslernen nicht nur in den Lerninhalten, sondern insbesondere in der Kontextbezogenheit des Gelernten sowie den Randbedingungen und Voraussetzungen des Lernprozesses. Dennoch überschneiden sich die Leistungsmerkmale der beiden Teilsysteme, so daß nicht zu erwarten ist, daß die Anpassung unabhängig voneinander erfolgt.

 

2.1.1 Regelungsanpassung

Die Aufgabe, optimal auf externe Störgrößen zu reagieren, ist dadurch gekennzeichnet, daß eine Vielzahl von Randbedingungen gleichzeitig zu berücksichtigen sind (Modelle des Optimaltheoretischen Ansatzes, vgl.Donges, 1977). Hiervon sind einige externen Ursprungs und beruhen etwa auf den Eigenschaften der Vorlage (z.B. deren Frequenz) oder sind im Kontext der Aufgabenstellung, z.B. als maximal tolerierte Abweichung von der Vorlagenposition, vorgegeben. Hierbei muß man allerdings beachten, daß die extern vorgegebenen Kriterien nicht notwendigerweise den in der Aufgabe tatsächlich befolgten Kriterien entsprechen. So kann die subjektive Genauigkeitsanforderung der Bewegung von zusätzlichen (bspw. motivationalen) Faktoren abhängen, die nicht unmittelbar der Kontrolle des Experimentators unterworfen sind.

Die zweite Gruppe der Randbedingungen ergibt sich aus den Systemeigenschaften selbst, wie sie im letzten Abschnitt unter den Stichworten Stabilität und Erfahrbarkeit der Systemzustände bereits beschrieben wurden. Sie hängen mehr oder weniger stark von den extern vorgegebenen Bedingungen ab, so daß die Regelungsanpassung insgesamt ausgesprochen kontextsensitiv erfolgt. Je nach dem, ob mit vorhersagbaren oder nicht vorhersagbaren Vorlagenfolgen gelernt wird, wieviel Zeit zur Bewegungsausführung bleibt oder welche Fehler noch toleriert werden, wird das optimal angepaßte Regelungsverhalten ganz unterschiedlich aussehen.

Diese Kontextbezogenheit hat zweierlei Folgen. Einerseits begrenzt sie die Möglichkeit, die speziell angepaßten Regelungsparameter auf die Anforderungen einer veränderten Aufgabensituation zu übertragen, der gelernte Parametersatz ist mehr oder weniger kontextspezifisch. Auf der anderen Seite kann eine Anpassung der Regelparameter nur erfolgen, wenn sich die genannten Umgebungsfaktoren in der Lernphase nicht kritisch verändern.

 

2.1.2 Modellierung der inversen Werkzeugtransformation

Völlig im Gegensatz zur komplexen Aufgabenvielfalt der Regelung ist im Fall der direkten Steuerung das Ziel der Anpassung des inversen Werkzeugmodells durch die Eigenschaften des Werkzeugs klar definiert. Die besonderen Schwierigkeiten, die Systematik der Werkzeugtransformation zu erfahren und die Transformation zu invertieren, sind weiter oben schon diskutiert worden. Wichtig ist in diesem Zusammenhang vor allem, daß die Werkzeugeigenschaften weitestgehend unabhängig von den Lernbedingungen sind, die im vorigen Abschnitt als Aufgabenkontext bezeichnet wurden (z.B. von den verwendeten Vorlagenfolgen oder -geschwindigkeiten). Dies gilt allerdings nicht für die Erfahrbarkeit dieser Eigenschaften. So übersetzt ein Maustreiber die Bewegung, mit der die Maus in der Hand geführt wird, zwar immer gleich, d.h. unabhängig von den Geschwindigkeits- und Genauigkeitsanforderungen der Aufgabe oder den verwendeten Zielpositionen. Dabei spielt die Repräsentativität der dargebotenen Vorlagen eine wichtige Rolle für die Erfahrbarkeit der Werkzeugtransformation, vor allem dann, wenn nur eine Teilstichprobe aus dem Stimuluskontinuum verwendet wird. Noch kritischer ist die Vorlagenauswahl, wenn Werkzeuge mit dynamischen Eigenschaften gelernt werden, da hier Geschwindigkeiten oder Beschleunigungen kontrolliert werden müssen.

Werkzeugtransformationen können folglich, im Gegensatz zu den bereits erwähnten Parametern der Regelung, auch in Situationen gelernt werden, in denen sich der Aufgabenkontext, z.B. in bezug auf die geforderte Bewegungszeit oder -genauigkeit, verändert. Dies gilt allerdings nur, wenn die Erfahrbarkeit der Transformationseigenschaften des Werkzeugs davon unberührt bleibt.

 

2.1.3 Redundanz in Hybridsystemen

Lernen muß nicht immer geschehen, nur weil die Gelegenheit dazu besteht. Die Möglichkeit, systematische Zusammenhänge zwischen Variablen beobachten zu können, ist für Lernprozesse zwar notwendig, aber noch lange nicht hinreichend. Dies hat schon Thorndike (1931) festgestellt und im sog. Effekt-Gesetz formuliert. Hiernach ist das Lernen mehr oder weniger stark an die Vorteile des erlangten Wissens und der damit ermöglichten Verhaltensänderung gekoppelt. So reicht es völlig aus, nur dann zu lernen, wenn das so modifizierte Verhalten vorteilhaft ist (oder zumindest eine reelle Chance besitzt, einmal von Vorteil zu sein).

Diese Betrachtungsweise gewinnt an Bedeutung, wenn man das zugrundeliegende Prinzip auf Situationen überträgt, in denen zwei (oder mehr) Prozesse parallel (und kompetitiv) lernen, eine gemeinsame Aufgabe zu erfüllen. Kritisch für die Lernentwicklung ist nun besonders die Redundanz des Systems. Je nachdem, wie gut jeder der einzelnen Prozesse die Aufgabe allein erfüllen kann, wird sich die Anpassung der Lernparameter mehr oder weniger komplementär entwickeln. Das heißt, lernt einer der beiden Prozesse, aus welchen Gründen auch immer, schneller als der andere, dann kann unter Umständen das Gesamtverhalten schon soweit entwickelt sein, daß die Anpassung des zweiten Prozesses keinen erkennbaren zusätzlichen Nutzen zur Folge hat und deswegen ausbleibt. Diese Argumentation basiert auf derselben Logik wie das von Rescorla und Wagner vorgeschlagene Model zum kompetitiven Assoziationslernen (Rescorla und Wagner, 1972; s.a. Miller, Barnet und Grahame, 1995). Auch hier wird eine Assoziationsblockierung für den Fall vorhergesagt, daß ein zu ass/ziierender Hinweisreiz in Gegenwart eines anderen, schon zuvor konditionierten Hinweisreizes keine merkliche zusätzliche Vorhersagekraft für das Auftreten des unkonditionierten Stimulus besitzt.

 

 

2.2 Hypothese komplementären Lernens

 

Völlig im Gegensatz zur komplexen Aufgabenvielfalt der Regelung ist im Fall der direkten Steuerung das Ziel der Anpassung des inversen Werkzeugmodells durch die Eigenschaften des Werkzeugs klar definiert. Die besonderen Schwierigkeiten, die Systematik der Werkzeugtransformation zu erfahren und die Transformation zu invertieren, sind weiter oben schon diskutiert worden. Wichtig ist in diesem Zusammenhang vor allem, daß die Werkzeugeigenschaften weitestgehend unabhängig von den Lernbedingungen sind, die im vorigen Abschnitt als Aufgabenkontext bezeichnet wurden (z.B. von den verwendeten Vorlagenfolgen oder -geschwindigkeiten). Dies gilt allerdings nicht für die Erfahrbarkeit dieser Eigenschaften. So übersetzt ein Maustreiber die Bewegung, mit der die Maus in der Hand geführt wird, zwar immer gleich, d.h. unabhängig von den Geschwindigkeits- und Genauigkeitsanforderungen der Aufgabe oder den verwendeten Zielpositionen. Dabei spielt die Repräsentativität der dargebotenen Vorlagen eine wichtige Rolle für die Erfahrbarkeit der Werkzeugtransformation, vor allem dann, wenn nur eine Teilstichprobe aus dem Stimuluskontinuum verwendet wird. Noch kritischer ist die Vorlagenauswahl, wenn Werkzeuge mit dynamischen Eigenschaften gelernt werden, da hier Geschwindigkeiten oder Beschleunigungen kontrolliert werden müssen.

Werkzeugtransformationen können folglich, im Gegensatz zu den bereits erwähnten Parametern der Regelung, auch in Situationen gelernt werden, in denen sich der Aufgabenkontext, z.B. in bezug auf die geforderte Bewegungszeit oder -genauigkeit, verändert. Dies gilt allerdings nur, wenn die Erfahrbarkeit der Transformationseigenschaften des Werkzeugs davon unberührt bleibt.

 

2.1.3 Redundanz in Hybridsystemen

Lernen muß nicht immer geschehen, nur weil die Gelegenheit dazu besteht. Die Möglichkeit, systematische Zusammenhänge zwi Maße an das Vorhandensein von (externer oder vorwärts modellierter) Bewegungsrückmeldung gebunden.

Dennoch ist die Verfügbarkeit der Rückmeldung entscheidend dafür, welcher der beiden Prozesse bevorzugt angepaßt wird. Dies hängt damit zusammen, daß die Bewegungsrückmeldung nur für die Anpassung des inversen Modells wichtig ist, nicht aber für dessen Steuerfunktion (im angepaßten Zustand). Umgekehrt sind weder die Anpassung noch das Funktionieren der Regelmechanismen ohne die betreffenden Reafferenzen möglich. Folglich beeinträchtigt eine Reduzierung der verfügbaren Rückmeldung besonders die Leistungsfähigkeit der Regelungsmechanismen, so daß evtl. erfolgte Anpassungen der entsprechenden Parameter nicht zum tragen kommen. Bereits erfolgte Anpassungen des inversen Modells bleiben davon unberührt. Damit besitzt die inverse Modellierung in Situationen reduzierter Bewegungsrückmeldung relativ zur Regelungsanpassung eine größere Leistungsrelevanz. Hierdurch wird spezifisch die Anpassung des inversen Modells bestärkt.

Steht die Bewegungsrückmeldung hingegen in ausreichendem Maße zur Verfügung, dann besitzt die Regelungsanpassung die Chance, merklich zur Leistungsverbesserung beizutragen und entsprechend konsolidiert zu werden. Unter diesen Bedingungen konkurriert ihre Anpassung stärker mit der Entwicklung des inversen Modells.

 

Entsprechend den genannten Überlegungen ist zu erwarten, daß in Situationen, in denen insbesondere die Regelung erschwert ist, die Merkmale der Werkzeugtransformation (Steigung, Nichtlinearität) besser, d.h. schneller, präziser und nachhaltiger gelernt werden.

 

Dies gilt jedoch nur unter dem Vorbehalt, daß die entsprechenden Maßnahmen die Wirkungsweise der Steuermechanismen (z.B. durch eine Störung der Parametrisierung der gesteuerten Bewegung) nicht oder zumindest nicht in gleichem Umfang beeinträchtigen. Je stärker die Regelung der Aufgabe selektiv gestört werden kann, desto schneller sollten sich die Eigenschaften des inversen Modells an die Vorgabe anpassen können, da ohne eine funktionierende Regelung die Leistung des gesamten System enger an die Güte des inversen Modells gekoppelt ist. Die gezielte Erschwerung der Aufgabenregelung kann somit das Lernen der Werkzeugeigenschaften fördern (vorausgesetzt, die für die Modellanpassung nötigen Variablen stehen noch zur Verfügung).

 

2.2.2 Weitere Einflußmöglichkeiten

Neben der Manipulation des Ausmaßes verfügbarer Rückmeldung sind noch weitere Vorgehensweisen denkbar, um die Wirksamkeit der Regelungsanpassung zu manipulieren. So könnte man die Nutzbarkeit der Rückmeldung z.B. durch Zusatztätigkeiten vermindern. Allerdings kann man hierbei nicht ausschließen, daß auch der Steuerprozeß durch die Zusatztätigkeit beeinträchtigt wird.

Unterstützend zur Erschwerung der Regelungsanpassung ließe sich noch das Lernen des inversen Modells durch die Verwendung einfacher Werkzeugtransformationen beschleunigen (vgl. hierzu jedoch Abschnitt 2.3), damit eine Sättigung der Systemleistungsfähigkeit mit der entsprechenden Hemmung der Regelungsanpassung schneller eintritt.

 Umgekehrt ließe sich durch die Hinzunahme einer Störgröße sowohl die Wirksamkeit der Steuerungsfunktion als auch die Erfahrbarkeit der Werkzeugsystematik und somit die Anpassung des inversen Modells beeinträchtigen. Neben der direkten Erschwerung der Steuerungsanpassung führt die Störgrößenaufschaltung auch dazu, daß die Regelungsmechanismen häufiger tätig werden und hierdurch mehr Gelegenheit besteht, die Parameter der Regelung zu überprüfen und anzupassen. Hierdurch würde die Regelungsanpassung direkt gefördert und, entsprechend der Hypothese komplementären Lernens, die Inversen-Modellierung zusätzlich gehemmt.

 

2.2.3 Begründung einer einseitigen Wirkungsbetrachtung

Die bisher genannten Ansätze zielen allesamt auf die Veränderung der Anpassung des inversen Werkzeugmodells durch die Manipulation der Randbedingungen für eine Anpassung der Regelungsparameter. Dadurch fungiert der Anpassungsgrad des inversen Modells als abhängige Variable, es wird nur eine Wirkungsrichtung der (eigentlich bidirektionalen) Abhängigkeiten innerhalb des Hybridmodells untersucht. Ein umgekehrtes Versuchsdesign, welches die Inversenmodellierung variiert und abhängig hiervon die Veränderung der Regelungsanpassung beobachtet, ist grundsätzlich vorstellbar und sinnvoll.

Dennoch verfolgt die vorliegende Untersuchung nur die erstgenannte Logik und behandelt die Anpassung der Regelungsprozesse nicht als abhängige Variable. Der Verzicht auf die Gegenprobe (der direkten Variation der Lernbarkeit des inversen Modells) bedarf einer Begründung, die zum einen auf der unterschiedlichen Operationalisierbarkeit von Regelungs- und Steuerungsgrößen basiert. Wie schon erwähnt wurde, ist die Regelungsaufgabe im Gegensatz zum klar definierten Steuermodell durch eine Vielfalt möglicher Optimierungskriterien charakterisiert. Folglich herrscht über die an der Regelungsanpassung beteiligten Größen weit weniger Klarheit als darüber, welche Eigenschaften ein direktes inverses Modell besitzen soll. Wenn nun schon die Benennung und Auswahl der relevanten Regelungskennwerte kritisch ist, dann gilt das erst recht für die Identifizierung der zugehörigen operationalisierbaren Indikatoren.

Der zweite, gegen die Betrachtung der Regelungsanpassung sprechende Aspekt ist weit schwerwiegender und betrifft die einseitige Konfundierung zwischen der Erfassung von Regelungs- und Inversenparametern. Zur Ermittlung der inversen Kennlinie lassen sich die Regelmechanismen vollständig verhindern, indem man die Fehlerrückmeldung unterbindet. Umgekehrt gilt das nicht: Das erworbene Modell läßt sich nicht "ausschalten", die Erfassung der Regelungsparameter wird stets mit der Aktivität der Steuermechanismen konfundiert sein.

Die Güte des inversen Modells ist im Vergleich zur Beurteilung der Regelungsanpassung leicht zu ermitteln, insbesondere, wenn man Werkzeuge ohne dynamische Eigenschaften betrachtet. Bei der Erfassung des Steuerverhaltens muß man nur sicherstellen, daß die Bewegungsausführung ohne distale Rückmeldung erfolgt. Die Anpassungsgüte läßt sich dann allgemein über ein Abweichungsmaß, z. B. die quadratische Abweichung von der vorgegebenen Kennlinie quantifizieren. Diese allgemeinen Indikatoren gelten nun unabhängig von Annahmen über die innere Struktur des inversen Modells, da sie der Aufgabenstellung (die Bewegung möglichst so auszuführen, daß die Zielabweichung minimal ist) unmittelbar entsprechen. Ein Bezug zur Struktur der Repräsentation ergibt sich, wenn man einzelne Merkmale der Werkzeugcharakteristik, etwa die Steigung und Krümmung der Werkzeugkennlinie, gesondert betrachtet.

 

2.2.4 Vorhersagen zur Transferleistung

Eine wichtige Unterscheidung zwischen Regelung und Inversen-Modellierung betrifft die Kontextspezifität der jeweiligen Anpassung. Wie oben schon angesprochen, geschieht die Regeloptimierung in Abhängigkeit von der Vorlagendynamik als Anpassung der Parameter an die spezifisch erfahrenen Frequenzen und Geschwindigkeiten der Vorlage. Verändert sich nun eine dieser Randbedingungen, z.B. durch eine veränderte Geschwindigkeitsanforderung der Aufgabe, dann muß die Regelung neu parametrisiert werden. Es ist folglich mit einer Einbuße der Leistung in solchen Transfersituationen zu rechnen, in denen gerade diejenigen Merkmale der Stimulusfolge verändert sind, auf die die Regelungsparameter spezifisch eingestellt wurden.

Beruht nun die Trackingleistung vornehmlich auf einer gut angepaßten Regelung, so sollte die Leistung stärker unter der genannten Kontextveränderung leiden, als die einer vornehmlich auf der Inversenmodellierung basierenden Fertigkeit (eine rein kinematische Werkzeugtransformation ist vorausgesetzt):

 

Da das inverse Werkzeugmodell (im Gegensatz zu den Regelungsparametern) unabhängig von der verwendeten Stimulusvorlage und -abfolge ist, wird erwartet, daß diejenigen Versuchspersonen, die infolge der Regelungserschwerung das inverse Werkzeugmodell bevorzugt gelernt hatten, die gelernte Transformation auf andere Aufgabenkontexte (im Sinne anderer Stimulusvorlagen) besser übertragen als Versuchspersonen, die mit uneingeschränkter Möglichkeit zur Regelung gelernt hatten.

 

2.3 Aspekte der Operationalisierung

 

Wer das Wechselspiel von Regelungslernen und Inversenmodellierung beobachten möchte, muß natürlich zunächst sicherstellen, daß die vorgegebene Werkzeugtransformation grundsätzlich lernbar ist. Zielt die Untersuchung darüber hinaus vor allem auf eine Erschwerung der Regelungsanpassung, dann ist eine leicht zu lernende Werkzeugtransformation sinnvoll. Wie in der Einleitung schon ausgeführt wurde, können Systeme nur schwer gelernt werden, wenn die betreffende raum-zeitliche Transformation nicht ein-eindeutig ist. Ähnliches gilt für inkompatible (z.B. richtungsvertauschende) Bahntransformationen. Besonders günstig für das Werkzeuglernen sind demgegenüber vor allem lineare und positionskontrollierte Systeme (vgl. Poulton, 1974).

Gegen eine all zu leicht zu lernende Werkzeugtransformation spricht nun allerdings die schlechtere Beobachtbarkeit des (in diesem Fall kurzen) Lernprozesses der Inversenmodellierung. Außerdem sind bei einfachen Transformationen die Möglichkeiten einer qualitativen Beurteilung der Anpassungsgüte des inversen Modells durch die geringe Zahl der Transformationseigenschaften oder -Parameter (z.B. Steigung der Kennlinie, Nulldurchgang) begrenzt. Je mehr Merkmale die zu lernende Werkzeugtransformation aufweist, desto reichhaltiger ist auch die Grundlage für die Beurteilung der Anpassungsgüte des gelernten Modells. Mit zunehmender Komplexität der zu lernenden Transformation steigt somit auch die Chance, Hinweise auf strukturelle Merkmale der zugrundeliegenden mentalen Repräsentation zu erhalten. So könnte im Falle einer nichtlinearen Werkzeugkennlinie untersucht werden, welche der Kennlinienmerkmale (Lage, Steigung, Krümmung) durch das inverse Modell wiedergegeben werden oder wie eng das Lernen dieser Merkmale aneinander gekoppelt ist.

Auch inhaltlich bilden die genannten Kennlinienmerkmale völlig unterschiedliche Aspekte der Werkzeugtransformation ab. So beschreibt der Lageparameter die Bindung der Werkzeugbenutzung an einen bestimmten Ort. Das Ausbleiben der Anpassung der räumlichen Lage der Werkzeugbewegung wäre ein Hinweis auf eine ortsunabhängige Repräsentation der Bewegung und somit auch des Werkzeugmodells, z.B. in Form einer weiten- oder geschwindigkeitsbezogenen Codierung (vgl. Laabs, 1974).

Die Steigung der Kennlinie entspricht der gelernten mittleren Verstärkung der Stimulusamplituden bei der Übersetzung in die Bewegungsweite. Der enge Zusammenhang dieses Kennwerts mit den Parametern Generalisierter Motorischer Programme ist offensichtlich. Die Kennlinienkrümmung schließlich steht für die Lernbarkeit nichtlinearer Zusammenhänge. Sie kann somit als Maß für die Anpassung feinerer, komplexerer Merkmale der Werkzeugtransformation angesehen werden, welche erst gelernt werden, wenn die grobe Anpassung (mittels Steigungs- und Lageanpassung) bereits geschehen ist (Koh und Meyer, 1991).

Um die Anpassung des inversen Werkzeugmodells in einer Versuchsanordnung unverfälscht beobachten zu können, muß zudem sichergestellt sein, daß die Anwendung antizipatorischer Strategien nicht begünstigt wird. Dies ist besonders wichtig, da im Falle einer auf Stimulus-Antizipation beruhenden Bewegungsvorbereitung nicht festgestellt werden kann, ob die antizipierte Vorlage auch der dann tatsächlich dargebotenen entspricht. In diesem Fall wäre die Eingangsgröße des inversen Modells nicht notwendigerweise mit dem Stimulus identisch und die Transformationseigenschaften folglich nicht valide schätzbar.

Zur Verhinderung antizipativen Verhaltens ist es zunächst wichtig, keine vorhersagbaren Vorlagenfolgen zu verwenden. Darüber hinaus sollten Lernsituationen vermieden werden, in denen ein möglichst schnelles Reagieren auf die Präsentation der Stimuli verlangt wird. Auch dies würde die Elaboration antizipativer Strategien belohnen.


Inhalt  voriges Kapitel: Einleitung  Kapitelanfang nächstes Kapitel: Experiment 1