line
line

Anmerkungen zum Zertifikat Deutsch im mexikanischen Kontext vor dem Hintergrund der Deskriptoren-Tabellen des Gemeinsamen Europäischen Referenzrahmens

Heike Gruhn

Facultad de Lenguas
Benemérita Universidad Autónoma de Puebla, Mexiko
24 Norte 2003
Colonia Humboldt
Puebla, Pue., Mexiko
Telefon: +52 222 2295500 ext. 5820
Fax: +52 222 2979747
E-mail: heike50@hotmail.com

Abstract: Die vorliegende Arbeit wagt einen kritischen Blick auf die Prüfung Zertifikat Deutsch, wobei – vor dem Hintergrund der B1-Deskriptoren des Gemeinsamen Europäischen Referenzrahmens – einzelne Strukturaspekte und Bewertungskriterien der Prüfung herausgegriffen und analysiert werden und die Befunde in den Kontext des spezifisch mexikanischen DaF-Umfeldes gestellt werden. Leitend ist dabei die Frage nach dem Verhältnis zwischen Prüfungsergebnissen und Deskriptoren-Tabellen, was letztendlich auch mit dem Themenkomplex der Verantwortung für die Nutzung von ZD-Prüfungsergebnissen in der mexikanischen Berufswelt in Zusammenhang steht.
 
Abstract: In this cautiously critical assessment of the „Zertifikat Deutsch“ exam the author selects and analyzes several of its structural aspects and evaluation criteria against the background of the B1-descriptors of the Common European Framework of Reference for Languages and situates the findings in the specific context of German as a Foreign Language in Mexico. At issue is particularly the relationship between the exam results and the tables of descriptors as it concerns the responsibility for the use of ZD examination results in the Mexican business world.

Schlagwörter: Berufliches Sprachhandlungsvermögen, consequential validity, DaF in Mexiko, Deskriptoren, Gemeinsamer Europäischer Referenzrahmen, Profil-Beschreibungen, Zertifikat Deutsch

0. Einleitung

Der in der Europäischen Union zu beobachtende Trend hin zu einem einheitlichen Bildungsraum hat auch vor den fremdsprachlichen Prüfungen nicht halt gemacht. Eines der Anliegen der 2001 vom Europarat veröffentlichten Version des Gemeinsamen Europäischen Referenzrahmens (nachfolgend GeR) ist es, nationale Lehr-, Lern- und somit auch Testtraditionen im Fremdsprachenunterricht zu überdenken und vergleichbar zu machen. Dabei sieht sich der GeR nicht als normative Instanz, sondern möchte lediglich Fragen aufwerfen (vgl. Hinweise für den Benutzer). Dieses Selbstverständnis scheint von der Realität aber schon längst überholt worden zu sein. Kaum ein Lehrbuch, Kursangebot oder Prüfungsanbieter innerhalb der EU (und zunehmend auch außerhalb) kommt heute daran vorbei, seine Anlehnung an den Referenzrahmen und die dort beschriebenen Niveaustufen in großen Lettern auf die Werbefahnen zu schreiben. Prüfungen von offiziellen Prüfungsanbietern im europäischen Raum sind seit knapp zehn Jahren an diesen Stufen ausgerichtet, wobei es für jedes Niveau spezifische Deskriptorentabellen [1] gibt. Einen normativen Effekt hat das insofern, als letztere auf einem kommunikativen bzw. kompetenzbasierten Ansatz [2] gründen, der rezeptiven und produktiven Umgang mit Sprache grundsätzlich als Sprachhandlung interpretiert. Prüfungsergebnisse müssen an Hand dieser Tabellen interpretierbar und in diese einordbar sein. Das führte zur Umarbeitung früherer Prüfungsdesigns, die nicht mit diesem System kompatibel waren.



-2-

Im Folgenden möchte ich im Hinblick auf die Prüfung „Zertifikat Deutsch“ (nachfolgend ZD) einige kritische Anmerkungen und Fragen aufwerfen und mich dabei auch auf die B1-Deskriptoren des GeR beziehen. Analysiert werden sollen Strukturaspekte der Prüfung unter Einbezug der Bewertungskriterien. Es handelt sich hierbei nicht um die Arbeit einer Prüfungsexpertin, sondern um einen Blick aus der Praxis, in den mitunter auch subjektive Beobachtungen einfließen können. Darüber hinaus möchte ich meine Ausführungen ausdrücklich auf den mexikanischen Kontext beziehen. Zwar ist die ZD-Prüfung weltweit gleich, es gibt jedoch spezifisch regionale Rahmenbedingungen, mit denen das Geschehen rund um eine offizielle Prüfung verzahnt ist. Prüfungen wirken sowohl auf das Unterrichtsgeschehen zurück (Mikroebene), als auch in das gesellschaftliche Umfeld hinein (Makroebene) (vgl. Schifko 2001: 827), wobei die Wirkung aber nicht nur von der Prüfung selbst abhängt, sondern auch durch Eigenheiten der jeweiligen Gesellschaft mitgestaltet wird. Einzelne Aspekte der mexikanischen Bildungslandschaft und Arbeitswelt müssen also in die Überlegungen dieser Arbeit mit einbezogen werden.

1. Das Zertifikat Deutsch als sicherer Nachweis klar definierter Kompetenzen?

1.1 Die B1-Profil-Beschreibungen der Prüfungsanbieter

In der vorliegenden Arbeit soll uns unter anderem die Frage beschäftigen, was für Behauptungen bezüglich des Absolventenprofils der Prüfung aufgestellt werden und ob diese auch eingelöst werden können. Für eine erste Annäherung an diesen Fragenkomplex ist es notwendig, einige Profil-Beschreibungen der Prüfungsanbieter näher zu durchleuchten.

Den Interessenten, die genauer wissen möchten, was von einem B1-Absolventen zu erwarten ist, wird es nicht leicht gemacht: „Mit dem Bestehen des Goethe-Zertifikats B1: Zertifikat Deutsch (ZD) weisen Sie nach, dass Sie über solide Grundkenntnisse in der deutschen Umgangssprache verfügen und dass Sie sich in allen wichtigen Alltagssituationen sprachlich zurechtfinden“, heißt es auf der Homepage des Goethe-Instituts (nachfolgend GI), wobei vor nicht allzu langer Zeit dort auch noch Folgendes stand: „Sie zeigen mit dem ZD, dass Sie die wesentlichen grammatikalischen Strukturen beherrschen [...]“.

Weiterhin wird versprochen, dass man „nach [sic] Bestehen der Prüfung [...] in Alltagssituationen wichtige Informationen aus Gesprächen, öffentlichen Durchsagen und Radiomeldungen auch im Detail verstehen, [sowie] wichtige Informationen aus Zeitungstexten, Statistiken und alltagsbezogenen Beschreibungen genau verstehen [könne]“ http://www.goethe.de/).

Das Österreichische Sprachdiplom (nachfolgend ÖSD) erläutert (2004: 7): „Auf dieser Stufe sollten LernerInnen fähig sein, sich in der Alltags- und Berufswelt sprachlich problemlos zurechtzufinden. Im Mittelpunkt dieser Prüfung steht die kommunikative Kompetenz, doch auch auf formale Korrektheit wird bereits geachtet“, und fügt an anderer Stelle (siehe http://www.osd.at, ÖSD Prüfungen - Grundlagen) dazu: „Grammatik- und Wortschatzkenntnisse sowie Aussprache und Orthographie werden als der kommunikativen Kompetenz untergeordnete Bereiche angesehen und als solche auch nur implizit mit geprüft und mit bewertet“.



-3-

Insgesamt sind die Aussagen beider Anbieter [3] nicht deutlich aufeinander abgestimmt und werfen mehr Fragen auf, als sie beantworten. Dass sich Begriffe wie „Alltag“ bzw. „tägliches Leben“ auf sehr Unterschiedliches beziehen können, ist in der Fachliteratur immer wieder angemerkt worden (vgl. z.B. Clalüna 2004: 25). Geht es hier um den Alltag eines Arbeiters oder um den eines Wissenschaftlers? Geht es um den Alltag des Lerners oder auch um den Alltag der Menschen, die im (für den Lerner nicht unbedingt alltäglichen) Sprachraum der Zielsprache leben?

Wie soll die widersprüchliche Einschätzung der Grammatik aufgefasst werden? Sind kommunikative Kompetenz und formale Korrektheit zwei verschiedene Stiefel (wie das ÖSD suggeriert), während das GI die „kommunikative Kompetenz“ – die ja laut ÖSD bei der Prüfung im Mittelpunkt steht – überhaupt nicht wörtlich anführt?

Um was für eine Berufswelt handelt es sich da eigentlich, die das ÖSD anspricht, das GI aber ausspart? Berufswelten können ja ebenso unterschiedlich sein wie Alltagswelten.

Trotz der nicht immer klar aufeinander abgestimmten Ausgangskonzepte haben sich die beiden Anbieter auf ein einheitliches Prüfungsdesign und einheitliche Lernziele [4] geeinigt. Der Aufbau von ZD-GI und ZD-ÖSD ist äußerlich identisch, ebenso die jeweiligen Zeitvorgaben und Punktezahlen, auch wenn die konkreten Prüfungssätze der Anbieter nicht dieselben sind. Um von einer vollständigen Gleichwertigkeit ausgehen zu können, müsste auch die Durchführungs- und Auswertungsobjektivität untersucht werden [5], was in diesem Rahmen allerdings nicht geleistet werden kann.

1.2 Das ZD und die Kann-Beschreibungen des Gemeinsamen Europäischen Referenzrahmens

Auf den jeweiligen Homepages bzw. in den Werbeschriften der Prüfungsanbieter sind letztendlich weder ausführliche noch präzise Auskünfte darüber zu erhalten, was von einem B1-Absolventen zu erwarten ist. Das mag damit zusammenhängen, dass die Prüfungsanbieter ausdrücklich darauf verweisen, sich auf die Niveaustufen des Referenzrahmens zu beziehen. Dieser sollte also die gesuchten Informationen liefern können.

Der Referenzrahmen selbst schreibt keinerlei Prüfungsinhalte oder Aufgabenformate vor, vielmehr lässt er Raum für unbegrenzt viele verschiedene Prüfungen. Diese sind aber alle an die dort formulierten Grundlagen gebunden, das heißt u.a., dass „Sprachhandlungen“ und „Kompetenzen“ geprüft werden sollen und Prüfungsergebnisse anhand der vorgegebenen Kann-Beschreibungen interpretierbar sein müssen. Damit ist eine gewisse Einschränkung des Spielraums einzelner Prüfungen verbunden. Wollte man die Beziehung zwischen GeR und ZD graphisch darstellen, so würde ein Pfeil vom GeR zum ZD weisen und ein weiterer von diesem wieder zurück zum GeR. Insofern ist das ZD nicht isoliert zu betrachten. Es ist grundsätzlich danach zu fragen, auf welche Weise Grundannahmen des GeR in Aufgabenformate und Prüfungsinhalte eingeflossen sind, und in welchem Umfang die B1-Deskriptorentabellen Auskunft über die Prüfungsergebnisse geben können. In dieser Arbeit können wir uns allerdings nur der letzteren der beiden Teilfragen zuwenden.

Der GeR ist in Mexiko weitgehend bekannt und wird zunehmend auch „institutionell verordnet“ (d.h. Lehrpläne und Lehrbücher sollen auf ihm beruhen, was sich wiederum auf das Unterrichtsgeschehen auswirkt). In einschlägigen Veranstaltungen wird er vorgestellt und erklärt – selten jedoch kritisch hinterfragt. Mit Grotjahn (2007: 29) können wir sagen, dass „der GeR in der Praxis zumeist als eine Art ‚Bibel’ betrachtet [wird]“.



-4-

Für die Stufe B1 stehen in den Kapiteln 4 und 5 rund 60 Deskriptoren zur Verfügung, wobei zwischen globalen und detaillierten Kann-Beschreibungen unterschieden wird [6]. Umfassende Analysen dieser Deskriptoren sind an anderer Stelle bereits geleistet worden, weshalb hier lediglich einige Punkte kurz umrissen werden sollen.

  • Kritisiert worden ist wiederholt, dass die dort aufgeschlüsselten Kompetenzen unscharf bleiben, da vielfach mit unklaren Begrifflichkeiten gearbeitet wird (vgl. z.B. Altmayer 2004: 4; Clalüna 2004: 25), sowie dass diese Unschärfen eine begründete Zuordnung von Tests und Prüfungen zu den Kompetenzniveaus des GeR teilweise nicht erlauben (vgl. Grotjahn 2007: 28). Beispiele dafür sind der oben bereits erwähnte Alltagsbegriff, aber auch Begriffe wie „vertraut“, „vorhersehbar“ oder „routinemäßig“.
  • Ein weiterer, gewichtiger Kritikpunkt ist, dass die programmatischen Aussagen des GeR bezüglich der inter- bzw. plurikulturellen Kompetenzen in die Deskriptoren praktisch nicht eingeflossen sind (vgl. die Arbeiten der vorgenannten Autoren). Wie soll man sich bei der Messung und Beschreibung sprachlicher Kompetenzen und Handlungsfähigkeit denn auf „Vertrautes“ und „Routinemäßiges“ konzentrieren, wenn Fremdsprachenlernen doch von Anfang an gerade auch die Auseinandersetzung mit dem Fremden – also Unvertrauten – bedeutet? Hierin liegt ein grundsätzliches Dilemma der Deskriptoren!
  • Unterstrichen wird immer wieder, dass man dem GeR entnehmen könne, was man braucht, und dass dessen Inhalte auf spezifische Lern- oder Prüfungssituationen abstimmbar seien. Theoretisch können also die Vorgaben des GeR an regionale Bedürfnisse angepasst werden. Diese Möglichkeit wird aber dadurch ausgebremst, dass offizielle Prüfungen, die international dieselben Kompetenzstufen bescheinigen sollen, sich auf die im GeR verankerten Deskriptoren beziehen, und nicht etwa auf regional angepasste.
  • Dieselbe Prüfung und dieselben Deskriptoren sollen für alle Prüflinge jeglichen Bildungsstandes und jeglichen sozio-kulturellen Erfahrungshintergrundes aussagekräftig sein. Hier wird also stillschweigend vor–ausgesetzt, dass alle Lerner, unabhängig von ihrem Bildungsstand, ihrer Vorerfahrung im Fremdsprachenlernen oder den Zielen, die sie mit dem Lernen der Sprache verbinden, dieselben Lern- und Kompetenzstufen durchlaufen. Doch nicht nur zwischen den Kulturen, auch unter Muttersprachlern einer selben Sprachgemeinschaft weichen die kommunikativen Fertigkeiten und die Kommunikationsbedürfnisse mitunter erheblich voneinander ab.
  • Nicht zuletzt lässt sich auch das auf den mexikanischen Kontext übertragen, was Schmidt (2007: 127) in Bezug auf Japan mit „Trockenschwimmen“ bezeichnet. Wenn sprachliche Aktivitäten als „Sprachhandeln“ gedeutet werden und die Deskriptoren und sich daran orientierende Prüfungen ausschließlich dieses Handeln zu bewerten vorgeben, so stellt sich doch die Frage, wie das dort möglich ist, wo die Lerner kaum jemals auf authentische Kommunikationssituationen in der Fremdsprache treffen können, d.h. wo jedes „Sprachhandeln“ lediglich simuliert sein wird.

Festzuhalten sei an dieser Stelle, dass die Deskriptoren, die Auskunft über die Kompetenzen von Prüfungsabsolventen geben sollen, selbst in der Kritik stehen.



-5-

1.3 Zum Verhältnis von Kann-Beschreibungen und Prüfungsinhalten

Die Vielzahl an Deskriptoren zu B1 erwecken den Anschein, man hätte hier ein Instrument vorliegen, das detaillierte Auskunft über sämtliche Kompetenzen eines B1-Absolventen zu geben vermöge: „Die Summe aller Kann-Beschreibungen auf einem bestimmten Niveau kann als Beschreibung dieses Niveaus gelesen werden“, heißt es bei „Profile Deutsch“ [7]. Doch neben der bereits angesprochenen inhaltlichen Unschärfe wird auch die Quantität selbst zum Problem, zumindest dann, wenn Prüfungsergebnisse damit beschrieben werden sollen. Es ist nämlich keine Prüfung denkbar, die alle in den Skalen aufgeführten Teilaspekte prüfen und deren Erfüllung verbürgen könnte.

Manche der in den B1-Skalen des GeR aufgelisteten Kompetenzen lassen sich nur ansatzweise oder so punktuell in den Prüfungsanforderungen des ZD ausmachen, dass eine teilweise oder völlige Nichterfüllung praktisch keine Auswirkungen auf das Prüfungsergebnis haben wird, und die entsprechende Kompetenz auf Grund der Prüfung nicht verbürgt werden kann.

Andere werden beim ZD überhaupt nicht geprüft, sondern bestenfalls aufgrund weiterer, geprüfter Kompetenzen als wahrscheinlich angenommen [8]. Hier kurz ein Beispiel unter vielen:

5.2.2.5. Soziolinguistische Angemessenheit B1:

[...] Ist sich der wichtigsten Unterschiede zwischen den Sitten und Gebräuchen, den Einstellungen, Werten und Überzeugungen in der betreffenden Gesellschaft und in seiner eigenen bewusst und achtet auf entsprechende Signale.

Es handelt sich hier um den einzigen Deskriptoren auf B1-Niveau, der Aussagen über soziokulturelle Kompetenzen des Lerners trifft. Entworfen wird ein sehr anspruchsvolles Profil, veranschlagt er doch – sozusagen in einem Atemzug – ein klares Bewusstsein bezüglich einer Vielzahl an soziokulturellen Eigenheiten der „Zielsprachengesellschaft“ (müsste es nicht besser „Gesellschaften“ heißen?). Doch „Sitten, Gebräuche, Einstellungen, Werte und Überzeugungen“ sind ein sehr weites Feld, zumal sie sich auch innerhalb einer Sprachgemeinschaft stark unterscheiden können. Beim ZD konnte ich keine Stelle ausmachen, die eine Aussage über eine diesbezügliche Kompetenz des Prüflings erlauben würde. In der Praxis sieht es so aus, dass die Prüfung auch dann problemlos bestanden werden kann, wenn das einzige landeskundliche Programm aus den (meist wenig aufschlussreichen) Bildern und Fakten besteht, die im Lehrbuch enthalten sind.

„Él que mucho abarca poco aprieta” [9], lautet ein mexikanisches Sprichwort. Wird wie im GeR versucht, sämtliche Elemente aufzuschlüsseln und abzustufen, die beim „Sprachhandeln“ eine Rolle spielen und auf dieses einwirken, führt das nicht unbedingt zu einem präziseren Profil von Prüfungsabsolventen. Nicht nur, weil Prüfungen ohnehin nur Ausschnitte abbilden können, sondern auch weil eine Prüfung unmöglich so viele einzelne Elemente erfassen und auf eine Weise prüfen kann, dass allgemeingültige Aussagen bezüglich des Prüflings daraus ableitbar wären.



-6-

1.4 Die verschiedenen sprachlichen Fertigkeiten: Rechenspiele

Weitere Gründe, warum die B1-Deskriptoren nicht als Katalog sämtlicher Kompetenzen des Zertifikats-Absolventen dienen können, ergeben sich aus dem Aufbau und den Bewertungsmaßstäben der Prüfung. Bestanden ist sie bereits ab 60% der erreichbaren Gesamtpunktzahl, 40% der Aufgaben darf der Prüfling also nicht oder falsch beantworten. Problematisch ist hierbei, dass die verschiedenen Teile des Zertifikats, unterschiedliche Fertigkeitsbereiche [10] abdecken und Kompetenzen in all diesen Bereichen (s. GeR: Kapitel 4, dort Aktivitäten genannt) von den B1-Deskriptoren verbürgt werden.

Das ZD sieht jedoch keine Mindestpunktzahlen für einzelne Fertigkeitsbereiche vor (einmal abgesehen davon, dass sowohl der schriftliche als auch der mündliche Teil bestanden sein müssen). Fehlende Punkte in einem Prüfungsteil können beliebig durch einen anderen Prüfungsteil ausgeglichen werden. Das bedeutet, dass jemand, der zum Beispiel beim Lese- oder Hörverstehensteil nur sehr wenige oder keine Punkte erzielt, die Prüfung immer noch mit „befriedigend“ bestehen kann; wer beim einzigen produktiven Teil der schriftlichen Prüfung, dem Brief, keine Punkte erzielt, kann die Prüfung noch mit „gut“ bestehen.

Das heißt wiederum, dass es keine Garantie gibt, dass die einzelnen in den Deskriptorentabellen von Kapitel 4 des GeR beschriebenen Fertigkeitsbereiche von dem jeweiligen Absolventen auch abgedeckt werden. Im Falle des letzten Beispiels müssten sämtliche Aktivitäten des schriftlichen Ausdrucks (GeR Kapitel 4.4.1.2) in Bezug auf den entsprechenden Prüfling gestrichen werden.

Natürlich wird selten jemand einen Prüfungsteil ganz unbeantwortet lassen und in allen anderen Teilen glänzen. Wahrscheinlicher ist, dass der Prüfling auch in den Bereichen, die er kaum beherrscht, einige Punkte erzielt und somit einen größeren Fehlerspielraum für die übrigen Prüfungsteile hat.

Zu Hilfe kommen kann ihm dabei das Zufallsprinzip: Der gesamte Prüfungsteil „Hörverstehen“ (Global-, Selektiv- und Detailverstehen – ein Drittel der Gesamtpunktzahl der schriftlichen Prüfung!) besteht aus 20 richtig-falsch-Aufgaben, d.h. die Wahrscheinlichkeit, die richtige Antwort anzukreuzen, liegt durchweg bei 50%. Von diesem Aufgabentyp wird heute aufgrund von Validitätsproblemen allgemein abgeraten (vgl. Adkins Wood 1990: 40f.). Im Prinzip kann man bei einem Prüfling, der in etwa die Hälfte der Antworten richtig ankreuzt hat, nicht mit Sicherheit sagen, ob er überhaupt etwas von dem Hörtext verstanden hat. Da drängt sich doch der Eindruck auf, dass hier ein Mechanismus zur Erhöhung der Absolventenzahlen eingesetzt wird. Das Aufgabenformat erlaubt jedenfalls kaum Rückschlüsse auf die im GeR (unter 4.2.2.1) beschriebenen Fähigkeiten des Lerners, ebenso wenig kann es die vom GI proklamierte Fähigkeit des detaillierten Hörverstehens bestimmter Textsorten garantieren (vgl. Zitat Kapitel 1.1).

Nicht nur die Ratewahrscheinlichkeit spricht gegen das multiple-choice-Format. Manfred Schifko (2001: 833) merkt an, dass diese Aufgabenform „eine äußerst unauthentische Form der Sprachverarbeitung“ ist, „da man in realen Kommunikationssituationen selten drei oder vier Antwortalternativen präsentiert bekommt, von denen eine ausgewählt werden muss, wenn man Verständnis signalisieren möchte.“ Mit anderen Worten: Gerade bei sich als kommunikativ verstehenden Prüfungen müsste dieser Aufgabentyp eigentlich vermieden werden.



-7-

Zweifeln lässt sich auch daran, dass der Prüfungsteil „Leseverstehen Teil 2“ als Nachweis der versprochenen Kompetenz des detaillierten Leseverständnisses genügen kann. Nicht nur, dass diese Kompetenz ohne geforderte Mindestpunktanzahl im Prinzip ganz ausfallen darf, es muss auch grundsätzlich gefragt werden, ob infolge der Beantwortung von insgesamt nur 5 Mehrfachwahl-Aufgaben zu ein oder zwei längeren Texten (von denen zwischen 0 und 5 richtig beantwortet sein dürfen) und einer Ratewahrscheinlichkeit von 33,3% (multiple-choice-Aufgaben mit drei Wahlmöglichkeiten) davon ausgegangen werden kann, dass der Prüfungstext und andere vergleichbare Texte im Detail verstanden werden.

Meine Erfahrungen bei der Vorbereitung dieses Prüfungsteils laufen darauf hinaus, dass a) die Aufgaben mit Techniken des Selektivverstehens beantwortet werden können (die jeweils vorgegebene Antwortmöglichkeit wird gesucht, nicht aber unbedingt der Text in seiner Gesamtheit gelesen und verstanden); b) dieselben Studenten bei verschiedenen Probeprüfungssätzen teilweise recht unterschiedliche Ergebnisse erzielen; aber auch: c) die Studenten oftmals die richtige Antwort angekreuzt haben, sich bei der Besprechung aber herausstellt, dass sie etwas ganz anderes verstanden hatten.

Die mündliche Prüfung enthält Routineaufgaben, auf die man sich sehr gezielt vorbereiten kann. Der erste Teil (Vorstellung) kann quasi vorher schon auswendig gelernt werden, und auch bei Teil 3 geht es immer wieder um dasselbe: Die Vorbereitung eines Treffens, bei dem verschiedene Aufgaben abgesprochen und verteilt werden müssen. Um auf vergleichbare Leistungen bei authentischen Sprechanlässen schließen zu können, müssten die Sprechaufgaben weniger vorhersehbar sein.

Um sicherzustellen, dass die Absolventen in allen Fertigkeiten die veranschlagten Kompetenzen besitzen, wäre auf jeden Fall das Ansetzen von Mindestpunktzahlen (auf der 60%-Marke) für alle Prüfungsteile sinnvoll. Und natürlich der Ersatz von Prüfungsaufgaben mit hoher Ratewahrscheinlichkeit. Denkbar wäre auch, für einzelne Fertigkeitsbereiche unterschiedliche Niveaustufen zu zertifizieren (z.B. Rezeption schriftlich B1, Rezeption mündlich A2), ähnlich dem Test-DaF-Modell.

Ein potentieller Arbeitgeber wird sich mit dem Zertifikatsabsolventen jedenfalls ein Überraschungsei einhandeln: Etwas ist drin, aber möglicherweise kommen gerade die Teilkompetenzen oder Fertigkeiten, auf die er besonderen Wert gelegt hätte, nicht zum Vorschein.

Prüfungen können in der Regel nur Ausschnitte eines Lernstoffes abfragen und bilden insofern auch nur Ausschnitte des veranschlagten Wissens oder Könnens ab. Das ist nicht neu und das lässt sich nicht ändern. Die Validität einer Prüfung hängt unter anderem davon ab, wie repräsentativ die gewählten Ausschnitte bezüglich der abzuprüfenden Inhalte bzw. des veranschlagten Absolventenprofils sind und wie die jeweiligen Aufgabenformate und Bewertungsparameter aussehen. Beim ZD sind diesbezüglich, wie wir gesehen haben, Mechanismen wirksam, die im Rahmen der geprüften Ausschnitte in Hinsicht auf jede einzelne der zu erbringenden Leistungen und in Hinsicht auf ganze Fertigkeitsbereiche größere Lücken erlauben. Sicher, Prüfungen werden allgemein mit einer Mindestpunktzahl bestanden, die unterhalb von 100% liegt. Das Problem liegt hier aber im Verhältnis zwischen Prüfungsleistungen und Aussagen bezüglich derselben. Mit anderen Worten: Es geht um die Frage, wie sich solche potentiell lückenhaften Leistungen zu der Vielzahl an Deskriptoren mit detaillierten Kann-Beschreibungen verhalten, die ja Auskunft über diese Leistungen sowie daraus abgeleitete weitere Kompetenzen geben sollen. Bei früheren Prüfungen stellte sich die Frage nicht in dieser Form, da sie von ihren Versprechungen her (bestimmter Wortschatz, bestimmte Strukturen) unverfänglicher waren. Wenn Prüfungsanbieter auf die GeR-Skalen verweisen, welche beschreiben sollen, was der Prüfling in der Fremdsprache tun kann, so impliziert das doch, dass dabei schon mitbedacht wurde, dass die Prüfung lediglich Ausschnitte erfassen kann. Darüber hinaus muss angenommen werden, dass die Aussagen der Skalen auch dann zutreffend sein sollen, wenn die Prüfung mit der Mindestpunktzahl bestanden wurde. „Die detaillierten Kann-Beschreibungen haben vor allem die Aufgabe, das typische oder wahrscheinliche Verhalten von Lernenden auf den verschiedenen Niveaus zu umschreiben“, heißt es bei Profile Deutsch (2.0, Info zu Kann-Beschreibungen [CD-ROM]). Je größer aber die Lücken sein dürfen, die die Prüfung erlaubt, und je zahlreicher die Detailaussagen für die Niveaustufe sind, desto wahrscheinlicher wird es, dass viele der letzeren auf einzelne Prüflinge gar nicht zutreffen. Mit anderen Worten: Die Deskriptoren können bezüglich der Ergebnisse des ZD nur bedingt aussagekräftig sein. In welchem Ausmaß sie im Falle welcher Prüfungsergebnisse zutreffen sollen, darüber müssten Nutzer eigentlich genauer unterrichtet werden. Denn dass diesen solche Zusammenhänge bewusst sind, kann nicht erwartet werden.



-8-

2. Das Zertifikat Deutsch und die kommunikative Kompetenz

2.1 Anmerkungen zu den Bewertungsmaßstäben beim Prüfungsteil „Schriftlicher Ausdruck“

Geht es bei der Auswertung der meisten Prüfungsteile lediglich um die Auszählung von richtig angekreuzten Lösungen, so finden sich mit dem schriftlichen und mündlichen Ausdruck zwei produktive Prüfungsteile, bei denen die Subjektivität der Prüfer in die Auswertung mit einfließt. Das lässt sich bei Prüfungen zur freien Sprachproduktion generell nicht völlig vermeiden (man denke nur an die Bewertung schulischer Aufsätze in der Muttersprache).

Nachfolgend möchte ich am Beispiel der sprachsystematischen und hier insbesondere der grammatischen Kompetenzen die Bewertungskriterien des Prüfungsteils „Schriftlicher Ausdruck“ etwas genauer betrachten. Vorangestellt sei ein einschlägiger Deskriptor des GeR, mit dem diese Kriterien abgeglichen werden sollen:

5.2.1.2 Grammatische Korrektheit B1:

Kann sich in vertrauten Situationen ausreichend korrekt verständigen; im Allgemeinen gute Beherrschung der grammatischen Strukturen trotz deutlicher Einflüsse der Muttersprache. Zwar kommen Fehler vor, aber es bleibt klar, was ausgedrückt werden soll.

Der GeR ist hier in sich schlüssig: Da er die grammatische als integralen Bestandteil der kommunikativen Kompetenz betrachtet, soll dieser Deskriptor eine gute Beherrschung der wichtigsten grammatischen Strukturen bescheinigen. Fehler dürfen vorkommen, aber eben nur dann, wenn sie nicht verständnisstörend sind, d.h. die Kommunikation nicht beeinträchtigen.

Die „formale Richtigkeit“ ist eines von drei (GI) bzw. eines von vier (ÖSD) Teilkategorien bei der Bewertung des ZD-Briefes, wobei der Prüfling in dieser Rubrik mehr als 0 Punkte erzielen muss (sonst ist der Brief nicht bestanden, die Gesamtprüfung kann trotzdem bestanden werden).

Für die Bewertung von Fehlern in Syntax, Morphologie, Orthografie und Interpunktion steht eine Skala [11] zur Verfügung, die Fehler folgendermaßen abstuft: „keine/nur vereinzelte, einige, an mehreren Stellen, an vielen Stellen“. Ein weiteres Kriterium ist die Verständlichkeit des Textes, es wird abgestuft nach: Fehlern, die „das Verständnis nicht stören, nur wenig beeinträchtigen, an mehreren Stellen erheblich beeinträchtigen, an vielen Stellen erheblich beeinträchtigen, Brief kaum noch verständlich“.



-9-

Die Interpretation von Kriterien wie „einige“, „mehrere“, „viele“ usw., aber auch Einschätzungen bezüglich der Verständlichkeit können je nach Prüfer erheblich variieren. Eine Textstelle, aus der ein Prüfer noch etwas Verständliches herauszulesen glaubt, mag einem anderen schon zusammenhanglos erscheinen. Was der eine schon als „viel“ empfindet, kann für den anderen noch akzeptabel sein. Die vorgegebenen Bewertungsraster des Briefes eröffnen einen Spielraum, der von der Subjektivität, d.h. den individuellen Kriterien der einzelnen Prüfer, ausgefüllt werden muss (und das nicht nur hinsichtlich der „Formalen Richtigkeit“). Das hat zur Folge, dass die Benotung derselben Arbeit je nach Prüfer oder Prüfungskommission unterschiedlich ausfallen kann. Klar operationalisierbare Bewertungskriterien (so z.B. Vorgaben bezüglich der Anzahl oder Schwere der Fehler) gibt es nicht.

Wiederholungsfehler sollen – so die Vorgaben – prinzipiell nur einmal angerechnet werden. Dass bedeutet aber, dass nicht unterschieden wird, ob es sich um Fehler handelt, die sich auf Einzelfälle beziehen (ein falscher Artikel, ein falsch gebildeter Plural, eine falsche Deklination), oder ob es um grundlegende Strukturen geht, die nicht beherrscht werden (z.B. die Nebensatzstellung oder die Unterscheidung von Akkusativ und Dativ). Das ist unbefriedigend. Auch wenn die Schwere von Fehlern Meinungsverschiedenheiten unter Prüfern auslösen mag, sollten Fehler nicht erst dann unterschiedlich gewichtet werden, wenn sie Verständnisprobleme verursachen.

Die auf dieser Stufe verlangten Sprachhandlungen können i.d.R. auch mit wenig gefestigten Strukturkenntnissen so bewältigt werden, dass sie noch verständlich sind. Wird das Verständnis bereits etwas beeinträchtigt, erhält der Prüfling 40% Punkteabzug in dieser Kategorie. Beeinträchtigen Fehler an mehreren Stellen das Verständnis erheblich, sind es 60%. Beeinträchtigen sie an vielen Stellen das Verständnis erheblich (wobei in der Schwebe bleibt, worin genau der Unterschied zwischen „mehrere“ und „viele“ liegt), sind es 80%. Erst wenn „der Brief kaum noch verständlich ist“, erhält der Kandidat 0 Punkte.

Die Aussagen des oben zitierten Deskriptors des GeR sind aber bereits dann nicht mehr auf einen Prüfling zutreffend, wenn diesem 40% der Punkte abgezogen werden, da hier eine teilweise Beeinträchtigung des Verständnisses in Kauf genommen wird. Mit anderen Worten: Jegliche Bewertung der „formalen Richtigkeit“, die Verständnisstörungen explizit mit einbezieht, deckt den oben zitierten Deskriptoren (5.2.1.2) für Grammatik nicht mehr ab. [12]

Festzuhalten bleibt, dass der Fehlerspielraum, der dem Prüfling beim Prüfungsteil „Schriftlicher Ausdruck“ des ZD im Bereich „Formale Richtigkeit“ zugestanden wird, insgesamt sehr groß ist.

Weitere Bewertungsskalen des Briefes wie die zur kommunikativen Gestaltung oder zum Textaufbau weisen ebenfalls erhebliche Unschärfen auf. Was genau ist der Unterschied zwischen einer „guten“, einer „angemessenen“ und einer „zum Teil noch angemessenen“ kommunikativen Gestaltung? Was ist, wenn ein Prüfling nur zwei oder drei Konnektoren beherrscht, diese aber richtig anwendet, während ein anderer mit einem größeren Repertoire mehr Fehler macht? Dazu ist den Skalen nichts zu entnehmen. Die Bewertung hängt auch hier vom Fingerspitzengefühl der Prüfer ab. Und von deren Vorbildung, d.h. in diesem Fall von ihrer Erfahrung im Umgang mit Texten. Eine solche ist unerlässlich, wenn es darum geht, Fehler im Textaufbau zu erkennen.

Die Korrekturvorgaben müssten insgesamt eindeutiger und detaillierter sein, um mehr Objektivität erreichen zu können.



-10-

2.2 Anmerkungen zu sprachsystematischen Kompetenzen

Die eben konstatierte hohe Fehlertoleranz in Hinblick auf sprachsystematische Gesichtspunkte kommt allerdings nicht von ungefähr. Sie gründet sich auf die jüngere Spracherwerbsforschung, die gezeigt hat, dass das Auftreten von Fehlern während des Fremdsprachenerwerbs etwas völlig Normales ist und dass bestimmte Fehler in bestimmten Lernphasen regelrecht zu erwarten sind. Man spricht heute von Lernersprachen (interlanguages), die im Laufe des Aneignungsprozesses immer wieder modifiziert werden. Apeltauer (1997: 115) drückt das folgendermaßen aus: „Die Entwicklung einer Lernersprache ist im Idealfall ein Prozess fortschreitender Differenzierung und Restrukturierung, in dessen Verlauf die Fähigkeiten, zielsprachige Äußerungen zu verstehen und zu produzieren, beständig verbessert werden“. Diese Einsicht ist zunächst einmal unumstößlich, kontrovers diskutiert werden kann aber dennoch die Frage, wie viel sprachsystematische Kompetenz zu welchem Zeitpunkt vom Lerner erwartet werden sollte.

Die klassischen Theoretiker der kommunikativen Kompetenz (Hymes, Canale u.a.), aber auch die Autoren des GeR (Kapitel 5.2) subsummieren die grammatische und lexikalische Kompetenz unter die linguistische. Diese wiederum bildet im GeR neben der soziolinguistischen und der pragmatischen Komponente einen integralen Bestandteil der kommunikativen Kompetenz, d.h. all die genannten Komponenten müssen ineinandergreifen, um erfolgreiches „Sprachhandeln“ zu gewährleisten. Das heißt aber, dass im GeR die Sprachsystematik der kommunikativen Kompetenz nicht untergeordnet wird, sondern zu den Bausteinen zählt, die diese konstituieren. Letztendlich erfüllen nicht nur der Wortschatz, sondern auch die Grammatik sinnstiftende Funktionen. Butzkamm & Butzkamm (2004: 274) gehen sogar so weit, in der Grammatik überhaupt den Schlüssel zu menschlicher Phantasie und Freiheit zu sehen. Sie hat eine Art Scharnierfunktion, die es uns erlaubt, „dass wir die fasslich gewordenen Denkinhalte fast nach Gutdünken hin- und herbewegen können.“ “Ohne angemessene Sprachsystematik können die sprachlichen Fertigkeiten nicht entwickelt werden”, möchte ich mit Alyaz & Freibichler (2005: 16) behaupten, für welche “die entscheidende Rolle der Sprachsystematik beim [Fremd]Spracherwerb nach wie vor nicht zu leugnen ist”.

In diesem Zusammenhang ist allerdings einzuräumen, dass eine fehlerhafte Sprachsystematik nicht in allen Fällen zum Fehlschlagen der Kommunikation führen muss: Viele grammatikalisch, lexikalisch, orthographisch oder phonetisch unkorrekte Äußerungen können, wie oben schon angesprochen, verstanden werden und eine hinreichend klare kommunikative Funktion in bestimmten Situationen erfüllen.

Wovon es nun im Einzelnen abhängt, ob bzw. wann Fehler im Bereich der Sprachsystematik die Kommunikation zum Scheitern bringen, ist schwer festzulegen (zur Grammatik vgl. Völzing 1995: 509-527). Sicher wird diese umso wichtiger, je komplexer die Sachverhalte sind, mit denen der Lerner umzugehen hat (dies wurde in die Deskriptoren aufgenommen: Die Komplexität von Kommunikationssituationen wird je nach Kompetenzstufe erhöht). Sie erhält einen höheren Stellenwert beim „Heraustreten aus dem Zeigefeld“, bei Telefongesprächen zum Beispiel, beim Sprechen über Vergangenes, Zukünftiges oder räumlich Entferntes, und allgemein bei abstrakten Inhalten. Sie hängt ganz allgemein vom Präzisionsbedarf einer bestimmten Kommunikationssituation ab.

Wird die kommunikative Kompetenz im produktiven Bereich daran gemessen, ob Äußerungen produziert werden können, die verständlich oder gerade noch verständlich sind, so bedeutet das zwar nicht, dass sprachsystematisch fehlerhafte Aussagen angestrebt würden, es impliziert aber auf jeden Fall, dass solche weitgehend toleriert werden.

Ein Sprecher, der sich nur um die kommunikative Funktion kümmert, kann bei seinen Aussagen alle linguistischen Elemente aussparen, die für die Kommunikation nicht unerlässlich sind. Er kann zum Beispiel die grammatikalischen Morpheme für Geschlecht und Anzahl bei den Adjektiven weglassen, da die Substantive ja bereits Geschlecht und Anzahl angeben[.]



-11-

heißt es bei Da Silva Gomes & Signoret Dorcasberro (2005: 124, Übers. H.G.) wobei anzumerken ist, dass sich die jeweils erlässlichen Elemente von Sprache zu Sprache und von Fall zu Fall unterscheiden können. Sprache, die nur zu kommunikativen Zwecken verwendet wird, erfährt – so ist aus dem Text herauslesen – eine „funktionale Verarmung“. Die Autorinnen (vgl. ebd.: 213) zählen in diesem Zusammenhang die Sprachfunktionen nach J.H. Schumann auf, der neben der kommunikativen auch eine integrative (Zugehörigkeit zu einer sozialen Gruppe) und eine expressive Funktion (z.B. Sprachkunst) erwähnt.

Was die systematische Grammatik auf B1-Niveau betrifft, so treffen wir auf folgende Situation: Über sprachliche Mittel, die für dieses Niveau im Allgemeinen (in Curricula oder Lehrbüchern) veranschlagt werden, muss der ZD-Prüfling nicht unbedingt verfügen, um die in der Prüfung geforderten produktiven Sprachhandlungen erfolgreich ausführen zu können. So ist z.B. bei Profile Deutsch (CD-ROM Version 2.0) für das Niveau B1 unter „systematische Grammatik“ die Deklination der Adjektive im Dativ mit dem Beispielsatz „Das Haus ist in einem schlechten Zustand, [...]“ aufgeführt, hat aber ein Prüfling den Dativ grundsätzlich nicht verstanden und schreibt – „Die Haus ist in schlechte Zustand“, so ist dieser Satz vollkommen verständlich und wird die grammatikalischen Ansprüche der schriftlichen Prüfungsaufgabe erfüllen (vgl. Kapitel 2.1). [13]

Bezüglich der rezeptiven Sprachsystematik liegen die Ansprüche etwas höher; sie wird in einem eigenen Prüfungsteil mit 20 Multiple-Choice-Aufgaben zu Wortschatz und Grammatik geprüft. Auch dieser kann allerdings kein Garant für gute sprachsystematische Kompetenzen sein: Eine geforderte Mindestpunktzahl gibt es nicht, und von der Gesamtpunktzahl der Prüfung entfallen lediglich 10% auf diesen Teil.

Prüft man, wie beim ZD, schwerpunktmäßig nach funktionalen Kriterien, so wird dabei der Tatsache nicht genügend Rechnung getragen, dass sprachsystematische Kompetenzen aufeinander aufbauen. Der Erwerb solcher Kompetenzen in der Grundstufe sollte nicht nur in Hinblick auf deren unmittelbaren Nutzen betrachtet werden, er dient auch als Grundlage für die langfristige Entwicklung einer differenzierteren Sprachbeherrschung.

Ein nicht verstandener Dativ zum Beispiel wirkt sich auf die Deklination von Artikeln, Pronomen oder Adjektiven aus und wird spätestens dann auch die kommunikative Kompetenz beeinträchtigen, wenn es darum geht, in komplexeren Satzgefügen und Texten Bezüge zu erkennen oder herzustellen.

Manche Fachleute, wie z.B. die Prüfungsforscherin Rea-Dickins (2001: 29), vertreten die Auffassung, dass Sprachsystematik speziell in früheren Lernerstadien geprüft werden sollte:

In certain contexts – for example in the earlier stages of language learning [...] it may be highly relevant to have explicit system-focused testing. In these situations, it may be crucial to uncover whether learners have the right packaging at their disposal in order to convey messages approriately. [...] The more indirect approach to assessing grammatical ability, observed above, may be premised on the assumption that the learners (should) have already acquired an adequate command of the language system to package messages appropriately.



-12-

Hier könnte man nun einwenden, dass das ZD ja ein Sprachstandstest ist und dass Institutionen, die mehr Wert auf Sprachsystematik legen, diese in eigenen Lernfortschrittstests prüfen können. Das ist sicher richtig, unterschätzt wird bei diesem Argument aber der washback-Effekt, der von Sprachstandstests ausgehen kann. Rückwirkungen der neuen GeR-basierten Prüfungskonzepte auf Lehrmaterialien und Unterricht sind gegenwärtig überall zu beobachten. Wir leben in einer Bildungslandschaft (und das nicht nur in Mexiko), bei der statistische Werte aller Art immer mehr ins Blickfeld geraten, da Mittel und Ruf (Rankings!) einzelner Institutionen zunehmend von diesen abhängen. „Teaching to the test“ wird da für viele ein Muss, Lernen als „l’art pour l’art“ ein reiner Luxus. Im Zuge dieser Entwicklung ist Quantität (Absolventenzahlen!) oftmals mehr wert als Qualität. Für den Sprachunterricht kann das dann leicht bedeuten, dass nicht gefördert wird, was – in offiziellen Prüfungen – nicht gefordert wird.

Sehr pessimistisch in dieser Hinsicht ist McNamara (2008: 11, Übers. H.G.), der bezüglich des GeR apodiktisch anmerkt: „Und wenn jemand versucht, hinsichtlich Curriculum oder Bewertung irgendetwas in sein Sprachlehrprogramm hineinzunehmen, was nicht in diese Begriffe [des GeR] übersetzt werden kann, so wird dieser Versuch unsichtbar und völlig wertlos“.

Die Tendenz, sprachsystematischen Kompetenzen nicht nur bei Prüfungen, sondern bereits im Unterricht der Grundstufe wenig Bedeutung zukommen zu lassen, lässt sich auch bei anderen Fremdsprachen beobachten. Bezüglich des fremdsprachlichen Englischunterrichts im Schulbereich gibt es eine linguistische Denkrichtung, die offen für „Globalesisch“ als Unterrichtsprinzip eintritt, d.h. für das Erlernen und Prüfen einer Lernersprache mit einfachen kommunikativen Funktionen statt des „Englischen“, wie Schmundt (2008) in seinem Spiegel-Artikel „Die Kunst des Stammelns“ berichtet. Die Frage, die sich angesichts dieses Konzeptes stellt, ist doch, ob Kinder, die angehalten werden, lediglich solch ein rudimentäres Englisch zu erlernen, später ein besseres Englisch noch nachlernen können, falls sie das wollen bzw. eine Notwendigkeit dazu besteht.

Dieselbe Frage muss auch im DaF-Bereich gestellt werden. Können für die Grundstufe veranschlagte sprachsystematische Kompetenzen, die vom Lerner in dieser Phase nicht oder nur bruchstückhaft erworben wurden, zum Bestehen des ZD aber nicht zwingend notwendig sind, später noch nachgelernt oder korrigiert werden?

Erfahrungswerte zeigen, dass eine oft nach jahrelangem Lernen auf Grundstufenniveau fehlerhaft eingeschliffene Sprachsystematik später nur sehr schwer – manchmal auch gar nicht mehr – korrekturfähig ist. Lernersprachen können steckenbleiben, d.h. sich nicht mehr weiterentwickeln, und „unvollständige oder falsche Formen werden sich insbesondere dann verfestigen, wenn ein Lerner seine kommunikativen Absichten mit Hilfe dieser Formen durchsetzen kann“ (Apeltauer 1997: 115) – hinzuzufügen ist wohl auch (in Bezug auf den FU) „seine Prüfungsziele durchsetzen kann“. Bei manchen Lernern wird die Sprachentwicklung auf die unerlässlichen Elemente beschränkt bleiben bzw. fehlerhafte Formen umfassen, weil einfache Kommunikationsziele auf diese Weise erreichbar sind. Solche sich nicht weiterentwickelnden Strukturen der Lernersprache nennt man „Fossilisierungen“. Selinker (1972), Schöpfer des Konzepts, geht davon aus, dass die Lernersprache von rund 95% der Zweit- oder Fremdsprachenlerner langfristig Fossilisierungen aufweist und sich nicht bis zur zielsprachlichen Norm weiterentwickelt. Unterschiede zwischen Lernern liegen dann weniger in der Tatsache begründet, dass sie Fossilisierungen aufweisen, sondern eher in der Frage, in welchem Umfang diese auftreten und in welchem Stadium ihrer interlanguage sie einsetzen.

Die Gründe für das Auftreten von Fossilisierungen mögen vielfältig und nicht in abschließender Weise erforscht sein. Sicher sind sie im Lerner selbst und ebenso im engeren und weiteren Lernumfeld zu suchen (soziopsychologische Aspekte). Sicher kann auch unqualifizierter Sprachunterricht einen Einfluss auf ihr Entstehen ausüben.



-13-

Wichtig ist letztendlich, welche Ziele mit dem Fremdsprachenlernen verbunden sind. So mag das ZD m.E. überall dort ein angemessenes Prüfungskonzept bieten, wo die Fremdsprache zu einfachen kommunikativen Zwecken gelernt wird, für private Kontakte zum Beispiel, für Reisen oder auch für bestimmte Migrationskontexte. Vorbehalte habe ich in Bezug auf den akademischen Bereich, da dort langfristig eine differenziertere Sprachbeherrschung zu Studien- oder Berufszwecken angestrebt wird bzw. angestrebt werden sollte, auf die von Anfang an hingearbeitet werden müsste [14]. Das ZD selbst gibt zwar keine akademische Zielsetzung vor, ist aber die einzige DaF-Prüfung für Erwachsene auf B1-Niveau, die in Mexiko im universitären Bereich überhaupt angeboten wird – Alternativen scheint es für diese Stufe ohnehin nicht zu geben. Die Mehrheit der Prüfungszentren des GI und des (billigeren) ÖSD (8 von insgesamt 13) befindet sich an Universitäten.

2.3 Kann „Kommunikative Kompetenz“ in Anteilen bescheinigt werden?

Sehen wir uns das Bewertungsraster für formale Richtigkeit beim mündlichen Ausdruck noch einmal an: Der Prüfling erhält 0 Punkte, wenn er „so viele Fehler in Syntax und Morphologie [macht], dass die Kommunikation zu scheitern droht bzw. scheitert“. Erhält er einen oder zwei Punkte – nämlich wenn das Verständnis an „mehreren“ oder „vielen“ Stellen erheblich beeinträchtigt ist – wird also nicht davon ausgegangen, dass die Kommunikation scheitert oder zu scheitern droht.

Diese Aussage ist denkwürdig, legt sie doch nahe, dass Kommunikation etwas sei, das aus mehreren Einzelkomponenten bestünde, von denen ein bestimmter Anteil einfach ausfallen dürfe. Wirklich scheitern tut sie nach diesem Verständnis erst dann, wenn der Pegel auf Null gesunken ist.

Kommunikative Kompetenz mag, wie oben ausgeführt, verschiedene einzelne Kompetenzen umfassen, und Kommunikationssituationen aus mehreren hintereinander folgenden Stellen bestehen. Nur dass diese Einzelkompetenzen ineinander übergreifen und einzelne Stellen miteinander verflochten sind. So kann nicht prinzipiell davon ausgegangen werden, dass Kommunikationssituationen auf zufriedenstellende Weise bewältigt werden, wenn in Teilen ihres Umfangs Falschinterpretationen, Missverständnisse, Unverständnis oder Unverständlichkeit auftreten.

In Lese- und Hörtexten sind einzelne Elemente oftmals so miteinander verzahnt, dass ein einziges Missverständnis bereits das Gesamtverständnis in Frage stellen kann. Eine einzige Fehlinterpretation kann auch einen Gesprächsverlauf sensibel stören. Das weiß jeder, der schon einmal einem Gespräch gelauscht hat, bei dem zwei Gesprächspartner – ohne es zu merken – über völlig unterschiedliche Dinge sprechen.

In diesem Zusammenhang sind natürlich Strategien von Bedeutung (die in den Deskriptoren des GeR auch berücksichtigt werden). So kann z.B. durch gezielte Rückfragen das Scheitern der Kommunikation an einer bestimmten Stelle abgewendet werden. Der Einsatz solcher Strategien setzt allerdings immer schon voraus, dass Interaktionspartner sich potentieller Missverständnisse bewusst sind. Darüber hinaus wird er von Persönlichkeitsmerkmalen (schüchterne Personen werden seltener nachhaken) oder kulturellen Eigenheiten abhängen (manche Lerner erachten es als unhöflich, ältere oder ranghöhere Gesprächspartner zu unterbrechen) und ist insofern nicht einfach zu prüfen.

Auch aus den Deskriptoren des GeR lässt sich ersehen, dass Kommunikationssituationen häufig nicht aufteilbar sind. Viele Kann-Bestimmungen lassen nämlich nur zwei Möglichkeiten offen: Entweder man kann das, was dort beschrieben wird, oder man kann es nicht. So z.B.:

4.4.2.1 Hörverstehen allgemein.

Ankündigungen, Durchsagen und Anweisungen verstehen. B1: […] Kann detaillierten Wegbeschreibungen folgen.



-14-

Versteht der Lerner nur ein Detail der Wegbeschreibung falsch (verwechselt er zum Beispiel die Wörter „rechts“ und „links“), wird er wahrscheinlich nicht ans Ziel gelangen.

Hier zeigt sich, was für ein schwieriges Unterfangen es ist, kommunikative Kompetenz als solche prüfen und anhand von Deskriptorentabellen beschreiben und verbürgen zu wollen. Prüfungen mögen Kompetenzen überhaupt nur ausschnittweise abfragen können, doch wie verhalten sich dann zum Beispiel die Ergebnisse eines Kandidaten, der die Prüfung mit 60% besteht, der also nur Ausschnitte des Ausschnitts beherrscht bzw. erhebliche „Kommunikationslücken“ aufweist, zu Deskriptoren, deren Aussagen entweder zutreffen oder nicht, aber keine Halbwerte zulassen? Kommunikative Kompetenz auch dort verbürgen wollen, wo nicht alle ihrer Komponenten sicher gewährleistet werden können, ist eigentlich ein Widerspruch.

2.4 Braucht der Lerner professionellen DaF-Unterricht? Implikationen des Faktors „Zeit“

Wenden wir uns nun dem Faktor „Zeit“ zu, das heißt, der Frage, wie viele Kursstunden ein Lerner benötigt, um das ZD bestehen zu können. Nicht möglich ist, eine bestimmte Anzahl an Stunden allgemeingültig vorgeben zu wollen, da das Lernumfeld sowie die soziokulturellen und persönlichen Voraussetzungen der einzelnen Lerner sich stark voneinander unterscheiden.

In einer prüfungsvergleichenden Zeittabelle geht Bauer (2007: 31, 38-39) für das Zertifikat von 360 bis 450 Unterrichtseinheiten (à 45 Minuten) beim Lernen im Zielsprachenland (Immersion) aus, von rund 650 Einheiten im Land der Lerner (keine Immersion) und von mehr als 1200 Einheiten unter problematischen Bedingungen. In Mexiko wird das ZD, je nach Institution und Lerner, wenn überhaupt, dann oft erst nach 750-950 Zeitstunden (à 60 Minuten) abgelegt [15], was 1000 oder mehr Unterrichtseinheiten à 45 Minuten entspricht. Das Pendel schlägt also schon in Richtung „problematische Bedingungen“ aus, zu denen Bauer (ebd.: 38) u.a. nicht ausgebildete Lehrkräfte, ungeeignete Lehrstrukturen, nicht aktualisierte Materialien und ungeeignete Methoden zählt.

Die Interlanguage-Theorie zeigt uns, dass Lernersprachen (mit den dazugehörigen Fehlern) etwas Natürliches sind. Sie macht aber keine Aussagen darüber, für wen und über welchen Lernzeitraum welcher Stand der Lernersprache noch als Übergangsphase zu betrachten ist, bzw. ab wann bereits von Fossilisierungen gesprochen werden kann, von Lernersprachen also, die sich nicht mehr weiterentwickeln.

Zu fragen ist, ob nach einem unverhältnismäßig langen Lernzeitraum auf Grundstufenniveau ein hohes Fehlerniveau noch als Durchgangsstadium betrachtet werden kann. Möglicherweise handelt es sich dabei schon längst um Fossilisierungen, d.h. um Fehler, die sich dauerhaft verfestigt haben.



-15-

Mit anderen Worten: Angesichts eines funktionalen Ansatzes, bei dem die Bewältigung von kommunikativen Aufgaben geprüft wird, welche auf diesem Niveau auch ohne gefestigte sprachsystematische Kompetenzen erfolgreich gelöst werden können, muss angenommen werden, dass die ZD-Prüfung in einigen Fällen ein bereits fossilisiertes Lernerstadium zertifiziert, das ein weiteres Voranschreiten zu anspruchsvolleren sprachlichen Kompetenzen und Sprachprüfungen gar nicht mehr erlaubt. Diesen Zusammenhang vermute ich vor allem dort, wo nach langen Lernzeiten lediglich ein ausreichender oder befriedigender ZD-Abschluss erreicht wird. Gestützt wird meine Vermutung von der Sachlage, dass in Mexiko nur ein verschwindend geringer Anteil an ZD-Absolventen nach der Prüfung weiterlernen bzw. eine Prüfung auf höherer Kompetenzstufe (B2) [16] erfolgreich ablegen.

Das ZD macht keine Prognosen über zukünftige Entwicklungen der Lerner, einen Einfluss auf institutionelle Lernumfelder übt es nichtsdestotrotz aus. Keine Aussagen machen ist gleichbedeutend mit gewähren lassen. Eine B1-Prüfung, die bezüglich der Beherrschung der für das Grundstufenniveau veranschlagten sprachsystematischen Kenntnisse strengere Maßstäbe ansetzen würde, würde der Zertifizierung von Fossilisierungen zumindest stärker entgegenwirken, was wiederum einen Einfluss auf das Unterrichtsgeschehen hätte.

Meine These lautet, dass von der ZD-Prüfung in ihrer aktuellen Form keine Impulse zur Professionalisierung des Fachbereichs DaF in Mexiko ausgehen. Denn eine Professionalisierung [17] mag aus institutioneller Sicht überflüssig erscheinen, da Teilerfolge [18] auch unter Beibehaltung des Status Quo erzielt werden können.

2.5 Die Einbettung von Prüfungen in ideologische Interessen

Die Rolle von offiziellen Sprachprüfungen – das ist heute unter Fachleuten ein Gemeinplatz – geht weit über ihre Qualifikations- und Selektionsfunktionen hinaus. „Tests, [...] are not neutral but rather embedded in political, social, educational, ideological and economic contexts“, konstatiert Shohamy (2001: 114).

Sucht man nach solchen ideologischen Kontexten, so stößt man angesichts der gegenwärtigen Tendenz, das Prüfungsgeschehen weltweit auf die Standards des GeR einzuschwören, bald auf die Frage nach demokratischen Entscheidungsprozessen. Haben denn Lehrkräfte und Institutionen sich überall freiwillig für diese Standards entschieden? Oder bedarf es dazu bildungspolitischer Überzeugungsarbeit bzw. schlichtweg des Zwangs von oben? Sehr deutliche Worte findet McNamara vom Language Testing Research Center, University of Melbourne, Australien. Er zeigt sich äußerst skeptisch, was die Überzeugungsarbeit im Bildungssektor angeht:

Wenn die Lehrkräfte über die Standards [des GeR] unterrichtet werden, wird ihnen gesagt, dass es deren Zweck sei, den Lehrer zu unterstützen und die Studenten zu unterstützen. Das stimmt aber nicht: Ihr Zweck besteht darin, die Verwaltung des Systems zu unterstützen (2008: 8, Übers. H.G. [19]).

Und mit System – so meine Interpretation – sind hier globale politische und wirtschaftliche Interessen gemeint, die auf die Hilfe von bildungspolitischen Weichenstellungen angewiesen sind. Der GeR ist folglich ein Instrument, das laut McNamara (vgl. ebd.: 11) denjenigen Macht verleiht, die darauf bestehen, dass Prüfungsergebnisse in Form einer Reihe an Behauptungen präsentiert werden.

Und dieses Instrument, so konstatiert er, mutiert zunehmend zum einzigen, was beim Sprachunterricht und folglich bei der Leistungsbewertung – weltweit – noch zählt! „Das ist gar nicht gesund; überhaupt nicht gesund“, klagt der Forscher.



-16-

Dieser Einschätzung möchte ich mich anschließen. Es wird zwar immer wieder beteuert, dass der GeR nichts vorschreibe und die Entscheidungsgewalt bezüglich Lehrplänen und Unterrichtsgestaltung bei den Fachbereichen bzw. Kursanbietern bleibe. Das stimmt so aber nicht. Es gibt ja gar keine offizielle DaF-Prüfung mehr, deren Inhalte und überprüftes Kompetenzniveau nicht mit den Kann-Beschreibungen des GeR in Beziehung stehen würden – allein das schränkt den Entscheidungsspielraum von vorneherein ein. Wenn sich außerdem auf institutioneller Ebene ein Druck hin zu mehr vorzeigbarer Effizienz – in Form von bestandenen offiziellen Prüfungen [20] - abzeichnet, so ergibt sich daraus praktisch zwangsweise, dass Lehrpläne und Unterricht weitgehend auf die Prüfungsansprüche zugeschnitten und an die dort zugrundeliegenden (GeR-basierten) Kriterien angepasst werden. Entscheidungsfreiheit bleibt den einzelnen Lehrkörpern dann nur noch in Hinsicht auf Details.

Es geht hier nicht darum, den Deskriptorentabellen Nützlichkeit abzusprechen, der GeR und dessen Standards sind sicher in vielerlei Hinsicht und in vielen Kontexten nützlich und anregend. Das Erschreckende ist wohl, dass der Rahmen im Begriff ist, sein erklärtes Ziel der Vergleichbarkeit nationaler Lehr-, Lern- und Testtraditionen im Fremdsprachenunterricht, so umfassend zu erreichen, dass – trotz gegenteiliger Beteuerungen – eine Tendenz hin zur Gleichschaltung besteht. Die Frage ist auch, wer in Zukunft noch die Macht haben wird, etwaige Änderungen am GeR und den Deskriptoren (mit Auswirkungen auf offizielle Prüfungen und daran angelehnte Lehrpläne) durchzusetzen. Im Moment sieht es so aus, als ob dies nur noch von oben, das heißt seitens des Europarates geschehen könne.

Für McNamara (ebd.: 12, Übers. H.G.) bedeutet all das eine Art geistige Verengung im Bereich der Fremdsprachenlehre: „Es begrenzt unser Nachdenken bezüglich der Ziele des Fremdsprachenunterrichts. Es begrenzt unser Nachdenken bezüglich der Dinge, die wir sonst noch von den Lernern erwarten möchten.“

Das ist der ideologische Rahmen, innerhalb dessen sich auch das ZD bewegt, ja in der Gegenwart bewegen muss, um bestehen zu können.

Auch die finanziellen Interessen, mit denen offizielle Prüfungen verbunden sind, liegen jenseits von deren Selektions- oder Qualifikationsfunktion. Eine Frage, die selten gestellt wird und die wir in diesem Zusammenhang lediglich in den Raum stellen möchten, ist die folgende: Wie verhält sich die Tatsache, dass offizielle Prüfungen „verkäufliche Produkte“ sind, zum Design, zur Durchführungsobjektivität und zu den Bewertungsparametern dieser Prüfungen, aber auch zur Vorbildung der Prüfer? Anzunehmen ist doch, dass es für Prüfungsanbieter betriebswirtschaftlich erstrebenswert ist, an möglichst vielen Orten möglichst viele Prüflinge zu prüfen. Und dabei mag es auch vorteilhaft sein, wenn möglichst viele Anwärter die Prüfungen bestehen. Hier gibt es im DaF-Bereich sicher noch Forschungsbedarf.

3. Wer trägt die Verantwortung für die Nutzung von ZD-Prüfungsergebnissen in der mexikanischen Berufswelt?

Die positiv formulierten Kann-Beschreibungen als zentrale Parameter beim Prüfungsgeschehen dienen u.a. dem Zweck, das Selbstvertrauen des Prüflings zu stärken, indem man sich nicht auf noch vorhandene Defizite, sondern eben auf das konzentriert, was schon „gekonnt“ wird. So weit, so gut. Gefragt werden muss dennoch, ab welchem Punkt das Zertifizieren früher Stadien einer interlanguage sinnvoll ist bzw. welchem Zweck diese dienen soll oder wird. Prüfungen werden ja in der Regel nicht nur zur Selbstbestätigung oder Selbstmotivierung abgelegt, sondern sind – das zeigen zumindest informelle Umfragen in Mexiko – mit der Hoffnung auf eine bessere Positionierung auf dem Arbeitsmarkt verbunden. Nun stellt das ZD für viele mexikanische Lerner den glorreichen Abschluss ihres Lernweges der deutschen Sprache dar, nur ein Bruchteil legt auch noch eine Prüfung auf höherer Kompetenzstufe (B2) ab. Mit anderen Worten: Der Arbeitsmarkt trifft vor allem auf A2– oder B1–Absolventen. Infolge eines Mangels an qualifizierten deutschsprachigen Fachkräften in Sprach- bzw. Sprachmittlerberufen (und natürlich auch aus finanziellen Gründen) werden diese unter anderem mit folgenden Aufgaben betraut: Erteilung von Deutschkursen, Firmenkorrespondenz oder Übersetzungen. Mir ist sogar ein Fall bekannt, in dem ein B1-Absolvent zum Leiter der Deutschabteilung einer großen Privatuniversität ernannt wurde.



-17-

Sprachprüfungen und deren Ergebnisse wirken nicht nur auf den Sprachunterricht zurück (washback-Effekt), sondern auch in das soziale Umfeld hinein, was vor allem in der nordamerikanischen Forschung unter dem Stichwort consequential validity (Messick 1989) diskutiert wird: „[...] Messick also explicitly advanced a critical role for value implications and social consequences, particularly evaluation of intended and unintended social consequences of test interpretation and use, as part of test validity“ referiert Kunnan (2005: 780). In diesem Zusammenhang ist nicht nur in Betracht zu ziehen, wer sich der Prüfungsergebnisse zu welchem Zweck bedient, es muss auch der Frage nach der Verantwortlichkeit für beabsichtigte und nicht beabsichtigte Folgeerscheinungen nachgegangen werden:

„The responsibility of the language testers ist clear: we must accept responsibility for all those consequences which we are aware of“, lautet die Stellungnahme von Liz Hamp-Lyons zu diesem Thema (zit. nach Shohamy 2001: 117). Diese Argumentationsweise impliziert, laut Shohamy (ebd.), auch die Möglichkeit „to impose sanctions, punish and forbid the use of tests which are misused [...]“.

Das geht meiner Meinung nach zu weit. In vielen Ländern müssten offizielle Sprachprüfungen dann gleich ganz abgeschafft werden, weil ihre Ergebnisse regelmäßig zweckentfremdet genutzt werden. Doch es kommt ja auch niemand auf die Idee, von Autoherstellern zu verlangen, keine Autos mehr zu produzieren, nur weil manche Leute mit diesen Unfälle verursachen.

In Bezug auf das ZD und dessen Nutzung in Mexiko möchten wir uns an die Ausführungen von Davies (1997: 335) und Farhady (1998) anlehnen, die nicht davon ausgehen, dass Prüfungsanbieter für alle möglichen sozialen Folgen rund um die von ihnen angebotenen Prüfungen aufkommen können. „What kind of use the agencies would make from the test scores is often a matter of sociopolitical concerns rather than an academic endaevor“, konstatiert Farhady (1998: 11).

Ein Nachweis über die Fähigkeit als Sprachlehrer oder Sprachmittler zu arbeiten ist mit dem ZD sicher nicht verbunden und wird seitens der Prüfungsanbieter nicht behauptet. Die Art der Nutzung, die die Prüfungsergebnisse des ZD erfahren und die in dieser Form von den Anbietern nicht beabsichtigt ist, ergibt sich aus der Eigendynamik eines spezifischen soziokulturellen Kontextes. Nachfolgend möchte ich einige Gründe auflisten, warum die Prüfungsanbieter nicht für alle in Mexiko mit dem ZD verbundenen Folgen einstehen können:

  • Die Nutzung der Ergebnisse findet innerhalb eines spezifischen politisch-rechtlichen, d.h. nationalstaatlichen Systems statt, innerhalb dessen die europäischen Prüfungsanbieter keine Entscheidungsbefugnis haben.
  • Entscheidungen bezüglich der Einstellung von ZD-Absolventen für bestimmte berufliche Tätigkeiten werden auf der Ebene einzelner Institutionen (Bildungsinstitutionen oder Unternehmen) und dort oftmals von Einzelpersonen getroffen. Es handelt sich also um eine Vielzahl an individuellen Entscheidungsträgern. Überinstitutionelle Entscheidungsträger stehen insofern nicht als Ansprechpartner zur Verfügung.
  • Die Tatsache, dass ZD-Absolventen zu den oben erwähnten Tätigkeiten herangezogen werden, hat in der Regel wenig oder gar nichts mit konkreten Merkmalen des ZD zu tun. Angesichts eines Marktes, auf dem das Angebot an qualifizierten Fachkräften der Nachfrage an Deutschkursen deutlich hinterherhinkt, geht es vielen Kursanbietern darum, überhaupt jemanden zu finden, der einen Nachweis über Deutschkenntnisse vorlegen kann. Hat man die Wahl zwischen einem B1- und einem A2-Absolventen, wird man ersteren bevorzugen. In einigen Fällen wird auf einen solchen Nachweis aber auch ganz verzichtet.


-18-

„In spite of the fact that language testers are at the center of the process of language testing, they do not have direct access to the parameters of decision-making. Politicians, educators, bureaucrats, and so many other sectors in the society are in the position to make decisions“, können wir das Vorgesagte mit Farhady (1998: 16) zusammenfassen.

Ganz aus der Mangel genommen werden können die Prüfungsanbieter dennoch nicht. In ihrer Auflistung verschiedener wissenschaftlicher Positionen zum Thema, nennt Shohamy (2001: 116) auch die folgende, der ich mich anschließen möchte:

[...] the only responsibility a tester has with regards to the use of tests is to point out to society the intentions, effects and consequences of tests. Accordingly, the role of the tester is to collect data about dimensions and aspects of use and make this information known and accessible to the users and the public at large.

Es gilt also, einer inadäquaten Nutzung von Prüfungsergebnissen so weit wie möglich vorzubeugen, indem aussagekräftige und detaillierte Beschreibungen des entsprechenden Kompetenzniveaus verbreitet werden. Auch über Sinn und Zweck der Prüfung sollten die Nutzer sehr konkrete Informationen erhalten.

Wird denn in den Werbeschriften der Prüfungsanbieter eine berufliche Verwertbarkeit der B1-Sprachkompetenzen versprochen und wenn ja, in welchem Rahmen? Zu Beginn dieser Arbeit sahen wir bereits, dass sich das GI diesbezüglicher Aussagen ganz enthält, das ÖSD im ZD aber einen „Nachweis der Fähigkeit zur selbstständigen Sprachverwendung in Alltags- und Berufssituationen“ (http://www.osd.at) sieht. Diese Aussage wird nicht weiter erläutert, was vielerlei Interpretationsmöglichkeiten offen lässt. Es sind sicher Berufssituationen denkbar, die ein Lerner auf B1-Niveau meistern kann, so etwa Empfangs- oder Bedienungstätigkeiten im touristischen Bereich oder Gaststättengewerbe. Es sind aber eben auch viele andere Berufssituationen denkbar, in denen die vom ZD bescheinigten Kompetenzen durchaus nicht ausreichend sein werden, denn Berufssituationen können ja – wie wir eingangs schon feststellten – völlig Unterschiedliches beinhalten.

Rückendeckung erhält das ÖSD in diesem Zusammenhang von den Deskriptorentabellen des Referenzrahmens, denen in Bezug auf die Nutzung der Prüfungsergebnisse ein besonderer Stellenwert zukommt: Für viele potentielle Arbeitgeber sind sie nämlich die einzige Informationsquelle, die in einer ihnen verständlichen Sprache (hier Spanisch) abgefasst ist. Tatsächlich wird man in diesen Tabellen an vielen Stellen fündig, immer wieder ist die Rede von „berufsbezogenen Themen“ „eigenem Fachgebiet“ usw., wobei auch die dortigen Aussagen oft wenig präzise sind. Hier nur ein Beispiel von vielen:

4.4.1.2 B1: Berichte und Aufsätze schreiben: [...] Kann im eigenen Sachgebiet mit einer gewissen Sicherheit größere Mengen von Sachinformationen über vertraute Routineangelegenheiten und über weniger routinemäßige Dinge zusammenfassen, darüber berichten und dazu Stellung nehmen.

Was bedeutet „mit einer gewissen Sicherheit“? Verwirrend ist auch, dass Sachinformationen über routinemäßige und weniger routinemäßige Dinge gleichzeitig einbezogen werden. Dass das Zusammenfassen von Informationen vielen Lernern selbst in der Muttersprache Schwierigkeiten bereitet, ist nicht mitbedacht worden.



-19-

Zusammenfassend kann festgestellt werden, dass der GeR für diese Stufe tatsächlich ein relativ umfassendes berufliches Sprachhandlungsvermögen vorsieht, solange es sich um „unkomplizierte Inhalte“ und „einfache Standardsprache“ handelt. Was genau unter diesen Konzepten zu verstehen ist, bleibt wiederum den Interpretationen der einzelnen Nutzer überlassen.

Dem ZD (bzw. der Kompetenzstufe B1) auf unspezifische Art und Weise berufliche Verwertbarkeit zu bescheinigen, halte ich für sehr gewagt. Nicht nur, weil es so viele verschiedene Berufswelten wie Berufe gibt, jede mit ihrem eigenen sprachlichen Anforderungsprofil, sondern auch weil es im Arbeitsleben immer wieder zu Situationen kommt, in denen präzises Erfassen oder Produzieren von mündlicher oder schriftlicher Information von großer Bedeutung sein – und Missverständnisse mitunter erheblichen (wirtschaftlichen) Schaden anrichten können.

Dass im täglichen Berufsleben solche, sprachliche Genauigkeit erfordernde Situationen von anderen, „unkomplizierten, auf einfacher Standardsprache basierenden“, immer klar getrennt werden können, um den „Deutschkönner auf B1-Niveau“ nicht zu überfordern, wage ich zu bezweifeln. Insofern können berufsbezogene Aussagen bezüglich des Kompetenzniveaus dazu führen, dass bei Lernern und Arbeitgebern falsche Erwartungen geweckt werden.

Da nicht sichergestellt werden kann, dass potentielle Arbeitgeber die Internetseiten der Prüfungsanbieter einsehen, sollten wichtige Information (mitsamt einschlägiger Internetadressen) dort angebracht werden, wo sie am leichtesten zu finden ist: Als Anhang zur Prüfungsurkunde oder auf deren Rückseite. Angesichts der Tatsache, dass Prüfungsergebnisse immer wieder zweckentfremdet verwendet werden, bleibt den Prüfungsanbietern immerhin der Spielraum, ausdrücklich darauf hinzuweisen, welche Art von Kompetenzen das Niveau nicht bescheinigt – auch wenn dabei der Grundsatz der „positiven Formulierungen“ einmal zurückgestellt werden müsste.

4. Ausblick

Wer am Busbahnhof in Puebla ankommt, stößt auf mehrere große Schilder mit folgendem Wortlaut:

Fur Ihre eigene sicherheit benutzen und kontrollierten Taxis durch CAPU. Kaufen Sie Ihre Ticket direkt am Schalter.

Diese Sätze entsprechen den Kriterien des schriftlichen Ausdrucks B1, d.h. denkbar ist, dass sie von einem ZD-Absolventen verfasst wurden: Sind sie doch der „unkomplizierten Alltagssprache“ zuzurechnen und gerade noch verständlich, vor allem wenn man den unmittelbaren Kontext (neben einem Schalterhäuschen stehen Taxis in der Warteschlange, allesamt mit der Aufschrift „CAPU“) zu Hilfe nimmt. Reicht es nun aber in dieser Situation aus, wenn die Aussage verständlich ist? Mitnichten! Es muss in Betracht gezogen werden, dass der Busbahnhof für viele deutschsprachige Besucher der erste Anlaufpunkt in Puebla ist, also eine Art Repräsentativfunktion hat. Diese Schilder tragen zu einem ersten Eindruck von Stadt und Bewohnern bei und führen bei manch einem auch zu einem ersten Urteil. Unkomplizierte Inhalte und einfache Standardsprache? Ja! – Dennoch wird diese Kommunikationssituation von B1-Beschreibungsbarometern nicht erfasst!

Das Beispiel zeigt, wie groß das Vertrauen in Deutschlerner und deren Diplome sein kann. Hier wurde eine sicher nicht unbedeutende Summe ausgegeben, ohne daran zu denken, den sprachlichen Inhalt der Schilder überprüfen zu lassen.

Am Beispiel des ZD hoffe ich deutlich gemacht zu haben, dass man sich nicht vom Glanz des neuen Prüfungskonzeptes blenden lassen sollte. Die Prüfung ist durchaus noch verbesserungsfähig, und ihre Ergebnisse spiegeln sich nicht durchweg in den Kann-Beschreibungen des GeR, ebenso wenig können letzere ein sicheres Profil von Prüfungsabsolventen liefern. Anzunehmen ist, dass diese Befunde auch für andere GeR-basierte Fremdsprachenprüfungen symptomatisch sind. Bei der gegenwärtig zu beobachtenden Expansionsdynamik solcher Prüfungen in Mexiko, die sich u.a. in neuen DaF-Prüfungszentren niederschlagen, aber auch in intensiver Überzeugungsarbeit mittels Konferenzen und Kursen zum GeR, wird überspielt, dass wir uns mit all dem eigentlich immer noch in der Versuchsphase befinden. Kritische Stimmen scheinen angesichts des vorherrschenden Trends nicht wirklich erwünscht zu sein, sollten aber keinesfalls verstummen.



-20-

Literatur

Adkins Wood, Dorothy (1990), Elaboración de tests. Mexiko: Trillas.

Altmayer, Claus (2004), Sprachkultur und Mehrsprachigkeit: Neuerscheinungen zur europäischen Sprachenpolitik (Teil 3). Zeitschrift für Interkulturellen Fremdsprachenunterricht 9: 2, 10 S. [Online: http://spz1.spz.tu-darmstadt.de/projekt_ejournal/jg-09-2/beitrag/sprachenpolitik2.htm. Dezember 2008.]

Alyaz, Yunus & Freibichler, Hans (2005), Software für computergestütztes Sprachenlernen auswählen, 38 S. [Online: http://www.fts-heidelberg.de/18-K-5-10.pdf. Dezember 2008.]

Apeltauer, Ernst (1997), Grundlagen des Erst- und Fremdsprachenerwerbs. Fernstudieneinheit 15. München: Langenscheidt.

Bauer, Ulrich (2007), Profesionalismo y éxito en la enseñanza del alemán en México. In: AMPAL/DAAD/UNAM (Hrsg.) (2007), El idioma alemán en México. Medio de enlace, oportunidades y prestigio. Hacia un futuro trilingüe. Mexiko: o.V., 29-43.

Butzkamm, Wolfgang & Butzkamm Jürgen (2004), Wie Kinder sprechen lernen. Kindliche Entwicklung und die Sprachlichkeit des Menschen. Tübingen, Basel: Francke.

Clalüna, Monika (2004), Gerahmte Sprachen? Zum Gemeinsamen Europäischen Referenzrahmen für Sprachen. DaF-Brücke 6, 24-27.

Da Silva Gomes, C. Helena María & Signoret Dorcasberro, Aline (2005), Temas sobre la adquisición de una segunda lengua. Mexiko: Trillas.

Davies, Alan (1997), Demands of being professional in language testing. Language Testing 14: 3, 328-339.

Europarat (2001), Gemeinsamer europäischer Referenzrahmen für Sprachen: Lernen, lehren, beurteilen. Berlin: Langenscheidt. [Online: http://www.goethe.de/z/50/commeuro/deindex.htm. Oktober 2009.]

Farhady, Hossein (1998), Ethics in Language Testing. Vortrag am Summer Institute on The Social Responsibility of Language Testers, Carleton University, Ottawa (Manuskript).   [Online: http://www.aua.am/academics/ dep/hf_publications/4 Ethics.pdf. Juni 2009.]

Glaboniat, Manuela; Müller, Martin; Rusch, Paul; Schmitz, Helen & Wertenschlag, Lukas (2008), Profile Deutsch. Lernzielbestimmungen, Kann-Beschreibungen und kommunikative Mittel für die Niveaustufen A1, A2, B1, B2, C1 und C2 des „Gemeinsamen europäischen Referenzrahmen für Sprachen“. Buch und CD-ROM. München: Langenscheidt.

Grotjahn, Rüdiger (2007), Testen und Prüfen: Aktuelle Tendenzen. Neue Beiträge zur Germanistik 6: 2, 19-38.



-21-

Hamps-Lyon, Liz (1998), Ethical test preparation practice: The case of the TOEFL. TESOL Quarterly 32: 2, 329-337.

Klatt, Karola (2008), Lernen auf einem anderen Stern. Kulturaustausch 58: 4, 81.

Kunnan, Antony John (2005), Language assessment from a wider context. In: Hinkel, Eli (Hrsg.) (2005), Handbook of Research in Second Language Teaching and Learning. Mahwah, New Jersey: Lawrence Erlbaum, 779-794.

McNamara, Tim (2008), Language Assessment as Social Practice. Vortrag vom 05. August 2008 beim IV Coloquio CELU, Universität San Martín, Buenos Aires (Manuskript). [Online: http://www.celu.edu.ar/images/ stories/pdf/McNamara_conferencia_.pdf. Oktober 2009.]

Messick, Samuel (1989), Validity. In: Linn, Robert (Hrsg.) (1989), Educational Measurement. New York: Macmillan, 13-103.

Österreichisches Sprachdiplom Deutsch (ÖSD) (2004), Allgemeine Informationen zu den ÖSD-Prüfungen. Wien: ÖSD. [Online: http://www.osd.at. Oktober 2009.]

Rea-Dickins, Pauline (2001), Fossilisation or evolution: The case of grammar testing. In: Elder, Catherine et al. (Hrsg.) (2001), Experimenting with Uncertainty. Essays in Honour of Alan Davies. Cambridge: Cambridge University Press, 22-32.

Schifko, Manfred (2001), Prüfungen, Zertifikate, Abschlüsse als Planungskategorien für den Unterricht. In: Helbig, Gerhard; Götze, Lutz; Henrici, Gert & Krumm, Hans-Jürgen (Hrsg.) (2001), Deutsch als Fremdsprache. Ein internationales Handbuch (2. Bd.). Berlin, New York: de Gruyter, 827-834.

Schmidt, Maria Gabriela (2007), EU-Sprachenpolitik, die Rolle der deutschen Sprache und der Gemeinsame Europäische Referenzrahmen. Konzept von „oben“ – Praxis von „unten“. Mit einem Blick nach Japan. Neue Beiträge zur Germanistik 6: 2, 116-132.

Schmundt, Hilmar (2008), Die Kunst des Stammelns. Spiegel Online [Online: http://www.spiegel.de/spiegel/ 0,1518,544420,00.html. März 2008.]

Selinker, Larry (1972), Interlanguage. IRAL 10: 2, 209-231.

Shohamy, Elana (2001), The social responsibility of the language testers. In: Cooper, Robert L.; Shohamy, Ela–na & Walters, Joel (Hrsg.) (2001), New Perspectives and Issues in Educational Language Policy. In Honour of Bernard Dov Spolsky. Amsterdam, Philadelphia: John Benjamins, 113-130.

Völzing, Paul-Ludwig (1995), Wieviel Grammatik brauchen Lehrer und Schüler? Grammatik im fremdsprachlichen Unterricht. Info DaF 22: 5, 509-527.



-22-

Anmerkungen

[1] In diesem Text werden die Begriffe “Deskriptorentabellen”, “Kann-Beschreibungen” und “Skalen” synonym verwendet.

[2] Laut Altmayer (2004: 3) kamen die Spezialisten, die auf der 22. Frühjahrskonferenz zur Erforschung des Fremdsprachenunterrichts zum Ansatz des GeR befragt wurden, praktisch einhellig zu dem Ergebnis, dass “Eine eigene fremdsprachenlerntheoretische Position [...] nicht erkennbar [sei], sie sei allenfalls inkohärent, eklektisch, vage oder unverbindlich“.

[3] Weitere Trägerinstitutionen des ZD sind die Universität Fribourg (CH) und Weiterbildungs-Testsysteme / TELC. Da in Mexiko aber nur das GI und das ÖSD als ZD-Anbieter operieren, beschränken sich die Ausführungen der vorliegenden Arbeit auf diese zwei Institutionen.

[4] Siehe dazu Glaboniat, Manuela; Müller, Martin; Rusch, Paul; Schmitz, Helen & Wertenschlag, Lukas (2008), Profile Deutsch. Lernzielbestimmungen, Kann-Beschreibungen und kommunikative Mittel für die Niveaustufen A1, A2, B1, B2, C1 und C2 des „Gemeinsamen europäischen Referenzrahmen für Sprachen“. Buch und CD-ROM. München: Langenscheidt.

[5] Z.B. eine detaillierte Analyse der Bewertungsparameter beider Anbieter (Anzeichen zu Unterschieden bestehen), sowie der konkreten Handhabung vor Ort (Wie und in welchem Ausmaß greifen die Prüfer in das mündliche Prüfungsgespräch ein? Kennen die Prüfer die Prüflinge? u.a.). Darüber hinaus wäre auch zu untersuchen, welches fachliche Ausbildungsprofil die Prüfer beider Anbieter haben, außerdem müsste der Schwierigkeitsgrad der Aufgaben der einzelnen Prüfungssätze verglichen werden.

[6] Auf diese Unterscheidung werde ich nachfolgend aber nicht weiter eingehen, da im hiesigen Zusammenhang ausschlaggebend ist, dass die Gesamtheit aller Deskriptoren die Niveaustufe beschreiben soll.

[7] Profile Deutsch (2.0, Info zu Kann-Beschreibungen [CD-ROM]).

[8] Das ist u.a. der Fall bei den monologischen Kompetenzen des Lerners (mündlicher Ausdruck 4.4.1.1.); seinen audiovisuellen Kompetenzen (Verstehen von Fernsehsendungen und Filmen 4.4.2.3.) sowie seiner Fähigkeit, Konferenzen und Vorträge zu verstehen (Hörverstehen 4.4.2.1.).

[9] Sinngemäß: Wer viel umfassen möchte, hält wenig wirklich fest.

[10] Der GeR sieht nicht die klassischen vier, sondern acht Fertigkeitsbereiche vor, die dort allerdings “Aktivitäten” genannt werden: Produktion, Rezeption, Interaktion, Sprachmittlung, jeweils mündlich und schriftlich, wobei die Sprachmittlung nicht in Deskriptoren-Form aufgeschlüsselt ist.

[11] In diesem Unterkapitel am Beispiel der Vorgaben des Goethe-Instituts, da diese im Internet öffentlich zugänglich sind, die des ÖSD sind m.E. ähnlich. Vgl. http://www.goethe.de/lrn/prf/pro/ZD_Prueferbl_UES04.pdf Übungssatz 04, Prüferblätter, S. 10 u. 17. Siehe ebenso: Prüfungsordnung ZD.



-23-

[12] Bei anderen Deskriptoren zur Sprachsystematik mag es sich analog verhalten, ich habe die Grammatik hier nur als Beispiel ausgewählt und nicht alle einschlägigen Deskriptoren untersucht.

[13] Die Adjektivdeklination im Dativ ist auch folgerichtig in der funktionalen Grammatik der Niveau-Stufe bei Profile Deutsch nicht zu finden. Es soll im Übrigen hier nicht unterstellt werden, dass Profile Deutsch diese oder andere grammatikalische Elemente verbindlich vorschreiben wolle. Das Werk (CD-ROM Version 2.0, Grammatikübersicht) erhebt „nicht den Anspruch zu benennen, welche Strukturen ein Lerner auf einem bestimmten Niveau fehlerfrei anwenden kann oder können soll“.

[14] In einer vom DAAD in Auftrag gegebenen Studie wurde festgestellt, dass rund 50% der ausländischen Studenten in Deutschland ihr Studium abbrechen. Einer der Gründe wird in unzureichenden Sprachkenntnissen gesehen, und das trotz formaler Sprachnachweise (vgl. Klatt 2008: 81).

[15] Bauer (2007: 39) spricht von 750 bis 1000 Stunden (gemeint sind wohl Unterrichtseinheiten von 45 Minuten) und hofft auf eine Professionalisierung des Lehrpersonals, um auch in Mexiko die Zielvorgabe B1 eines Tages in 450 Stunden erreichen zu können.

[16] Untersucht werden müsste in einer weiteren Arbeit, welche Ansprüche die B2-Prüfungen stellen und ob hier Sprachsystematik stärker ins Gewicht fällt. Anzunehmen ist natürlich, dass es verschiedene Gründe gibt, warum Lerner nach jahrelanger Anstrengung bei Erreichen des ZD beschließen, den Lernweg nicht fortzusetzen bzw. dabei scheitern.

[17] Genaue Daten bezüglich des Ausbildungsprofils der Lehrkräfte und der Anzahl an Prüfungsabsolventen auf den verschiedenen Stufen einschließlich Zeitaufwand liegen leider nicht vor. Auch im 2007 erschienenen Band AMPAL/DAAD/UNAM (Hg.), El idioma alemán en México. Medio de enlace, oportunidades y prestigio. Hacia un futuro trilingüe sind sie nicht enthalten. Das liegt wohl u.a. daran, dass diese Art von Daten (vor allem was die Lehrkräfte betrifft) nicht gerne von den einzelnen Institutionen nach au?en getragen werden. Als Beleg kann hier also lediglich ein weiteres – aus subjektiver Bestandsaufnahme gewonnenes – Zitat angeführt werden:

„Warum werden denn immer noch einfach muttersprachliche Sprecher der zu unterrichtenden Sprachen angeheuert, wenn diese Muttersprachler doch nie gelernt haben, ihre Sprache zu unterrichten? Die Behauptung, dass eine Person zum Unterrichten einer Sprache qualifiziert sei, nur weil sie sie spricht, ist ein Ammenmärchen, das sich nicht nur hartnäckig hält, sondern darüber hinaus auch völlig falsch ist. Und auch wenn man diese Dummheit immer wieder wiederholt, wird sie dadurch doch nicht wahrer. [...] In Notsituationen und auf Grund des enormen Mangels an Sprachlehreren in Mexiko [gemeint sind wohl qualifizierte Sprachlehrer, H.G.], greift man von Zeit zu Zeit auf nicht ausgebildete Lehrkräfte zurück, was sich langfristig als vollkommen unverantwortlich herausstellt und zu der äußerst unbefriedigenden Lage des Fremdsprachenunterrichts in diesem Land beiträgt“ (Bauer 2007: 29f., Übers. H.G.).

[18] Die Abbrecherquoten bei Deutschlernern im Erwachsenenbereich sind allgemein sehr hoch, viele geben bereits während der ersten Kurse wieder auf. Auch von den Deutschlernern, die sämtliche Grundstufenkurse abschließen, legen nicht alle die ZD-Prüfung ab.

[19] Im spanischen Original wird der aktive Agens “cooperar” verwendet, den ich mir hier erlaubt habe, mit “unterstützen” zu übersetzen.

[20] Auch wenn es dabei in Mexiko hauptsächlich um A2-Prüfungen und nicht um das ZD geht.




Copyright © 2009 Zeitschrift für Interkulturellen Fremdsprachenunterricht

Gruhn, Heike (2009), Anmerkungen zum Zertifikat Deutsch im mexikanischen Kontext vor dem Hintergrund der Deskriptoren-Tabellen des Gemeinsamen Europäischen Referenzrahmens.
Zeitschrift für Interkulturellen Fremdsprachenunterricht [Online] 14: 2, 23 S.
Abrufbar unter http://zif.spz.tu-darmstadt.de/jg-14-2/beitrag/Gruhn2.htm

[Zurück zur Leitseite]
line
line