Bewertung von Mehrfachauswahlaufgaben

Autor: Immo Schulz-Gerlach, ZMI, FeU-Softwaretechnik
Version: 2.4 — 22. Februar 2020
[PDF-Version] [ePub-Version]

Überblick

Der Standardbewerter des Online-Übungssystems unterstützt verschiedene Bewertungsmodi für Mehrfachauswahl-Aufgaben („X aus N“, Multiple Choice). Der Aufgabenautor entscheidet über die zur Aufgabe passende und für den Einsatzzweck angemessene Bewertung.

Bei diesen Aufgaben werden zu einer Frage eine bestimmte Anzahl N von Antwortalternativen angeboten, von denen beliebig viele zutreffen können. Sie1 entscheiden zu jeder Antwortalternative, ob Sie diese für zutreffend halten oder nicht, und kreuzen die Ihrer Meinung nach zutreffenden Alternativen an2. Für „klassische“ Multiple-Choice-Aufgaben mit genau einer Checkbox pro Antwortalternative (anders als bei Aufgaben mit 3 Antwortmöglichkeiten) gilt dabei: Wenn Sie bei einer Antwortalternative nicht sicher sind, geben Sie dennoch in jedem Fall eine Antwort: angekreuzt oder nicht angekreuzt. (Denn auch nicht angekreuzte Checkboxen stellen eine Antwort Ihrerseits dar, nämlich, dass Sie die Alternative für nicht zutreffend halten.) Dabei haben Sie allein durch Raten eine „Trefferchance“ von 50%.

Worin sich nun die verschiedenen Bewertungsmodi unterscheiden, ist in erster Linie die Frage, wie sich diese allein durch Raten erreichbare 50%-Trefferquote pro Alternative auf die vergebene Gesamtpunktzahl zur X-aus-N-Frage auswirken soll.

Eine Bewertung ohne Ratekorrektur vergibt einfach Pluspunkte für jede richtig markierte Alternative. Damit können jedoch allein durch Raten statistisch gesehen bereits 50% der Gesamtpunkte erreicht werden, weshalb die Einsatzmöglichkeiten dieser Bewertung eher limitiert sind bzw. das Ergebnis anders zu lesen ist. Eine typische Bestehensgrenze für Einsendearbeiten (oder Klausuren) aus Mehrfachauswahlaufgaben ohne Ratekorrektur wäre z.B. 75%: 50% der möglichen Punkte werden im Schnitt bereits durch Raten erreicht, und mindestens die Hälfte der darüber hinaus möglichen Punkte, also weitere 25%, sollten erreicht werden, um hinreichendes Wissen nachzuweisen.

Eine sog. Ratekorrektur dagegen bewirkt, dass allein durch Raten im Schnitt gar keine oder nur sehr wenige Punkte erreicht werden. Die verschiedenen Ratekorrektur-Modi unterscheiden sich in ihrer Rigorosität: Bei der neueren Ratekorrektur (V2) werden nur dann 0 Punkte vergeben, wenn alle Antworten falsch sind3, bei der klassischen Ratekorrektur (V1) muss mehr als die Hälfte der gegebenen Antworten richtig sein, um mehr als 0 Punkte zu erreichen.

Eine Variante solcher „X aus N“-Aufgaben (mit den oben genannten verschiedenen Bewertermodi) sind die „1 bis X aus N“-Aufgaben: Bei diesen ist immer mindestens eine Antwortalternative korrekt (während es bei „X aus N“ prinzipiell auch sein kann, dass alle Antwortalternativen falsch sind). Bei diesen Aufgaben muss mindestens eine Antwort gegeben (als richtig markiert) werden, um überhaupt Punkte erreichen zu können – kreuzen Sie nichts an, gelten diese Aufgaben als nicht bearbeitet.

Alternativ können Multiple-Choice-Aufgaben auch so gestellt werden, dass Sie nicht nur eine einzige Checkbox pro Antwortalternative angeboten bekommen (zutreffend oder nicht zutreffend), sondern zwei, über welche Sie insgesamt 3 Antwortmöglichkeiten haben: Sie können markieren, dass Sie die Alternative für zutreffend oder für nicht zutreffend halten, oder Sie können sich der Antwort enthalten. Wenn Sie sich also bei einer Alternative nicht sicher sind, können Sie entscheiden, ob Sie eine Antwort raten oder lieber gar keine Antwort geben: Wenn Sie richtig raten, erhalten Sie mehr, wenn Sie falsch raten, erhalten Sie (bei Aufgaben mit Ratekorrektur) weniger Punkte als wenn Sie gar keine Antwort geben: Wieviele Punkte Sie bei falschem Raten weniger bekommen als bei „Enthaltung“, hängt wieder vom Bewertungsmodus ab, auch hier werden zwei verschiedene Ratekorrekturen (analog zu den einfachen X-aus-N-Fragen) angeboten, sowie ein Modus ohne Ratekorrektur. Im letzteren hätten Sie keinen Vorteil davon, sich gegen Raten zu entscheiden und gar keine Antwort zu geben. Die Unterscheidung, ob Sie überhaupt eine Antwort geben oder nicht, dient dann in erster Linie Ihrer eigenen Übersicht (Frage schon beantwortet oder noch nicht).

Vereinbarungen

Es bezeichne in den folgenden Abschnitten stets N die Anzahl der Antwortalternativen, P die bei der Aufgabe maximal erreichbare Punktzahl.

Mit „richtiger Antwort“ zu einer Antwortalternative sei im Folgenden jeweils gemeint, dass eine laut Lösung richtige Antwortalternative genannt (bzw. angekreuzt / als zutreffend markiert) oder eine laut Lösung falsche Antwortalternative nicht genannt (nicht angekreuzt bzw. als nicht zutreffend markiert) wurde. Entsprechend wird das Nennen einer falschen Alternative ebenso wie das Nicht-Nennen einer richtigen Alternative als „falsche Antwort“ gewertet.


Bewertungsmodi

Dieser Abschnitt stellt alle Bewertungsmodi vor, wobei wir diese zunächst nach drei Aufgabenklassen (X aus N, 1 bis X aus N sowie X aus N mit 3 Antwortmöglichkeiten, siehe auch Einleitung oben) gruppieren und dann pro Klasse die Bewertungsmodi weiter nach dem Ratekorrekturmodus unterscheiden.

Klasse 1: Standard-Multiple-Choice-Aufgaben (»X aus N…«)

Hier fassen wir die Bewertermodi für den Standardfall von Multiple-Choice-Fragen zusammen, d.h. für solche Aufgabentypen, in denen Sie grundsätzlich zu jeder Antwortalternative eine Auswahl treffen und bei denen es auch möglich ist, dass keine Antwortalternative zutreffend ist.

Ein typischer Aufbau einer solchen Aufgabe besteht aus einer Reihe von Antwortalternativen mit je einer Checkbox: Markieren Sie diese Checkbox, wenn Sie die Alternative für zutreffend/korrekt halten, oder lassen Sie sie unmarkiert, wenn Sie die Alternative für nicht zutreffend/falsch halten. Zu einer Alternative gar keine Antwort zu geben, also keine Aussage zu treffen, ob Sie die Alternative für richtig oder falsch halten, ist bei diesem Aufgabentyp also nicht möglich, denn ein Nicht-Ankreuzen ist auch eine Aussage („nicht zutreffend“). Es ist bei diesem Aufgabentyp insbesondere auch möglich, dass Sie gar keine Checkbox ankreuzen und somit aussagen, dass Sie keine der Alternativen als zutreffend ansehen.

Derartige Aufgaben können nach einem der folgenden Modi bewertet werden:

Mehrfachauswahlaufgabe ohne Ratekorrektur (»X aus N +«)

In diesem Modus vergibt der Bewerter ausschließlich Pluspunkte: Jede richtige Antwort wird mit \(\frac{1}{N} P\) Punkten bewertet jede falsche mit 0 Punkten.
Sollte P nicht durch N teilbar sein und sich keine ganze Zahl errechnen, wird das Ergebnis abgerundet.

Wie im Überblick bereits gesagt, werden damit allein durch Raten im Schnitt 50% der Punkte erreicht, erst Ergebnisse ab rund 75% sind typischerweise als ausreichend zu interpretieren.

Die Punktevergabe selbst ist zwar einerseits besonders einfach zu nachzuvollziehen, andererseits jedoch ist es nicht sehr intuitiv, dass ein Ergebnis von z.B. 50%, 60% oder gar 70% zwar „nach viel klingt“, tatsächlich aber kein gutes Ergebnis ist.

Die nachfolgenden Bewertungsverfahren liefern „sprechendere“ Punktzahlen, dafür ist jedoch die Punktevergabe komplexer und erklärungsbedürftiger.

Mehrfachauswahlaufgabe mit klassischer Ratekorrektur (»X aus N«)

Die Bewertung erfolgt in diesem Modus nach dem klassischen Lotse-Schema: Bei N Antwortalternativen ist jede Alternative \(\frac{1}{N} P\) Punkte „wert“, und diese werden bei richtiger Antwort zur Gesamtpunktzahl addiert, bei falscher Antwort von der Gesamtpunktzahl abgezogen (als so genannte Ratekorrektur, s.o.). Negative Gesamtpunkte werden nicht vergeben, d.h. bei mehr falschen als richtigen Antworten werden 0 Punkte vergeben.

Sei also P die erreichbare Punktzahl, N die Anzahl der Antwortalternativen und geben Sie davon r viele richtige und f viele falsche Antworten (wobei r + f = N gilt), so berechnet sich Ihre Gesamtpunktzahl G wie folgt:

\[ G = max\left(0, \frac{r - f}{N} P \right) = max\left(0, \frac{2r - N}{N} P \right) \]

Sollte P nicht durch N teilbar sein und sich keine ganze Zahl errechnen, wird das Ergebnis abgerundet.

Beispiel: Es gebe vier Antwortalternativen A bis D. Die Musterlösung laute „A,D“, d.h. man muss genau die Antworten A und D geben, darf jedoch weder B noch C antworten, um die volle Punktzahl zu erhalten. Antworten Sie nun z.B. „A,B“, so ist die Antwort „A“ korrekt, die Antwort „B“ falsch, das Nicht-Geben der Antwort „C“ korrekt, das Nicht-Geben der Antwort „D“ wiederum falsch, so dass Sie insgesamt r = 2 richtige und f = 2 falsche Antworten gegeben hätten und somit \(\frac{2-2}{4} P\) = 0 Punkte erhielten. Die Antwort „A,B,D“ dagegen bestünde aus r = 3 richtigen und f = 1 falschen Antworten und würde mit \(\frac{3-1}{4} P = \frac{1}{2} P\), also der Hälfte der erreichbaren Punktzahl bewertet.

Auswirkung dieser Bewertung bei typischen x-aus-5-Aufgaben

Der folgende Text stammt von den Erläuterungen zum Lotse-System, ist aber allgemein auf diesen Bewertermodus des Online-Übungssystems übertragbar. Er geht exemplarisch von den bei Lotse typischen 5 Antwortalternativen aus (N = 5) und der Einfachheit halber auch von genau 5 erreichbaren Punkten (P = 5):

»Wenn Sie alles richtig wissen, erhalten Sie 5 Punkte.

Wenn Sie 4 Antworten wissen und eine Antwort raten erhalten Sie 3 oder 5 Punkte, je nachdem ob Sie richtig raten oder nicht. Im Durchschnitt werden Sie 4 Punkte erhalten.

Wenn Sie 3 Antworten wissen und 2 Antworten raten, gibt es vier Möglichkeiten: Sie haben beide Antworten richtig (5 Punkte), beide falsch (1 Punkt) oder eine von beiden richtig (3 Punkte) geraten. Im Durchschnitt erhalten Sie 3 Punkte.

Wenn Sie 2 Antworten wissen, gibt es acht Möglichkeiten, die verbleibenden 3 Antworten zu raten: 3 richtig (1 Möglichkeit mit 5 Punkten), 2 richtig (3 Möglichkeiten mit 3 Punkten), 1 richtig (3 Möglichkeiten mit 1 Punkt) oder keine richtig (1 Möglichkeit mit 0 Punkten). Sie erreichen also im Durchschnitt 17/8= 2,125 Punkte.

Wenn Sie eine Antwort wissen, raten Sie 4 Antworten mit 16 Möglichkeiten: 5 Punkte (1 Möglichkeit), 3 Punkte (4 Möglichkeiten) 1 Punkt (6 Möglichkeiten). Die anderen 5 Möglichkeiten ergeben 0 Punkte. Sie erreichen im Durchschnitt 23/16=1,4375 Punkte.

Wenn Sie nur raten, gibt es 1 Möglichkeit mit 5 Punkten, 5 Möglichkeiten mit 3 Punkten, 10 Möglichkeiten mit 1 Punkt und 16 Möglichkeiten ohne Punkte, im Durchschnitt 30/32= 0,9375 Punkte (18,75 %).

Ergebnis dieser Veranschaulichung soll sein, dass Sie erkennen, dass Sie statistisch etwa die Punkte bekommen, die Ihrem Wissensstand entsprechen. Erst wenn Sie weniger als die Hälfte wissen, profitieren Sie leicht vom Raten.

Folgen für die Benotung bei Klausuren: Wie bei Einfach-Auswahlaufgaben mit 5 Alternativen erreichen Sie bei diesem Aufgabentyp etwa 20 % der Gesamtpunkte durch Raten. Wenn die Hälfte der nicht durch Raten erreichbaren Punkte (80%) erzielt werden muss, ergibt sich eine Bestehensgrenze von 60%: 20% + (80% ÷ 2).«

Mehrfachauswahlaufgabe mit Ratekorrektur Version 2.0 (»X aus N (V2.0)«)

Auch bei diesem Verfahren handelt es sich um eine Bewertung mit „Ratekorrektur“, jedoch nach einem anderen Schema (Lotse-Bewertung Version 2), welches wirklich nur dann 0 Punkte vergibt, wenn alle Alternativen falsch beantwortet wurden. Für genau eine richtige Antwort wird noch 1% der erreichbaren Punkte vergeben (gerundet), und für mehr richtige Antworten werden auch anteilig mehr Punkte vergeben, jedoch in immer größeren Stufen, so dass auch hier durch Raten nicht im Schnitt 50% der Punkte erreicht werden können. Bei keinem Fehler oder genau einem Fehler stimmt die Bewertung noch mit der klassischen Lotse-Bewertung überein, bei mehr als einem Fehler werden dagegen jeweils etwas mehr Punkte als bei der klassischen Ratekorrektur vergeben.

Genauer sieht die Punktevergabe in diesem Modus wie folgt aus: Sei wieder N die Anzahl der Antwortalternativen und P die erreichbare Punktzahl, so wird für die Anzahl r der von Ihnen gegebenen richtigen Antworten (0 ≤ rN) folgende Gesamtpunktzahl G(r) vergeben:

r G(r)
N P (also 100%)
N – 1 \( \frac{N-2}{N} P \)
N – 2 \( \frac{N-3}{N-1} G(N-1) = \frac{N-3}{N-1} \frac{N-2}{N} P \)
N – 3 \( \frac{N-4}{N-2} G(N-2) = \frac{N-4}{N-2} \frac{N-3}{N-1} \frac{N-2}{N} P\)
u.s.w., d.h. \( \frac{r-1}{r+1} G(r+1) \) für 1 < r < N
1 \( \frac{P}{100} \) (also 1%)
0 0

Oder kurz und ohne Rekursion zusammengefasst:

\[ G(r) = \left\{\begin{array}{ll} 0 & \text{, falls } 0 = r \\ \frac{P}{100} & \text{, falls } 1 = r < N \\ \left( \prod\limits^N_{i=r+1}{\frac{i-2}{i}} \right) P & \text{, falls } 1 < r \le N \end{array} \right. \]

Sollte das Endergebnis G(r) keine ganze Zahl sein, so wird es auf die nächste ganze Zahl gerundet. (Die rekursiven Bezüge G(r+1) in der Tabellendarstellung werden natürlich ungerundet weiterverarbeitet, erst die Endpunktzahl wird gerundet.)

Hat eine Frage z.B. genau N = 5 Antwortalternativen, so werden bei einem Fehler (r = 4) noch \(\frac{3}{5} P\), also 60% der erreichbaren Punkte vergeben, bei zwei Fehlern (r = 3) noch 30% (\(\frac{2}{4} 60\% \)), bei drei Fehlern (r = 2) noch 10% (\(\frac{1}{3} 30\%\)) der erreichbaren Punkte, bei vier Fehlern noch 1% und erst bei fünf Fehlern, also gar keiner richtigen Antwort, 0 Punkte. Da, wie gesagt, die Berechnungsergebnisse gerundet werden, kann es jedoch auch vorkommen, dass auch bei genau einer richtigen Antwort (durch Abrundung) 0 Punkte vergeben werden, nämlich wenn die erreichbare Gesamtpunktzahl kleiner als 50 ist, so dass also 1% P < 0,5 ist. An diesem Punkt setzt die im Folgenden beschriebene Ratekorrektur V2.1 an.

Mehrfachauswahlaufgabe mit Ratekorrektur Version 2.1 (»X aus N (V2.1)«)

Dieser Modus ist eine Weiterentwicklung von »X aus N (V2.0)«. Beide Versionen (2.1 und 2.0) stimmen nahezu überein, bis auf folgendes Detail:

Falls in einer Aufgabe die maximal erreichbare Punktzahl kleiner als 50 sein sollte, so wären die bei genau einer richtigen Antwort vergebenen 1% der Punkte kleiner als 0,5 und würden daher zu 0 Punkten abgerundet (bei V2.0). Die Ratekorrektur V2.1 vergibt in diesem Fall dagegen noch 1 Punkt – sofern für genau zwei richtige Antworten mindestens 2 Punkte erreichbar sind.

Ist die erreichbare Punktzahl der Aufgabe so niedrig, dass selbst mit zwei richtigen Antworten maximal 1 Punkt erreichbar ist, vergibt auch V2.1 nur 0 Punkte auf genau eine richtige Antwort, da die für nur eine richtige Antwort vergebene Punktzahl natürlich niedriger sein soll die für zwei korrekte Antworten.

Ist die erreichbare Punktzahl P größer als 50, so unterscheiden sich V2.0 und V2.1 nicht. Insbesondere kann es dann auch sein, dass für genau eine richtige Antwort mehr als 1 Punkt vergeben wird: Für P ≥ 150 ist 1% von P, auf eine ganze Zahl gerundet, ≥ 2.

Zusammengefasst ergibt sich folgende Bewertung für »X aus N (V2.1)«:

\[ G(r) = \left\{\begin{array}{ll} 0 & \text{, falls } 0 = r \\ 0 & \text{, falls } 1 = r < N \wedge \lceil G(2) \rfloor \le 1 \\ max(1, \frac{P}{100}) & \text{, falls } 1 = r < N \wedge \lceil G(2) \rfloor > 1\\ \left( \prod\limits^N_{i=r+1}{\frac{i-2}{i}} \right) P & \text{, falls } 1 < r \le N \end{array} \right. \]

Dabei stehen die Klammern \( \lceil \dots \rfloor \) für Runden auf eine ganze Zahl, d.h. bei der Prüfung, ob eine einprozentige Punktzahl < 0,5 zu 1 aufgerundet werden soll, wird verglichen, ob die nach Rundung für 2 richtige Antworten erreichbare Punktzahl > 1 ist.

Direkter Vergleich obiger Bewertungsmodi

Vergleich der Bewertungen für N = 6 Antwortalternativen:

Richtige Antworten (aus 6) X aus N X aus N (V2.*) X aus N +
6 100,00% 100,00% 100,00%
5 ⅔ ≈ 66,67% ⅔ ≈ 66,67% ⁵⁄₆ ≈ 83,33%
4 ⅓ ≈ 33,33% 40,00% ⅔ ≈ 66,67%
3 0 20,00% 50,00%
2 0 ²⁄₃₀ ≈ 6,67% ⅓ ≈ 33,33%
1 0 1,00%* ¹⁄₆ ≈ 16,67%
0 0 0 0

Vergleich der Bewertungen für N = 5 Antwortalternativen:

Richtige Antworten (aus 5) X aus N X aus N (V2.*) X aus N +
5 100,00% 100,00% 100,00%
4 60,00% 60,00% 80,00%
3 20,00% 30,00% 60,00%
2 0 10,00% 40,00%
1 0 1,00%* 20,00%
0 0 0 0

Vergleich der Bewertungen für N = 4 Antwortalternativen:

Richtige Antworten (aus 4) X aus N X aus N (V2.*) X aus N +
4 100,00% 100,00% 100,00%
3 50,00% 50,00% 75,00%
2 0 ⅙ ≈ 16,67% 50,00%
1 0 1,00%* 25,00%
0 0 0 0

*) Die Versionen V2.0 und V2.1 der Ratekorrektur sind in der Tabelle nicht gesondert aufgeführt, da sich der Unterschied ohnehin nicht als Prozentpunktzahl darstellen lässt. Vielmehr wurde die Angabe „1,00%“ an dieser Stelle mit einem Sternchen versehen, um zu markieren, dass sich die beiden Versionen genau hier unterscheiden: Falls 1% von P kleiner als 0,5 sein sollte, wird V2.0 hier immer auf 0 abrunden, während V2.1 hier auf 1 aufrundet, sofern für 2 richtige Antworten mehr als 1 Punkt erzielt werden kann.

Hinweis: Die Verfahren liefern offensichtlich für gleiche Antworten unterschiedliche Ergebnisse. Entscheidend ist daher, wie die erreichten Punkte anschließend zu bewerten/interpretieren sind. Falls die Aufgaben nicht nur zur Selbstkontrolle dienen, sondern z.B. relevant für eine Klausurzulassung oder Prüfungsleistung sind, werden die entsprechenden von Ihnen zu erreichenden Mindestpunktzahlen von den Aufgabenanbietern mit dem jeweils gewählten Bewertungsverfahren abgestimmt.

Klasse 2: Mehrfachauswahlaufgaben mit min. einer korrekten Antwort (»1 bis X aus N …«)

Eine zweite Klasse von Mehrfachauswahlaufgaben ist weitgehend identisch zur obigen, typischerweise wieder dargestellt als eine Liste von Antwortalternativen mit je einer Checkbox, über welche Sie die Ihrer Meinung nach zutreffenden Alternativen markieren. Es gibt bei dieser Variante jedoch folgende zwei Besonderheiten:

Für bearbeitete Aufgaben, d.h. wenn Sie mindestens eine Antwort als zutreffend markiert haben, entspricht die Bewertung aber genau den „X aus N“-Aufgaben im jeweiligen Modus (mit oder ohne Ratekorrektur) wie oben beschrieben.

Für diese Aufgaben stehen dieselben Bewertungsmodi bereit wie oben zu Klasse 1 beschrieben, die Bewertung unterscheidet sich nur darin, dass, wenn Sie gar nichts ankreuzen, die Aufgabe als unbearbeitet gilt und grundsätzlich mit 0 Punkten bewertet wird, während bei einer Aufgabe aus Klasse 1 das Ankreuzen gar keiner Alternative als Antwort gewertet wird, die eine (Teil-)Punktzahl erreichen kann, wenn tatsächlich alle oder viele der Alternativen falsch sind.

Klasse 3: Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten (»… 3 Antw.«)

Multiple-Choice-Aufgaben können auch so gestellt werden, dass Sie pro Antwortalternative insgesamt 3 Antwortmöglichkeiten haben: »richtig«, »falsch« oder keine Antwort. Das hat dann Einfluss auf die Bewertung.

Die zuvor betrachteten Aufgabentypen haben gemein, dass Sie zu jeder Antwortalternative eine von zwei möglichen Antworten geben müssen: „richtig“ oder „falsch“ (bei Checkboxen: angekreuzt oder nicht angekreuzt). Sind Sie sich bei einer Antwort nicht sicher, müssen Sie raten.

In diesem Modus dagegen können Sie bei Antwortalternativen, bei denen Sie sich nicht sicher sind, selbst entscheiden, ob Sie die Alternative unbeantwortet lassen wollen (dann erhalten Sie auf diese nicht gegebene Antwort 0 Punkte) oder ob Sie raten wollen – mit der Chance auf mehr Punkte bei korrekter Antwort, aber ggf. auch auf weniger Punkte bei falscher Antwort (Ratekorrektur).

Auch hier gibt es wieder dieselben 3 Varianten bezüglich der Auswirkung falscher Antworten:

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten ohne Ratekorrektur (»X aus N + (3 Antw.)«)

In diesem Modus vergibt der Bewerter wieder ausschließlich Pluspunkte: Jede richtige Antwort wird mit \(\frac{1}{N} P\) Punkten bewertet jede falsche mit 0 Punkten. Zu jeder Alternative, zu der Sie gar keine Antwort geben, erhalten Sie ebenfalls 0 Punkte, genauso als hätten Sie sie falsch beantwortet.

Die Bewertung entspricht also praktisch genau der „normalen“ Mehrfachauswahlaufgabe ohne Ratekorrektur (»X aus N +«), nur ergänzt um die Regel, dass Sie auf eine Antwortalternative, zu der Sie gar keine Antwort geben, ebenso 0 Punkte erhalten wie auf eine falsche Antwort.

Entsprechend ist das Bewertungsergebnis wieder so zu interpretieren, dass 50% der erreichbaren Punktzahl noch ein schlechtes Ergebnis darstellen (da man sie im Durchschnitt auch mit reinem Raten ohne jegliches Wissen erreichen kann), dass also erst Ergebnisse ab etwa 75% aufwärts ausreichendes Wissen nachweisen.

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten und klassischer Ratekorrektur (»X aus N (3 Antw.)«)

Bei dieser Variante erhalten Sie für jede korrekte Antwort Pluspunkte, für eine falsche Antwort entsprechend Minuspunkte, für eine unbeantwortete Alternative einfach gar keine Punkte. Genauer:

Sei wieder N die Anzahl der Antwortalternativen und P die maximal erreichbare Gesamtpunktzahl, dann ist analog zum klassischen „X aus N“ jede Antwortalternative \(\frac{1}{N} P\) Punkte „wert“. Für jede richtige Antwort werden dann \(\frac{1}{N} P\) Punkte gutgeschrieben, für jede falsche Antwort abgezogen, für unbeantwortete Alternativen gibt es 0 Punkte.

Bei r richtigen Antworten und f falschen Antworten (wobei hier im Unterschied zu obigen Modi 0 ≤ r + fN gilt, also insgesamt weniger als N Antworten gegeben werden können) errechnet sich somit die Gesamtpunkzahl G als:

\[ G(r,f) = max\left(0, \frac{r - f}{N} P \right) \]

(Im Prinzip ist das die gleiche Formel wie oben unter „X aus N“ angegeben, nur ohne die Nebenbedingung, dass r + f = N gilt und entsprechend ohne die Umformungsmöglichkeit in eine nur von r abhängige Gleichung.)

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten und Ratekorrektur Version 2.0 (»X aus N (3 Antw. V2.0)«)

In diesem Modus kommt dieselbe Ratekorrektur zum Einsatz wie bei einfacher Mehrfachauswahlaufgabe mit Ratekorrektur Version 2. Im Folgenden nennen wir den oben beschriebenen Bewertermodus einfach kurz „V2-Bewertung“. N bezeichne wieder die Anzahl der Antwortalternativen in der Aufgabe und P die maximal erreichbare Punktzahl.

Dann erfolgt die Anwendung der V2-Bewertung auf diesen Aufgabentyp wie folgt:

In einer Formel lässt sich das wie folgt zusammenfassen:

\[ G(r,f) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ \frac{P}{N} & \text{, falls } r = 1 \wedge f = 0 \\ \frac{P}{100} & \text{, falls } r = 1 \wedge 0 < f < N \\ \left( \prod\limits^{r+f}_{i=r+1}{\frac{i-2}{i}} \right) \frac{r+f}{N} P & \text{, falls } 1 < r \le r + f \le N \end{array} \right. \]

Mehrfachauswahlaufgabe mit 3 Antwortmöglichkeiten und Ratekorrektur Version 2.1 (»X aus N (3 Antw. V2.1)«)

Auch Mehrfachauswahlaufgaben mit 3 Antwortmöglichkeiten können natürlich mit der Ratekorrektur Verson 2.1 kombiniert werden, analog zu Klasse 1, Mehrfachauswahlaufgabe mit Ratekorrektur Version 2.1 (»X aus N (V2.1)«).

V2.1 und V2.0 unterscheiden sich auch hier wieder nur in einem Detail – und nur für Aufgaben, in denen weniger als 50 Punkte erreichbar sind, so dass 1% von 50 kleiner als 0,5 ist:
Bei genau einer richtigen und mindestens einer falschen Antwort vergibt V2.0 immer 1% der erreichbaren Punktzahl P, in diesem Fall (P < 50) abgerundet auf 0 Punkte. V2.1 wird in diesem Fall noch einen Punkt vergeben – sofern für eine richtige Antwort mehr (also 2 richtige Antworten) bei gleicher Antwortzahl (also mit einer falschen Antwort weniger) mehr als 1 Punkt erreichbar ist.

Wieder als Formel zusammengefasst errechnet sich die Punktzahl dann also wie folgt:

\[ G(r,f) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ \frac{P}{N} & \text{, falls } r = 1 \wedge f = 0 \\ 0 & \text{, falls } r = 1 \wedge 0 < f < N \wedge \lceil G(2,f-1) \rfloor \le 1 \\ max(1, \frac{P}{100}) & \text{, falls } r = 1 \wedge 0 < f < N \wedge \lceil G(2, f-1) \rfloor > 1 \\ \left( \prod\limits^{r+f}_{i=r+1}{\frac{i-2}{i}} \right) \frac{r+f}{N} P & \text{, falls } 1 < r \le r + f \le N \end{array} \right. \]

Die errechnete Gesamtpunktzahl G(r) wird abschließend, falls sich keine ganze Zahl ergibt, auf die nächste ganze Zahl gerundet. (Dasselbe gilt auch für die Vergleichswerte G(2, f-1) in obiger Formel, dort explizit dargestellt durch die Klammern \( \lceil \dots \rfloor \).)

Direkter Vergleich der Modi bei 3 Antwortmöglichkeiten

Analog zu „einfachen“ Mehrfachauswahlaufgaben unterscheiden sich die Ratekorrekturmodi auch hier genau dann in der Bewertung, sobald Sie mehr als eine falsche Antwort geben.

Für N = 5 Alternativen sieht die Bewertung z.B. wie folgt aus:

r f unbeantwortet X aus N (3 Antw.) X aus N (3 Antw., V2.*) X aus N + (3 Antw.)
5 0 0 100% 100% 100%
4 0 1 80% 80% 80%
4 1 0 60% 60% 80%
3 0 2 60% 60% 60%
3 1 1 40% 40% 60%
3 2 0 20% 30% 60%
2 0 3 40% 40% 40%
2 1 2 20% 20% 40%
2 2 1 0 13,33% 40%
2 3 0 0 10% 40%
1 0 4 20% 20% 20%
1 1-4 3-0 0 1%* 20%
0 0-5 5-0 0 0 0

*) In der vorletzten Zeile gilt wieder, dass »X aus N (3 Antw. V2.0)« die Punktzahl (1%) ggf. auf 0 Punkte abrundet (wenn P < 50), während »X aus N (3 Antw. V2.1)« hier einen Punkt vergibt, sofern für eine richtige Antwort mehr (also 2 richtige) und eine falsche Antwort weniger mehr als ein Punkt vergeben würde. Ansonsten unterscheiden sich V2.0 und V2.1 nicht.

(In obiger Tabelle stehe r wieder für die Anzahl Ihrer korrekten Antworten, d.h. die Anzahl der Antwortalternativen, für die Sie korrekt beantworten konnten, ob sie zutreffend sind oder nicht, und f steht entsprechend für die Anzahl Ihrer falschen Antworten. In der Spalte »unbeantwortet« steht mit der Differenz 5 - r - f jeweils die Anzahl der unbeantworteten Alternativen.)

Hinweise zur Bewerterausgabe bei Aufgaben mit 3 Antwortmöglichkeiten

Die Musterlösung (siehe auch folgenden Abschnitt) zählt nur die korrekten Antworten auf. Unter „Ihre Lösung“ stehen Ihre Antworten wie folgt:


Hinweise zu den Musterlösungen

Die Bewertung, welche Ihrer Antworten richtig oder falsch ist, richtet sich nach der hinterlegten Musterlösung. In der Regel handelt es sich dabei schlicht um die Aufzählung der richtigen Antworten (z.B: A,C,E).

In gewissen Spezialfällen können folgende Besonderheiten vorkommen:


  1. Adressaten dieses Dokuments sind die Studentinnen und Studenten, die solche Mehrfachauswahlaufgaben bearbeiten. Sollten Angehörige anderer Personengruppen dieses Dokument lesen, ist die persönliche Anrede „Sie“ entsprechend zu interpretieren.  ↩

  2. Zumindest ist das der Normalfall, dass sich vor jeder Antwortalternative eine Checkbox befindet, die Sie ankreuzen, wenn Sie die Alternative für korrekt halten, oder nicht ankreuzen, wenn Sie sie für falsch halten. Technisch sind jedoch durchaus auch andere Eingabeformen denkbar.  ↩

  3. Genauer: Bei der Ratekorrektur V2.0 vergibt der Bewerter nur bei komplett falsch beantworteten Fragen exakt 0% der erreichbaren Punkte. Bei einer richtigen neben ansonsten nur falschen Antworten wird z.B. mit 1% bewertet, bei noch mehr richtigen Antworten auch höher. Die daraus errechnete Punktzahl wird jedoch abschließend gerundet, so dass es – je nach erreichbarer Punktzahl – in solchen Fällen eine 0-Punkte-Wertung durch Abrundung geben könnte. Wenn z.B. 10 Punkte erreichbar sind und Sie mit genau einer richtigen von N Antworten noch 1% bekämen, so errechnet sich die Endpunktzahl als 1% von 10 P. = 0,1 P. ≈ 0 P. (auf volle Punktzahl 0 abgerundet). Bei 50 erreichbaren Punkten dagegen wäre 1% von 50 P. = 0.5 P. ≈ 1 P. (auf volle Punktzahl aufgerundet). Die Ratekorrektur V2.1 weicht davon insofern ab, als dass sie bei genau einer richtigen Antwort im Fall, dass die dann vergebenen 1% der Punkte zu 0 abgerundet würden, doch auf 1 Punkt aufrundet (sofern die erreichbare Punktzahl nicht so niedrig ist, dass schon mit 2 richtigen Antworten nur max. 1 Punkt erreichbar wäre).  ↩