Der Standardbewerter des Online-Übungssystems unterstützt verschiedene Bewertungsmodi für Mehrfachauswahl-Aufgaben („X aus N“, Multiple Choice). Der Aufgabenautor entscheidet über die zur Aufgabe passende und für den Einsatzzweck angemessene Bewertung.
Bei diesen Aufgaben werden zu einer Frage eine bestimmte Anzahl N von Antwortalternativen angeboten, von denen beliebig viele zutreffen können. Sie1 entscheiden zu jeder Antwortalternative, ob Sie diese für zutreffend halten oder nicht, und kreuzen die Ihrer Meinung nach zutreffenden Alternativen an2. Für „klassische“ Multiple-Choice-Aufgaben mit genau einer Checkbox pro Antwortalternative (anders als bei Aufgaben mit 3 Antwortmöglichkeiten) gilt dabei: Wenn Sie bei einer Antwortalternative nicht sicher sind, geben Sie dennoch in jedem Fall eine Antwort: angekreuzt oder nicht angekreuzt. (Denn auch nicht angekreuzte Checkboxen stellen eine Antwort Ihrerseits dar, nämlich, dass Sie die Alternative für nicht zutreffend halten.) Dabei haben Sie allein durch Raten eine „Trefferchance“ von 50%.
Worin sich nun die verschiedenen Bewertungsmodi unterscheiden, ist in erster Linie die Frage, wie sich diese allein durch Raten erreichbare 50%-Trefferquote pro Alternative auf die vergebene Gesamtpunktzahl zur X-aus-N-Frage auswirken soll.
Eine Bewertung ohne Ratekorrektur vergibt einfach Pluspunkte für jede richtig markierte Alternative. Damit können jedoch allein durch Raten statistisch gesehen bereits 50% der Gesamtpunkte erreicht werden, weshalb die Einsatzmöglichkeiten dieser Bewertung eher limitiert sind bzw. das Ergebnis anders zu lesen ist. Eine typische Bestehensgrenze für Einsendearbeiten (oder Klausuren) aus Mehrfachauswahlaufgaben ohne Ratekorrektur wäre z.B. 75%: 50% der möglichen Punkte werden im Schnitt bereits durch Raten erreicht, und mindestens die Hälfte der darüber hinaus möglichen Punkte, also weitere 25%, sollten erreicht werden, um hinreichendes Wissen nachzuweisen.
Eine sog. Ratekorrektur dagegen bewirkt, dass allein durch Raten im Schnitt gar keine oder nur sehr wenige Punkte erreicht werden. Die verschiedenen Ratekorrektur-Modi unterscheiden sich in ihrer Rigorosität: Bei der neueren Ratekorrektur (V2) werden nur dann 0 Punkte vergeben, wenn alle Antworten falsch sind3, bei der klassischen Ratekorrektur (V1) muss mehr als die Hälfte der gegebenen Antworten richtig sein, um mehr als 0 Punkte zu erreichen.
Eine Variante solcher „X aus N“-Aufgaben (mit den oben genannten verschiedenen Bewertermodi) sind die „1 bis X aus N“-Aufgaben: Bei diesen ist immer mindestens eine Antwortalternative korrekt (während es bei „X aus N“ prinzipiell auch sein kann, dass alle Antwortalternativen falsch sind). Bei diesen Aufgaben muss mindestens eine Antwort gegeben (als richtig markiert) werden, um überhaupt Punkte erreichen zu können – kreuzen Sie nichts an, gelten diese Aufgaben als nicht bearbeitet.
Alternativ können Multiple-Choice-Aufgaben auch so gestellt werden, dass Sie nicht nur eine einzige Checkbox pro Antwortalternative angeboten bekommen (zutreffend oder nicht zutreffend), sondern zwei, über welche Sie insgesamt 3 Antwortmöglichkeiten haben: Sie können markieren, dass Sie die Alternative für zutreffend oder für nicht zutreffend halten, oder Sie können sich der Antwort enthalten. Wenn Sie sich also bei einer Alternative nicht sicher sind, können Sie entscheiden, ob Sie eine Antwort raten oder lieber gar keine Antwort geben: Wenn Sie richtig raten, erhalten Sie mehr, wenn Sie falsch raten, erhalten Sie (bei Aufgaben mit Ratekorrektur) weniger Punkte als wenn Sie gar keine Antwort geben: Wieviele Punkte Sie bei falschem Raten weniger bekommen als bei „Enthaltung“, hängt wieder vom Bewertungsmodus ab, auch hier werden zwei verschiedene Ratekorrekturen (analog zu den einfachen X-aus-N-Fragen) angeboten, sowie ein Modus ohne Ratekorrektur. Im letzteren hätten Sie keinen Vorteil davon, sich gegen Raten zu entscheiden und gar keine Antwort zu geben. Die Unterscheidung, ob Sie überhaupt eine Antwort geben oder nicht, dient dann in erster Linie Ihrer eigenen Übersicht (Frage schon beantwortet oder noch nicht).
Es bezeichne in den folgenden Abschnitten stets N die Anzahl der Antwortalternativen, P die bei der Aufgabe maximal erreichbare Punktzahl.
Mit „richtiger Antwort“ zu einer Antwortalternative sei im Folgenden jeweils gemeint, dass eine laut Lösung richtige Antwortalternative genannt (bzw. angekreuzt / als zutreffend markiert) oder eine laut Lösung falsche Antwortalternative nicht genannt (nicht angekreuzt bzw. als nicht zutreffend markiert) wurde. Entsprechend wird das Nennen einer falschen Alternative ebenso wie das Nicht-Nennen einer richtigen Alternative als „falsche Antwort“ gewertet.
Die Anzahl der richtigen Antworten bezeichnen wir mit r, die Anzahl der falschen mit f. Für gewöhnliche Multiple-Choice-Fragen gilt dann r + f = N. Mit G(r) bezeichnen wir die zu r richtigen Antworten insgesamt vergebene / erreichte Punktzahl.
Bei Mehrfachauswahlaufgaben mit 3 Antwortmöglichkeiten dagegen, bei denen man sich auch zu einzelnen Antwortalternativen der Antwort enthalten kann, gilt dann r + f ≤ N, und die vergebene Gesamtpunktzahl hängt dann nicht nur von der Anzahl r der richtigen Antworten ab, sondern auch davon, wieviele der übrigen Alternativen man falsch beantwortet hat (f) oder gar nicht (N - r - f). Daher wird bei diesen Aufgabentypen die vergebene Gesamtpunkzahl in Abhängigkeit von r und f angegeben: G(r, f).
Jede Kursumgebung im Online-Übungs- bzw. Online-Prüfungssystem ist auf ein bestimmtes Punkteformat eingestellt, und zwar entweder ganze Punkte, Zehntelpunkte oder Hundertstelpunkte, d.h. die Gesamtpunktzahl, die in der Korrektur zu einer Aufgabe erreicht werden kann, ist entweder eine ganze Zahl oder kann bis zu eine bzw. zwei Nachkommastellen haben.
Auch die hier beschriebenen Multiple-Choice-Bewerter richten sich nach diesem Punkteformat der jeweiligen Kursumgebung, d.h. die zu jeder einzelnen automatisch bewerteten Frage ermittelte Punkte-Bewertung wird ggf. auf die entsprechende Nachkommastellenzahl (0, 1 oder 2) gerundet.
Wenn also in den folgenden Abschnitten zu den Bewertungsmodi jeweils eine Bewertungsfunktion G(r) bzw. G(r, f) angegeben wird, die eine beliebige Fließkommazahl berechnet, so wird deren Ergebnis eben im Anschluss noch auf das Punkteformat des Kurses gerundet (je nach Bewerter entweder „kaufmännisch“ oder immer abgerundet zur nächstkleineren passenden Zahl). Falls im Text nur kurz nochmals erwähnt wird, dass das Ergebnis gerundet wird, ist damit genau eine Rundung auf null, eine oder zwei Nachkommastellen je nach Punkteformat der konkreten Kursumgebung gemeint. (Da die Rundung von einer Einstellung der jeweiligen Kursumgebung abhängt, wurde die Rundung nicht explizit mit in die Formeln mit aufgenommen.)
Dieser Abschnitt stellt alle Bewertungsmodi vor, wobei wir diese zunächst nach drei Aufgabenklassen (X aus N, 1 bis X aus N sowie X aus N mit 3 Antwortmöglichkeiten, siehe auch Einleitung oben) gruppieren und dann pro Klasse die Bewertungsmodi weiter nach dem Ratekorrekturmodus unterscheiden.
Hier fassen wir die Bewertermodi für den Standardfall von Multiple-Choice-Fragen zusammen, d.h. für solche Aufgabentypen, in denen Sie grundsätzlich zu jeder Antwortalternative eine Auswahl treffen und bei denen es auch möglich ist, dass keine Antwortalternative zutreffend ist.
Ein typischer Aufbau einer solchen Aufgabe besteht aus einer Reihe von Antwortalternativen mit je einer Checkbox: Markieren Sie diese Checkbox, wenn Sie die Alternative für zutreffend/korrekt halten, oder lassen Sie sie unmarkiert, wenn Sie die Alternative für nicht zutreffend/falsch halten. Zu einer Alternative gar keine Antwort zu geben, also keine Aussage zu treffen, ob Sie die Alternative für richtig oder falsch halten, ist bei diesem Aufgabentyp also nicht möglich, denn ein Nicht-Ankreuzen ist auch eine Aussage („nicht zutreffend“). Es ist bei diesem Aufgabentyp insbesondere auch möglich, dass Sie gar keine Checkbox ankreuzen und somit aussagen, dass Sie keine der Alternativen als zutreffend ansehen.
Derartige Aufgaben können nach einem der folgenden Modi bewertet werden:
In diesem Modus vergibt der Bewerter ausschließlich Pluspunkte: Jede richtige Antwort wird mit \(\frac{1}{N} P\) Punkten bewertet jede falsche mit 0 Punkten.
Sollte P nicht durch N teilbar sein und sich keine ganze Zahl errechnen, wird das Ergebnis auf die nächstenkleinere ganze Zahl (bzw. je nach Kurseinstellungen auch auf eine oder zwei Stellen nach dem Komma) abgerundet.
Wie im Überblick bereits gesagt, werden damit allein durch Raten im Schnitt 50% der Punkte erreicht, erst Ergebnisse ab rund 75% sind typischerweise als ausreichend zu interpretieren.
Die Punktevergabe selbst ist zwar einerseits besonders einfach zu nachzuvollziehen, andererseits jedoch ist es nicht sehr intuitiv, dass ein Ergebnis von z.B. 50%, 60% oder gar 70% zwar „nach viel klingt“, tatsächlich aber kein gutes Ergebnis ist.
Die nachfolgenden Bewertungsverfahren liefern „sprechendere“ Punktzahlen, dafür ist jedoch die Punktevergabe komplexer und erklärungsbedürftiger.
Die Bewertung erfolgt in diesem Modus nach dem klassischen Lotse-Schema: Bei N > 0 Antwortalternativen ist jede Alternative \(\frac{1}{N} P\) Punkte „wert“, und diese werden bei richtiger Antwort zur Gesamtpunktzahl addiert, bei falscher Antwort von der Gesamtpunktzahl abgezogen (als so genannte Ratekorrektur, s.o.). Negative Gesamtpunkte werden nicht vergeben, d.h. bei mehr falschen als richtigen Antworten werden 0 Punkte vergeben.
Sei also P die erreichbare Punktzahl, N die Anzahl der Antwortalternativen (N > 0) und geben Sie davon r viele richtige und f viele falsche Antworten (wobei r + f = N gilt), so berechnet sich Ihre Gesamtpunktzahl G wie folgt:
\[ G = max\left(0, \frac{r - f}{N} P \right) = max\left(0, \frac{2r - N}{N} P \right) \]
Sollte P nicht durch N teilbar sein und sich keine ganze Zahl errechnen, wird das Ergebnis auf die nächstenkleinere ganze Zahl (bzw. je nach Punkteformat der Kursumgebung auch auf eine oder zwei Stellen nach dem Komma) abgerundet.
Beispiel: Es gebe vier Antwortalternativen A bis D. Die Musterlösung laute „A,D“, d.h. man muss genau die Antworten A und D geben, darf jedoch weder B noch C antworten, um die volle Punktzahl zu erhalten. Antworten Sie nun z.B. „A,B“, so ist die Antwort „A“ korrekt, die Antwort „B“ falsch, das Nicht-Geben der Antwort „C“ korrekt, das Nicht-Geben der Antwort „D“ wiederum falsch, so dass Sie insgesamt r = 2 richtige und f = 2 falsche Antworten gegeben hätten und somit \(\frac{2-2}{4} P\) = 0 Punkte erhielten. Die Antwort „A,B,D“ dagegen bestünde aus r = 3 richtigen und f = 1 falschen Antworten und würde mit \(\frac{3-1}{4} P = \frac{1}{2} P\), also der Hälfte der erreichbaren Punktzahl bewertet.
Der folgende Text stammt von den Erläuterungen zum Lotse-System, ist aber allgemein auf diesen Bewertermodus des Online-Übungssystems übertragbar. Er geht exemplarisch von den bei Lotse typischen 5 Antwortalternativen aus (N = 5) und der Einfachheit halber auch von genau 5 erreichbaren Punkten (P = 5):
»Wenn Sie alles richtig wissen, erhalten Sie 5 Punkte.
Wenn Sie 4 Antworten wissen und eine Antwort raten erhalten Sie 3 oder 5 Punkte, je nachdem ob Sie richtig raten oder nicht. Im Durchschnitt werden Sie 4 Punkte erhalten.
Wenn Sie 3 Antworten wissen und 2 Antworten raten, gibt es vier Möglichkeiten: Sie haben beide Antworten richtig (5 Punkte), beide falsch (1 Punkt) oder eine von beiden richtig (3 Punkte) geraten. Im Durchschnitt erhalten Sie 3 Punkte.
Wenn Sie 2 Antworten wissen, gibt es acht Möglichkeiten, die verbleibenden 3 Antworten zu raten: 3 richtig (1 Möglichkeit mit 5 Punkten), 2 richtig (3 Möglichkeiten mit 3 Punkten), 1 richtig (3 Möglichkeiten mit 1 Punkt) oder keine richtig (1 Möglichkeit mit 0 Punkten). Sie erreichen also im Durchschnitt 17/8= 2,125 Punkte.
Wenn Sie eine Antwort wissen, raten Sie 4 Antworten mit 16 Möglichkeiten: 5 Punkte (1 Möglichkeit), 3 Punkte (4 Möglichkeiten) 1 Punkt (6 Möglichkeiten). Die anderen 5 Möglichkeiten ergeben 0 Punkte. Sie erreichen im Durchschnitt 23/16=1,4375 Punkte.
Wenn Sie nur raten, gibt es 1 Möglichkeit mit 5 Punkten, 5 Möglichkeiten mit 3 Punkten, 10 Möglichkeiten mit 1 Punkt und 16 Möglichkeiten ohne Punkte, im Durchschnitt 30/32= 0,9375 Punkte (18,75 %).
Ergebnis dieser Veranschaulichung soll sein, dass Sie erkennen, dass Sie statistisch etwa die Punkte bekommen, die Ihrem Wissensstand entsprechen. Erst wenn Sie weniger als die Hälfte wissen, profitieren Sie leicht vom Raten.
Folgen für die Benotung bei Klausuren: Wie bei Einfach-Auswahlaufgaben mit 5 Alternativen erreichen Sie bei diesem Aufgabentyp etwa 20 % der Gesamtpunkte durch Raten. Wenn die Hälfte der nicht durch Raten erreichbaren Punkte (80%) erzielt werden muss, ergibt sich eine Bestehensgrenze von 60%: 20% + (80% ÷ 2).«
Auch bei diesem Verfahren handelt es sich um eine Bewertung mit „Ratekorrektur“, jedoch nach einem anderen Schema (Lotse-Bewertung Version 2), welches im Idealfall4 nur dann 0 Punkte vergibt, wenn wirklich alle Alternativen falsch beantwortet wurden. Für genau eine richtige Antwort wird i.d.R. (s.u.) noch 1% der erreichbaren Punkte vergeben (gerundet auf eine ganze Zahl bzw. je nach Kurseinstellungen auch auf eine oder zwei Stellen nach dem Komma), und für mehr richtige Antworten werden auch anteilig mehr Punkte vergeben, jedoch in immer größeren Stufen, so dass auch hier durch Raten nicht im Schnitt 50% der Punkte erreicht werden können. Bei keinem Fehler oder genau einem Fehler stimmt die Bewertung (vor Rundung) noch mit der klassischen Lotse-Bewertung überein5, bei mehr als einem Fehler werden dagegen jeweils etwas mehr Punkte als bei der klassischen Ratekorrektur vergeben.
Genauer sieht die Punktevergabe in diesem Modus wie folgt aus: Sei wieder N die Anzahl der Antwortalternativen (N > 0) und P die erreichbare Punktzahl, so wird für die Anzahl r der von Ihnen gegebenen richtigen Antworten (0 ≤ r ≤ N) folgende Gesamtpunktzahl G(r) vergeben:
r | G(r) |
---|---|
N | P (also 100%) |
N – 1 | \( \frac{N-2}{N} P \) |
N – 2 | \( \frac{N-3}{N-1} G(N-1) = \frac{N-3}{N-1} \frac{N-2}{N} P \) |
N – 3 | \( \frac{N-4}{N-2} G(N-2) = \frac{N-4}{N-2} \frac{N-3}{N-1} \frac{N-2}{N} P\) |
… | u.s.w., d.h. \( \frac{r-1}{r+1} G(r+1) = \left( \prod_{i=r+1}^N \frac{i-2}{i} \right) P \) für 1 < r < N |
1 | \( \frac{1}{100} P \), also 1% (in V2.0) |
0 | 0 |
Die Bewertung folgt also weitgehend einem einfachen Schema: Volle Punktzahl für r = N (alles richtig) und 0 Punkte für r = 0 (alles falsch) verstehen sich von selbst und gelten für alle Bewerter gleichermaßen, und für 1 < r < N lässt sich das Schema aus obiger Tabelle als Produktformel herleiten, die sich dann sogar noch weiter zu einem einfachen Quotienten vereinfachen lässt6:
\[\left( \prod_{i=r+1}^N \frac{i-2}{i} \right) P = \frac{r(r-1)}{N(N-1)}P\]
Dieses Schema ist allerdings tatsächlich nur für r > 1 anwendbar: Für r = 1 ergäben sich danach bereits 0 Punkte, weil für r = 1 eben der Zähler des Bruches \(\frac{r-1}{r+1}\) 0 würde, und mit ihm das gesamte Produkt. Daher wurde für den Fall r = 1 eine Sonderregelung eingeführt, die noch etwas mehr als 0 Punkte vergibt. In obiger Tabelle ist das die Vergabe von 1% von P.
Für typische Aufgaben wie X-aus-5-Fragen mit mindestens 50 erreichbaren Punkten hatte sich diese 1%-Sonderregel bewährt, aber es gibt auch Konstellationen wie a) relativ kleine erreichbare Punktzahlen und b) sehr große erreichbare Punktzahlen bei gleichzeitig hohen Alternativenzahlen (z.B. X aus 20 bei 500 Punkten), bei denen die einfache 1%-Regel für r = 1 nicht optimal oder sinnvoll ist.
Daher gibt es inzwischen drei Varianten von dem V2-Verfahren (V2.0, V2.1 und V2.2), die sich alle nur im Fall r = 1 unterscheiden – genauer: im Fall 1 = r < N, denn falls es nur genau eine Auswahloption gibt, dann ist r = 1 = N natürlich die beste Lösung und wird mit voller Punktzahl bewertet.
V2.2 ist die derzeit aktuelle Version, aber die früheren Versionen wurden (und werden teils immer noch) benutzt und werden daher i. F. auch der Reihe nach dokumentiert.
Dies ist die einfachste Variante, die bei 1 = r < N (also genau einer richtigen Antwort aus mehreren Alternativen) immer ein Prozent der Bestpunktzahl P vergibt. Die oben stehende Tabelle zeigt also genau die Wertung für Version 2.0. Diese tabellarische Darstellung lässt sich auch als Formel zusammenfassen zu:
\[ G(r) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ P & \text{, falls } r = N \\ \frac{1}{100} P & \text{, falls } 1 = r < N \\ \frac{r (r-1)}{N (N-1)} P & \text{, falls } 1 < r < N \end{array} \right. \]
Sollte das Endergebnis G(r) keine ganze Zahl sein, so wird es auf die nächste ganze Zahl (bzw. je nach Punkteformat der Kursumgebung auch auf eine oder zwei Stellen nach dem Komma) gerundet. (Die rekursiven Bezüge G(r+1) in der Tabellendarstellung oben werden natürlich ungerundet weiterverarbeitet, erst die Endpunktzahl wird gerundet.)
Hat eine Frage z.B. genau N = 5 Antwortalternativen, so werden bei einem Fehler (r = 4) noch \(\frac{3}{5} P\), also 60% der erreichbaren Punkte vergeben, bei zwei Fehlern (r = 3) noch 30% (\(\frac{2}{4} 60\% \)), bei drei Fehlern (r = 2) noch 10% (\(\frac{1}{3} 30\%\)) der erreichbaren Punkte, bei vier Fehlern noch 1% und erst bei fünf Fehlern, also gar keiner richtigen Antwort, 0 Punkte. Da, wie gesagt, die Berechnungsergebnisse gerundet werden, kann es jedoch auch vorkommen, dass auch bei genau einer richtigen Antwort (durch Abrundung) 0 Punkte vergeben werden, z.B. wenn immer auf ganze Punkte gerundet wird und die erreichbare Gesamtpunktzahl kleiner als 50 ist, so dass also 1% P < 0,5 ist. Oder wenn zwar auf eine Stelle nach dem Komma genau gerundet wird, aber die erreichbare Gesamtpunkzahl kleiner als 5 ist, so dass 1% P < 0,05 ist und somit zu 0,0 abgerundet wird. An diesem Punkt setzt die im Folgenden beschriebene Ratekorrektur V2.1 an.
Die Weiterentwicklung in Version 2.1 strebt an, den Fall zu vermeiden, dass es für noch genau eine richtige Antwort (1 = r < N) 0 Punkte gibt (genau wie für 0 richtige Antworten), selbst wenn für zwei richtige Antworten schon mehr als 1 Punkt erreichbar wäre. Vielmehr soll in diesem Fall dann 1 Punkt für r = 1 vergeben werden, selbst wenn das etwas mehr als (rund) 1% (aber immer noch weniger als G(2) ist.
Genauer wird hier nach dem Punkteformat (siehe Vereinbarungen) der Kursumgebung unterschieden:
Zusammengefasst ergibt sich folgende Bewertung für »X aus N (V2.1)« (wobei sich diese Formeln nur im Fall 1 = r < N von der obigen V2.0-Formel unterscheiden):
Dabei stehen die Klammern \( \lceil \dots \rfloor \) für Runden auf eine ganze Zahl, d.h. bei der Prüfung, ob eine einprozentige Punktzahl < 0,5 zu 1 aufgerundet werden soll, wird verglichen, ob die nach Rundung für 2 richtige Antworten erreichbare Punktzahl > 1 ist, bzw. bei der Prüfung, ob eine einprozentige Punktzahl < 0,05 zu 0,1 aufgerundet werden soll, wird verglichen, ob das gerundete Zehnfache der für 2 richtige Antworten vergebenen Punktzahl > 1 ist (also die auf eine Stelle nach dem Komma gerundete Punktzahl für 2 richtige Antworten > 0,1 ist).
G(r) wird auch hier abschließend auf die nächste ganze Zahl (bzw. je nach Kurseinstellungen auch auf eine oder zwei Stellen nach dem Komma) gerundet.
Version 2.0 und 2.1 sind beide nur bis zu einer gewissen „Aufgabengröße“ einsetzbar. Denn wenn sowohl die Anzahl N der Antwortalternativen als auch die erreichbare Punktzahl P relativ groß sind, kann es dazu kommen, dass 1% P größer ist als die für 2 richtige Antworten vergebene Punktzahl.7 D.h. für solche Fragen (große Alternativenzahl N und große Maximalpunktzahl P) sind Version 2.0 und 2.1 nicht anwendbar, da sie keine Monotonie der Bewertung sicherstellen. Dieses Problem wird von Version 2.2 behoben.
Dazu wird ab dieser Version für 1 = r < N die Ein-Prozent-Punktevergabe nach oben beschränkt auf ein Drittel von G(2), also der mit r = 2 erreichbaren Punktzahl. Insbesondere ist so (selbst nach Rundung) sichergestellt, dass G(1) < G(2) – außer falls beide zu 0 Punkten abgerundet werden –, also dass es für zwei richtige Antworten auch mehr Punkte gibt als für nur eine richtige Antwort, selbst bei entsprechend „großen Aufgaben“ (mit hohen N und P).)
Formal lautet die Bewertung für »X aus N (V2.2)«:
\[ G(r) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ P & \text{, falls } r = N \\ min\left(E(P); \frac{2}{3N(N-1)}P \right) & \text{, falls } 1 = r < N \\ \frac{r (r-1)}{N (N-1)} P & \text{, falls } 1 < r < N \end{array} \right. \]
Dabei stehe die Funktion E(P) wiederum für die Ein-Prozent-Regel mit ggf. Aufrundung in Abhängigkeit vom Punkteformat der Kursumgebung:
\[ E(P) = \left\{\begin{array}{ll} max(1;\frac{1}{100} P) & \text{ bei Rundung auf ganze Punkte} \\ max(0{,}1;\frac{1}{100} P) & \text{ bei Rundung auf eine Nachkommastelle} \\ \frac{1}{100} P & \text{ bei Rundung auf zwei Nachkommastellen} \end{array} \right. \]
Das Endergebnis G(r) wird wieder ggf. auf das verwendete Punkteformat gerundet.
Im Fall r = 1 < N werden also in der Regel 1% von P Punkten vergeben, jedoch…
Hinweis vorab: Die Verfahren liefern offensichtlich für gleiche Antworten unterschiedliche Ergebnisse. Entscheidend ist daher, wie die erreichten Punkte anschließend zu bewerten/interpretieren sind. Falls die Aufgaben nicht nur zur Selbstkontrolle dienen, sondern z.B. relevant für eine Klausurzulassung oder Prüfungsleistung sind, werden die entsprechenden von Ihnen zu erreichenden Mindestpunktzahlen von den Aufgabenanbietern mit dem jeweils gewählten Bewertungsverfahren abgestimmt.
Vergleich der Bewertungen für N = 6 Antwortalternativen:
Richtige Antworten (aus 6) | X aus N | X aus N (V2.*) | X aus N + |
---|---|---|---|
6 | 100,00% | 100,00% | 100,00% |
5 | ⅔ ≈ 66,67% | ⅔ ≈ 66,67% | ⁵⁄₆ ≈ 83,33% |
4 | ⅓ ≈ 33,33% | 40,00% | ⅔ ≈ 66,67% |
3 | 0 | 20,00% | 50,00% |
2 | 0 | ²⁄₃₀ ≈ 6,67% | ⅓ ≈ 33,33% |
1 | 0 | 1,00%* | ¹⁄₆ ≈ 16,67% |
0 | 0 | 0 | 0 |
Vergleich der Bewertungen für N = 5 Antwortalternativen:
Richtige Antworten (aus 5) | X aus N | X aus N (V2.*) | X aus N + |
---|---|---|---|
5 | 100,00% | 100,00% | 100,00% |
4 | 60,00% | 60,00% | 80,00% |
3 | 20,00% | 30,00% | 60,00% |
2 | 0 | 10,00% | 40,00% |
1 | 0 | 1,00%* | 20,00% |
0 | 0 | 0 | 0 |
Vergleich der Bewertungen für N = 4 Antwortalternativen:
Richtige Antworten (aus 4) | X aus N | X aus N (V2.*) | X aus N + |
---|---|---|---|
4 | 100,00% | 100,00% | 100,00% |
3 | 50,00% | 50,00% | 75,00% |
2 | 0 | ⅙ ≈ 16,67% | 50,00% |
1 | 0 | 1,00%* | 25,00% |
0 | 0 | 0 | 0 |
*) Die Versionen V2.0 und V2.1 der Ratekorrektur sind in der Tabelle zusammengefasst, da sich der Unterschied ohnehin nicht als Prozentpunktzahl darstellen lässt. Vielmehr wurde die Angabe „1,00%“ an dieser Stelle mit einem Sternchen versehen, um zu markieren, dass sich die beiden Versionen genau hier unterscheiden: Falls 1% von P kleiner als 0,5 sein sollte und der Kurs so eingestellt ist, dass immer auf ganze Punktzahlen gerundet wird, so wird V2.0 hier immer auf 0 abrunden, während V2.1 hier auf 1 aufrundet, sofern für 2 richtige Antworten mehr als 1 Punkt erzielt werden kann. Falls Punktzahlen im betreffenden Kurs auf eine Stelle nach dem Komma gerundet werden und 1% der erreichbaren Punktzahl kleiner als 0,05 ist, so wird V2.0 hier immer auf 0 abrunden, während V2.1 auf 0,1 aufrundet, sofern mit zwei richtigen Antworten mehr als 0,1 Punkte erreichbar sind.
Version V2.2 unterscheidet sich weiterhin bei den obigen Tabellen nicht von Version 2.1, da bei diesen kleinen Werten für N stets die „1%-Regel“ greift (weil ein Drittel der für 2 richtige Antworten vergebenen Punkte jeweils noch größer als 1% wäre).
Erst bei größeren Alternativenzahlen N unterscheidet sich V2.2 von V2.0/V2.1, z.B.:
Vergleich der Bewertungen für N = 10 Antwortalternativen:
Richtige Antworten (aus 10) | X aus N | X aus N (V2.0/1) | X aus N (V2.2) | X aus N + |
---|---|---|---|---|
10 | 100,00% | 100,00% | 100,00% | 100,00% |
9 | 80,00% | 80,00% | 80,00% | 90,00% |
8 | 60,00% | 62,22% | 62,22% | 80,00% |
7 | 40,0% | 46,67% | 46,67% | 70,00% |
6 | 20,00% | 33,33% | 33,33% | 60,00% |
5 | 0 | 22,22% | 22,22% | 50,00% |
4 | 0 | 13,33% | 13,33% | 40,00% |
3 | 0 | 6,67% | 6,67% | 30,00% |
2 | 0 | 2,22% | 2,22% | 20,00% |
1 | 0 | 1,00%* | 0,74% | 10,00% |
0 | 0 | 0 | 0 | 0 |
In diesem Fall vergibt V2.2 ggf. (zumindest vor Rundung) etwas weniger Punkte für 1 richtige Antwort. Das ist aber nur bei größeren P überhaupt von Relevanz9.
Vergleich der Bewertungen für N = 20 Antwortalternativen:
Richtige Antworten (aus 20) | X aus N | X aus N (V2.0/1) | X aus N (V2.2) | X aus N + |
---|---|---|---|---|
20 | 100,00% | 100,00% | 100,00% | 100,00% |
19 | 90,00% | 90,00% | 90,00% | 95,00% |
18 | 80,00% | 80,52% | 80,52% | 90,00% |
17 | 70,00% | 71,57% | 71,57% | 85,00% |
16 | 60,00% | 63,16% | 63,16% | 80,00% |
15 | 50,00% | 55,26% | 55,26% | 75,00% |
14 | 40,00% | 47,90% | 47,90% | 70,00% |
13 | 30,00% | 41,05% | 41,05% | 65,00% |
12 | 20,00% | 34,74% | 34,74% | 60,00% |
11 | 10,00% | 28,95% | 28,95% | 55,00% |
10 | 0 | 23,68% | 23,68% | 50,00% |
9 | 0 | 18,95% | 18,95% | 45,00% |
8 | 0 | 14,74% | 14,74% | 40,00% |
7 | 0 | 11,05% | 11,05% | 35,00% |
6 | 0 | 7,89% | 7,89% | 30,00% |
5 | 0 | 5,26% | 5,26% | 25,00% |
4 | 0 | 3,16% | 3,16% | 20,00% |
3 | 0 | 1,58% | 1,58% | 15,00% |
2 | 0 | 0,53% | 0,53% | 10,00% |
1 | 0 | 1,00%* | 0,18% | 5,00% |
0 | 0 | 0 | 0 | 0 |
Bei so vielen Antwortalternativen sind V2.0 und V2.1 im Allgemeinen nicht sinnvoll anwendbar, weil sie für nur eine richtige Antwort mehr Punkte vergeben als für zwei (zumindest bei so großer erreichbarer Punktzahl P, dass 1% und 0,53% von P nicht auf dieselbe Punktzahl gerundet werden). Genau für solche Fälle wurde V2.2 eingeführt.
Eine zweite Klasse von Mehrfachauswahlaufgaben ist weitgehend identisch zur obigen, typischerweise wieder dargestellt als eine Liste von Antwortalternativen mit je einer Checkbox, über welche Sie die Ihrer Meinung nach zutreffenden Alternativen markieren. Es gibt bei dieser Variante jedoch folgende zwei Besonderheiten:
Für bearbeitete Aufgaben, d.h. wenn Sie mindestens eine Antwort als zutreffend markiert haben, entspricht die Bewertung aber genau den „X aus N“-Aufgaben im jeweiligen Modus (mit oder ohne Ratekorrektur) wie oben beschrieben.
Für diese Aufgaben stehen dieselben Bewertungsmodi bereit wie oben zu Klasse 1 beschrieben, die Bewertung unterscheidet sich nur darin, dass, wenn Sie gar nichts ankreuzen, die Aufgabe als unbearbeitet gilt und grundsätzlich mit 0 Punkten bewertet wird, während bei einer Aufgabe aus Klasse 1 das Ankreuzen gar keiner Alternative als Antwort gewertet wird, die eine (Teil-)Punktzahl erreichen kann, wenn tatsächlich alle oder viele der Alternativen falsch sind.
Multiple-Choice-Aufgaben können auch so gestellt werden, dass Sie pro Antwortalternative insgesamt 3 Antwortmöglichkeiten haben: »richtig«, »falsch« oder keine Antwort. Das hat dann Einfluss auf die Bewertung.
Die zuvor betrachteten Aufgabentypen haben gemein, dass Sie zu jeder Antwortalternative eine von zwei möglichen Antworten geben müssen: „richtig“ oder „falsch“ (bei Checkboxen: angekreuzt oder nicht angekreuzt). Sind Sie sich bei einer Antwort nicht sicher, müssen Sie raten.
In diesem Modus dagegen können Sie bei Antwortalternativen, bei denen Sie sich nicht sicher sind, selbst entscheiden, ob Sie die Alternative unbeantwortet lassen wollen (dann erhalten Sie auf diese nicht gegebene Antwort 0 Punkte) oder ob Sie raten wollen – mit der Chance auf mehr Punkte bei korrekter Antwort, aber ggf. auch auf weniger Punkte bei falscher Antwort (Ratekorrektur).
Auch hier gibt es wieder dieselben 3 Varianten bezüglich der Auswirkung falscher Antworten:
In diesem Modus vergibt der Bewerter wieder ausschließlich Pluspunkte: Jede richtige Antwort wird mit \(\frac{1}{N} P\) Punkten bewertet jede falsche mit 0 Punkten. Zu jeder Alternative, zu der Sie gar keine Antwort geben, erhalten Sie ebenfalls 0 Punkte, genauso als hätten Sie sie falsch beantwortet.
Die Bewertung entspricht also praktisch genau der „normalen“ Mehrfachauswahlaufgabe ohne Ratekorrektur (»X aus N +«), nur ergänzt um die Regel, dass Sie auf eine Antwortalternative, zu der Sie gar keine Antwort geben, ebenso 0 Punkte erhalten wie auf eine falsche Antwort.
Entsprechend ist das Bewertungsergebnis wieder so zu interpretieren, dass 50% der erreichbaren Punktzahl noch ein schlechtes Ergebnis darstellen (da man sie im Durchschnitt auch mit reinem Raten ohne jegliches Wissen erreichen kann), dass also erst Ergebnisse ab etwa 75% aufwärts ausreichendes Wissen nachweisen.
Bei dieser Variante erhalten Sie für jede korrekte Antwort Pluspunkte, für eine falsche Antwort entsprechend Minuspunkte, für eine unbeantwortete Alternative einfach gar keine Punkte. Genauer:
Sei wieder N die Anzahl der Antwortalternativen und P die maximal erreichbare Gesamtpunktzahl, dann ist analog zum klassischen „X aus N“ jede Antwortalternative \(\frac{1}{N} P\) Punkte „wert“. Für jede richtige Antwort werden dann \(\frac{1}{N} P\) Punkte gutgeschrieben, für jede falsche Antwort abgezogen, für unbeantwortete Alternativen gibt es 0 Punkte.
Bei r richtigen Antworten und f falschen Antworten (wobei hier im Unterschied zu obigen Modi 0 ≤ r + f ≤ N gilt, also insgesamt weniger als N Antworten gegeben werden können) errechnet sich somit die Gesamtpunkzahl G als:
\[ G(r,f) = max\left(0, \frac{r - f}{N} P \right) \]
(Im Prinzip ist das die gleiche Formel wie oben unter „X aus N“ angegeben, nur ohne die Nebenbedingung, dass r + f = N gilt und entsprechend ohne die Umformungsmöglichkeit in eine nur von r abhängige Gleichung.)
In diesem Modus kommt dieselbe Ratekorrektur zum Einsatz wie bei einfacher Mehrfachauswahlaufgabe mit Ratekorrektur Version 2. Im Folgenden nennen wir den oben beschriebenen Bewertermodus einfach kurz „V2-Bewertung“. N bezeichne wieder die Anzahl der Antwortalternativen in der Aufgabe und P die maximal erreichbare Punktzahl.
Dann erfolgt die Anwendung der V2-Bewertung auf diesen Aufgabentyp wie folgt:
Wie bei der Mehrfachauswahlaufgabe mit Ratekorrektur Version 2 können auch hier wieder die drei Versionen 2.0, 2.1 oder 2.2 zum Einsatz kommen, die sich lediglich in bestimmten Grenzfällen in der Punktevergabe im Fall r = 1 und 0 < f < N unterscheiden, also für genau eine richtige Antwort bei mindestens einer falschen Antwort.
In einer Formel lässt sich das wie folgt zusammenfassen10:
\[ G(r,f) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ \frac{r}{N} P & \text{, falls } f = 0 \\ \frac{1}{100} P & \text{, falls } r = 1 \wedge f > 0 \\ \frac{r(r-1)}{N(r+f-1)} P & \text{, falls } 1 < r < r + f \end{array} \right. \]
Auch Mehrfachauswahlaufgaben mit 3 Antwortmöglichkeiten können natürlich mit der Ratekorrektur Verson 2.1 kombiniert werden, analog zu Klasse 1, Mehrfachauswahlaufgabe mit Ratekorrektur Version 2.1 (»X aus N (V2.1)«).
V2.1 und V2.0 unterscheiden sich auch hier wieder nur in einem Detail, nämlich falls 1% der Punkte von V2.0 auf 0 Punkte abgerundet würde:
Wieder als Formel zusammengefasst errechnet sich die Punktzahl dann also wie folgt:
Und auch die neueste V2.2-Bewerterversion steht natürlich zur Verfügung, die im Fall sehr „langer Aufgaben“ mit einer hohen Anzahl von Antwortalternativen nochmals die Punkteberechnung für genau eine richtige Antwort (bei mindestens einer falschen) überarbeitet und strenge Monotonie der G-Funktion sicherstellt:
Hier greift wieder die Limitierung auf ein Drittel der bei zwei richtigen Antworten (und gleicher Anzahl beantworteter Alternativen, also einer falschen Antwort weniger) erreichbaren Punktzahl G(2, f − 1), sowie die Aufrundung auf 1 Punkt, falls 1% P sonst eigentlich zu 0 abgerundet würde und für zwei richtige Antworten mindestens 2 Punkte vergeben werden.
Wieder als Formel zusammengefasst errechnet sich die Punktzahl dann also wie folgt (wobei das Ergebnis G(r,f) abschließend auf das Punkteformat der Kursumgebung gerundet wird):
\[ G(r,f) = \left\{\begin{array}{ll} 0 & \text{, falls } r = 0 \\ \frac{r}{N} P & \text{, falls } f = 0 \\ min\left(E(P); \frac{2}{3N f}P \right) & \text{, falls } r = 1 \wedge f > 0 \\ \frac{r(r-1)}{N(r+f-1)} P & \text{, falls } 1 < r < r + f \end{array} \right. \]
mit unveränderter Ein-Prozent-Funktion E(P):
\[ E(P) = \left\{\begin{array}{ll} max(1;\frac{1}{100} P) & \text{ bei Rundung auf ganze Punkte} \\ max(0{,}1;\frac{1}{100} P) & \text{ bei Rundung auf eine Nachkommastelle} \\ \frac{1}{100} P & \text{ bei Rundung auf zwei Nachkommastellen} \end{array} \right. \]
Das zweite Argument der Minimum-Funktion im Fall r=1, f > 0 entspricht dabei wieder einem Drittel der mit zwei richtigen Antworten bei insgesamt gleicher Antwortzahl, also einer falschen Antwort weniger, erreichbaren Punktzahl: \( \frac{1}{3} G(2, f-1) = \frac{2}{3N(2+f-2)}P = \frac{2}{3N f}P\).
Analog zu „einfachen“ Mehrfachauswahlaufgaben unterscheiden sich die Ratekorrekturmodi auch hier genau dann in der Bewertung, sobald Sie mehr als eine falsche Antwort geben.
Für N = 5 Alternativen sieht die Bewertung z.B. wie folgt aus:
r | f | unbeantwortet | X aus N (3 Antw.) | X aus N (3 Antw., V2.*) | X aus N + (3 Antw.) |
---|---|---|---|---|---|
5 | 0 | 0 | 100% | 100% | 100% |
4 | 0 | 1 | 80% | 80% | 80% |
4 | 1 | 0 | 60% | 60% | 80% |
3 | 0 | 2 | 60% | 60% | 60% |
3 | 1 | 1 | 40% | 40% | 60% |
3 | 2 | 0 | 20% | 30% | 60% |
2 | 0 | 3 | 40% | 40% | 40% |
2 | 1 | 2 | 20% | 20% | 40% |
2 | 2 | 1 | 0 | 13,33% | 40% |
2 | 3 | 0 | 0 | 10% | 40% |
1 | 0 | 4 | 20% | 20% | 20% |
1 | 1-4 | 3-0 | 0 | 1%* | 20% |
0 | 0-5 | 5-0 | 0 | 0 | 0 |
(In obiger Tabelle stehe r wieder für die Anzahl Ihrer korrekten Antworten, d.h. die Anzahl der Antwortalternativen, für die Sie korrekt beantworten konnten, ob sie zutreffend sind oder nicht, und f steht entsprechend für die Anzahl Ihrer falschen Antworten. In der Spalte »unbeantwortet« steht mit der Differenz 5 - r - f jeweils die Anzahl der unbeantworteten Alternativen.)
*) In der vorletzten Tabellenzeile gilt wieder, dass Version 2.0 des Bewerters die Punktzahl (1%) ggf. auf 0 Punkte abrundet (bei Rundung auf ganze Punkte im Fall P < 50, bei Rundung auf eine Nachkommastelle im Fall P < 5), während Versionen 2.1 und 2.2 hier einen Punkt (bzw. 0,1 Punkte) vergeben, sofern für eine richtige Antwort mehr (also 2 richtige) und eine falsche Antwort weniger mehr als ein Punkt (bzw. mehr als 0,1 Punkte) vergeben würde. Version 2.2 unterscheidet sich bei nur_N = 5 Antwortalternativen nicht von V2.1, da ein Drittel von G(2, f −1) für alle f (und r = 1) immer > 1% ist.
Die Musterlösung (siehe auch folgenden Abschnitt) zählt nur die korrekten Antworten auf. Unter „Ihre Lösung“ stehen Ihre Antworten wie folgt:
Die Bewertung, welche Ihrer Antworten richtig oder falsch ist, richtet sich nach der hinterlegten Musterlösung. In der Regel handelt es sich dabei schlicht um die Aufzählung der richtigen Antworten (z.B: A,C,E
).
In gewissen Spezialfällen können folgende Besonderheiten vorkommen:
+
, so gilt die entsprechende Alternative sowohl als richtig als auch falsch, d.h. Ihre Antwort ist diesbezüglich immer richtig, egal ob Sie diese Alternative angekreuzt haben oder nicht. (Üblicherweise verwendet, um missverständliche Antwortalternativen nachträglich aus der Wertung zu nehmen.) Beispiel: A,B+,C
besagt, dass Sie die volle Punktzahl bekommen, wenn Sie A und C und optional auch B geantwortet haben (und keine falsche Antwort wie D oder E gegeben haben).
A,E oder C,E
. In dem Fall wird zur Bewertung Ihrer Antwort diejenige Musterlösung verwendet, mit der Sie am meisten Punkte bekommen.
C,F (100 P.) oder D,H (100 P.) oder A,E (50 P.)
.Adressaten dieses Dokuments sind die Studentinnen und Studenten, die solche Mehrfachauswahlaufgaben bearbeiten. Sollten Angehörige anderer Personengruppen dieses Dokument lesen, ist die persönliche Anrede „Sie“ entsprechend zu interpretieren. ↩
Zumindest ist das der Normalfall, dass sich vor jeder Antwortalternative eine Checkbox befindet, die Sie ankreuzen, wenn Sie die Alternative für korrekt halten, oder nicht ankreuzen, wenn Sie sie für falsch halten. Technisch sind jedoch durchaus auch andere Eingabeformen denkbar. ↩
Genauer: Bei der Ratekorrektur V2.0 vergibt der Bewerter nur bei komplett falsch beantworteten Fragen exakt 0% der erreichbaren Punkte. Bei einer richtigen neben ansonsten nur falschen Antworten wird z.B. mit 1% bewertet, bei noch mehr richtigen Antworten auch höher. Die daraus errechnete Punktzahl wird jedoch abschließend gerundet, so dass es – je nach erreichbarer Punktzahl – in solchen Fällen eine 0-Punkte-Wertung durch Abrundung geben könnte. Wenn z.B. 10 Punkte erreichbar sind und Sie mit genau einer richtigen von N Antworten noch 1% bekämen, so errechnet sich die Endpunktzahl als 1% von 10 P. = 0,1 P. ≈ 0 P. (auf volle Punktzahl 0 abgerundet). Bei 50 erreichbaren Punkten dagegen wäre 1% von 50 P. = 0.5 P. ≈ 1 P. (auf volle Punktzahl aufgerundet). Die Ratekorrektur V2.1 weicht davon insofern ab, als dass sie bei genau einer richtigen Antwort im Fall, dass die dann vergebenen 1% der Punkte zu 0 abgerundet würden, doch auf 1 Punkt aufrundet (sofern die erreichbare Punktzahl nicht so niedrig ist, dass schon mit 2 richtigen Antworten nur max. 1 Punkt erreichbar wäre).
Diese Angaben gehen jeweils vom Normalfall aus, dass im Kurs nur mit ganzen Punkten gearbeitet wird. Es ist auch möglich, dass Kurse auf eine oder zwei Stellen nach dem Komma runden. ↩
Das setzt eine hinreichend große Maximalpunktzahl voraus. Für genau eine richtige Antwort werden i.d.R. – wie im Text noch genauer beschrieben – ein Prozent der erreichbaren Punkte vergeben. Bei relativ geringer erreichbarer Punktzahl ist es möglich, dass dieser Wert effektiv auf 0 Punkte abgerundet wird. ↩
Bei genau einer falschen Antwort werden von beiden Ratekorrekturversionen 60% der erreichbaren Punkte vergeben. Sollte es sich dabei jedoch nicht um eine ganze Zahl handeln, sondern diese auf das von der Kursumgebung verwendete Punkteformat (0, 1 oder 2 Nachkommastellen) gerundet werden müssen, so kann sich eine minimale Abweichung ergeben, da die klassische Ratekorrektur stets abrundet, während V2.* hier kaufmännisch rundet. ↩
Für Interessiertere hier der wesentliche Teil der Herleitung der vereinfachten Darstellung: Die Produktformel \( \prod_{i=r+1}^N \frac{i-2}{i} \) lässt sich wie folgt umformen: \[ \prod_{i=r+1}^N \frac{i-2}{i} = \left( \prod_{i=r+1}^N (i-2) \right) \cdot \left( \prod_{i=r+1}^N \frac{1}{i} \right) = \frac{(N-2)!}{(r-2)!} \cdot \frac{r!}{N!} = \frac{r(r-1)}{N(N-1)} \] Dank an Patrick Holzer, der mich auf diese Vereinfachungsmöglichkeit hingewiesen hat! Detailliertere Erläuterungen zum zweiten der obigen Umformungsschritte: Dieser bildet die beiden zu multiplizierenden Produkte jeweils auf einen Quotienten mit Fakultäten ab. Die Fakultätsfunktion ist dabei wie folgt definiert: \[n! := 1 \cdot 2 \cdot 3 \cdot \ldots \cdot n = \prod_{i=1}^n i\] Die folgenden beiden Hilfsregeln lassen sich einfach daraus ableiten: \[\prod_{i=1}^n \frac{1}{i} = \frac{1}{1} \cdot \frac{1}{2} \cdot \frac{1}{3} \cdot \ldots \cdot \frac{1}{n} = \frac{1}{n!}\] \[ \prod_{i=m+1}^n i = \frac{\prod_{i=1}^n i}{\prod_{i=1}^m i} = \frac{n!}{m!} \] Damit lassen sich die beiden Teilprodukte jeweils wie folgt umformen: \[ \prod_{i=r+1}^N (i-2) = \prod_{i=r-1}^{N-2} i = \frac{(N-2)!}{(r-2)!}\] \[ \prod_{i=r+1}^N \frac{1}{i} = \frac{\frac{1}{N!}}{\frac{1}{r!}} = \frac{r!}{N!}\] Der letzte Umformungsschritt der oben stehenden Formel eliminiert die Fakultäten durch einfaches Bruch-Kürzen, erstens: \[ \frac{r!}{(r-2)!} = \frac{1 \cdot 2 \cdot \ldots \cdot (r-2) \cdot (r-1) \cdot r}{1 \cdot 2 \cdot \ldots \cdot (r-2)} = (r-1) \cdot r \] Und zweitens kürzt sich \( \frac{(N-2)!}{N!} \) analog zu \(\frac{1}{N(N-1)}\). ↩
Beispiel: Angenommen sei eine X-aus-20-Frage mit 1000 erreichbaren Punkten. Dann würden sowohl V2.0 als auch V2.1 für eine richtige Antwort 10% von 1000, also 10 Punkte vergeben. Das reguläre Schema berechnet für den Fall r=2, also nur zwei von zwanzig richtigen Antworten (sprich: 18 Fehlern) bei einer so großen erreichbaren Punktzahl aber nur \(\frac{2}{20 \cdot 19} \cdot 1000 = \frac{2000}{380} \approx 5\) Punkte. D.h. durch einen Fehler mehr könnte man seine Punktzahl verbessern (hier sogar verdoppeln).
In der Praxis sind Fragen dieser Art (so viele Alternativen und große Punktzahlen) sicher die Ausnahme, m.W. gab es sie zum Zeitpunkt der Einführung von Version 2.2 noch gar nicht. Dennoch wurde V2.2 entwickelt, um sie für die Zukunft zu unterstützen. ↩
Während in der Bewerterformel für »X aus N V2.1« noch eine explizite Fallunterscheidung abhängig von \(\lceil G(2) \rfloor\) getroffen wurde, erfolgt dieselbe Fallunterscheidung in V2.2 implizit. Genauer funktioniert diese V2.1-Kompatibiltät wie folgt, hier am Beispiel des Punkteformats »ganze Punkte« demonstriert:
Falls G(2) ≥ 1,5, d.h. falls (nach Aufrunden auf eine ganze Punktzahl) für zwei richtige Antworten mindestens 2 Punkte vergeben werden, so ist \( \frac{1}{3} G(2) \ge 0{,}5\). Gerundet auf eine ganze Punktzahl entspricht das mindestens 1 Punkt (und weniger als G(2)). Für genau eine richtige Antwort wird dann also mindestens \(min(max(1, ?), 1) = 1\) Punkt vergeben. (Das Fragezeichen steht hier für einen beliebigen Wert, der keine Auswirkung mehr auf die Bewertung hat.)
Ist dagegen G(2) < 1,5, so wird erstens für zwei richtige Antworten (nach Rundung) maximal 1 Punkt vergeben, und zweitens ist dann ein Drittel von G(2) < 0,5, was auf 0 Punkte abgerundet wird. Für genau eine richtige Antwort gibt es dann also \(min(?, 0) = 0\) Punkte (und damit ebenfalls weniger als für zwei richtige Antworten). ↩
Für so kleine P (z.B. P = 100), dass G(2) nach Rundung = 2 oder = 1 ist, verhält sich V2.2 (nach Rundung) analog zu V2.1: Ist G(2) nach Rundung z.B. = 2, also vor Rundung ≥ 1,5 (und < 2,5), so ist G(1) (= G(2) / 3) ≥ 0,5 und < 0,83, wird also auf einen Punkt aufgerundet. Und für G(2) < 1,5, wenn also für 2 Richtige nach Rundung max. 1 Punkt vergeben wird, ist G(1) < 0,5, wird also dann zu 0 Punkten abgerundet. ↩
Diese Formel für X-aus-N mit 3 Antwortalternativen leitet sich wie folgt her: Es wird als Ausgangspunkt die Formel von X-aus-N V2.0 verwendet. Da die Gesamtzahl der gegebenen Antworten hier jedoch nicht mehr zwangsläufig gleich N ist, sondern kleiner sein kann, ist in der Formel jeweils N durch die in diesem Fall tatsächlich gegebene Anzahl von Antworten, also durch r + f zu ersetzen. Weiterhin ist (außer für Fall 3, die 1%-Regel bei r = 1 und f > 0) jeweils die mit N Antworten erreichbare Punktzahl P durch die mit r + f Antworten maximal erreichbare Punktzahl \(P' = \frac{r+f}{N} P \) zu ersetzen. Die Bedingung für Fall Nr. 2 (alles richtig) ändert sich somit von r = N zu r = r + f oder kurz f = 0, und die Punktzahl ist dann nicht mehr P, sondern \(P' = \frac{r+f}{N} P = \frac{r}{N}\). (Letztere Vereinfachung ist möglich, weil ja in diesem Fall f = 0 gilt.)
In Fall Nr. 4 / Normalfall (\(\frac{r(r-1)}{N(N-1)} P\) für 1 < r < N) der Formel zum X-aus-N-V2-Bewerter wird wieder P ersetzt durch \(\frac{r+f}{N} P\), und N im Bruch davor durch r + f: \(\frac{r(r-1)}{(r+f)(r+f-1)}\). Die zu vergebende Punktzahl, das Produkt, lässt sich noch kürzen:
\[\frac{r(r-1)}{(r+f)(r+f-1)} \cdot \frac{r+f}{N} P = \frac{r(r-1)}{N(r+f-1)} P\]
Die Bedingung zum vierten Fall ist dann 1 < r < r + f. ↩