Testování podle jistoty: 2 | MoodleMoot.cz 2024

2. 2

Navigace v testu

Modle ve verzi 2.x přinesl mnoho změn v testování, které si krátce zrekapitulujeme. Zcela zásadní změnu přinesla verze 2.1, která má znovu naprogramované jádro. Příčinou bylo doplnění chování testů o měření jistoty odpovědí. Teorie je popsaná např. v [1].

Při vlastním testování přibyl pro uživatele nový navigační blok, který obsahuje kromě informace o počtu úloh, aktuální úloze i signalizaci o otázkách (vlaječky) a po ukončení testu i signalizuje úspěšné odpovědi, částečně úspěšné a neúspěšné odpovědi.

Obr. 1 Navigace a vlaječky u úloh při testu a po ukončení (prohlídka).

Přenastavení testů - skupinová

Skupinová přenastavení testů je velmi užitečná vlastnost podporující rozlišení skupin se speciálními vzdělávacími potřebami. Skupiny mohou mít pro test odlišné podmínky v závislosti na předpokládaných schopnostech nebo jen jiný termín plnění. Diferenciace je možná v

čase na splnění testů,
počtu opakování testů,
termínu přístupu do testu.

Přenastavení testů - uživatelská

Individuální přenastavení testů je použitelná vlastnost pro individuální plnění při nepřítomnosti uživatele při vyučování a podobně. Postup je obdobný jako ve skupinovém přenastavení. Ukazuje se, že obdobné vlastnosti jsou žádané i pro jiné činnosti obdobného charakteru (odevzdání úloh aj.).

Chování testů

V chování úloh při testování přibyly způsoby hodnocení na základě jistoty respondenta se svou odpovědí. Než popíšeme realizaci takto pojatých testů, projdeme si některé motivace realizace této vlastnosti.

Úvod k testům

Všeobecné požadavky na testy [2]:

Reliabilita testu ‑ omezení vlivu náhody a hádání.
Diskriminace – schopnost rozlišit úspěšné a neúspěšné respondenty.
Jiné, které jsou mimo naše téma.

Jedním z formálních postupů „zlepšení“ vlastností testů jsou metody známkování úloh:

Při tradičním bodování správných odpovědí se do výsledku promítají také uhodnuté odpovědi. Takový test obsahuje část bodů, které neodpovídají skutečné znalosti.
Eliminací štěstí v hádání je zavedení záporného hodnocení za nesprávnou odpověď.
Zavedením hodnocení jistoty odpovědi se posiluje penalizační faktor. Za nesprávné odpovědi lze získat až dvojnásobnou penalizaci proti správné odpovědi. Tento způsob je implementován ve verzi Moodle 2.1 a bude detailně popsán.

Záporné body v hodnocení

Zavedení záporného bodování úloh není běžně používáno, má následující vlastnosti:

Zvětšení rozdílu mezi lepšími a horšími studenty.
Obvykle nezmění pořadí výsledků testu.
Do výsledku se mohou promítnout osobnostní rysy respondenta (dokonce se předpokládají rozdíly mezi studenty a studentkami).
Minimální vyžadovaný počet bodů v testu se liší pro testy bez záporného bodování a se záporným bodováním úloh.

Jistota

Dosavadní způsob testování se nezajímal o hodnocení jistoty odpovědi, všechny odpovědi byly hodnoceny stejně. Respondent nemusel uvažovat v případě neznalosti správné odpovědi o tom, že špatná odpověď se negativně promítne ve výsledku. Mohl hádat, vylučovat špatné odpovědi a mohl tím jen získat.

Hodnocení dle jistoty odpovědi se vyhodnocuje dle míry jistoty (či nejistoty) odpovědi, příklad hodnocení je uveden v následující tabulce. Hodnoty byly zvoleny tak, aby se počítalo jen s celými čísly.

Tabulka 1 Tabulka hodnocení dle jistoty.

Graf vycházející z této tabulky ukazuje míru penalizace, oblast hádání a procenta jistoty, použité v implementaci testů.

Obr. 2 Graf hodnocení odpovědí podle jistoty.

Realizace v Moodle

Realizace testů na měření jistoty odpovědi je obsaženo v nových variantách chování testů:

Adaptivní režim
Adaptivní režim (bez penalizace)
Odložený výsledek s mírou jistoty
Odložený výsledek
Okamžitý výsledek s mírou jistoty
Okamžitý výsledek
Interaktivní s více pokusy
Interaktivní s více pokusy (se započtením předchozích pokusů)
Ruční známkování

Oproti popisu pokusů se jedná o velké rozšíření s přidáním dalšího časového okamžiku pro nastavení možností prohlídky.

Při variantách s jistotou je úloha rozšířena o dotaz na jistotu (viz. Obr. 3).

Obr. 3 Ukázka realizace úloh s jistotou odpovědi.

Pokusné testy

Pro ověření základních výsledků, jejich charakteristik jsem realizoval několik pokusných ověřování formou opičích testů. Výsledky nejsou překvapující, spíše dokladují, že realizace randomizace úloh a odpovědí je v Moodle skutečně v pořádku. Počet pokusů byl 4, proto je výsledky nutné brát s přihlédnutím k tomuto počtu.

Použitý postup:

Pro testy byla vytvořena banka úloh, která obsahovala úlohy výběru z možných odpovědí (jedné odpovědi ze tří možností).
Jeden test byl bez hodnocení jistoty – výsledné hodnocení bylo cca 30%, což odpovídá pravděpodobnosti hádání.
Další test, ve kterém byla uplatněna nízká míra jistoty – výsledné hodnocení bylo -3%, tedy těsně pod nulou.
Posledním testem byly pokusy s vysokou mírou jistoty – výsledné hodnocení bylo -33%. Tady se projevila penalizace chybných odpovědí.

Je nutno poznamenat, že do celkového hodnocení známek uživatele se záporný výsledek testu transformuje na nulu. Dokladem je přehled známek testovací skupiny.

Obr. 4 Výsledky testovací skupiny.

První závěry

Zatím budu velmi opatrný v závěrech, ale předpokládám, že použití jistoty v testech bude znamenat změnu v testování. Pro použití bude:

nutné dobře informovat respondenty o změnách ve vyhodnocení testů,
velmi odpovědně posoudit požadované hranice pro stanovení škály hodnocení, inspirace [2],
ne všechny typy úloh budou vhodné pro realizaci testů s použitím jistoty (otevřené otázky?),
u respondentů se více vyplatí neodpovídat než hádat.

První pohled na statistiky poskytované v Moodle ukazují, že analýza bude obtížnější, protože dvourozměrné vstupy jsou vlastně přeměněny na jednorozměrnou statistiku. Závislost na hodnotě jistoty odpovědí jsou zakomponovány do hodnot a v analýze se zatím těžko dozvíme, jak si respondenti věřili.

Závěr

První implementace Moodle verze 2.1 jsou příliš čerstvé a nejsou zatím delší zkušenosti s implementací testů s hodnocením jistoty. Budeme se těšit na realizace a zkušenosti z reálného prostředí škol či univerzit.

Literatura

Gardner-Medwin, A.R. & Curtin, N.A. (2007). Certainty-Based Marking (CBM) For Reflective Learning And Proper Knowledge Assessment. From the REAP International Online Conference on Assessment Design for Learner Responsibility, 29th-31st May, 2007. [cit. 2011-10-01]. Available at http://ewds.strath.ac.uk/REAP07
Tvorba testů , www.SCIO.cz s.r.o, online 2008 [cit. 2011-10-01]. Dostupné na www: http://www.scio.cz/tvorba_testu/index.asp