Vzgoja in izobraževanje v informacijski družbi Razprava IS 2004 1 Odlo č itvena drevesa za individualno testiranje u č encev Irena Nančovska Šerbec, Alenka Praprotnik, Jože Rugelj Pedagoška fakulteta, Univerza v Ljubljani, Ljubljana, Slovenija, irena.nancovska@guest.arnes.si, alenka.praprotnik@siol.net, joze.rugelj@uni-lj.si, V članku je predstavljena možnost uporabe odločitvenih dreves za sestavljanje testov, ki se prilagajajo trenutnemu znanju posameznega učenca. V prvi fazi realiziramo spletno testiranje učencev s širšo množico vprašanj in nalog, ki se nanašajo na določen tematski sklop. Rezultate testov shranjujemo v skupno podatkovno bazo. Testiranje je anonimno in uporabniku, oziroma učencu omogoča večkratno vrednotenje testov. S pomočjo mehanizmov strojnega učenja v naslednji fazi zgradimo odločitvena drevesa in druge modele, ki predstavljajo klasifikacijo učencev v razrede uspešnosti. Modeli hkrati predstavljajo hierarhijo absorpcije znanja s strani množice učencev, ki smo jih testirali, oziroma povprečno obvladovanje posameznih ciljev, ki jih določena naloga v hierarhiji drevesa preverja. V zadnji fazi na podlagi odločitvenih dreves realiziramo hitro testiranje učenca, za katero uporabljamo odločitveno drevo kot klasifikator. To pomeni, da se test prilagodi trenutnemu znanju, ki ga učenec kaže v predhodnih fazah testiranja. Možnost uporabe metod strojnega učenja smo potrdili na domeni, ki predstavlja množico ocenjenih testov iz osnovnošolske matematike.. Ključne besede: Klasifikacija, odkrivanje znanja iz podatkov, odločitvena drevesa, izbiranje atributov DECISION TREES FOR INDIVIDUAL STUDENT TESTING: In the paper we present a possible use of decision trees for testing, which is adapted to the knowledge of each student. In the first phase we realize web testing of the students with wider set of exercises, regarding to specific topics. Results of testing are saved in a common data base. Testing is anonymous and it enables students multiple test evaluations. In the next phase, by using machine learning recipes, we built decision trees and other models which present students' classification into classes of successfulness. At the same time, models present hierarchy of knowledge absorption by the tested students, or average knowledge of particular goal, captured in each separate exercise. Finally, we realize fast web testing and classification, based on the decision tree. This means that the test is adapted to the knowledge, which is showed through testing. We demonstrate the possibility of use of machine learning on the domain of validated tests of primary school mathematics. Key Words: Classification, Knowledge Discovery from Data, Decision Trees, Attribute Selection 1 Uvod Izobraževani proces je v sedanjem času prepleten in podprt z možnostmi, ki jih ponuja Svetovni splet. Pri tem ni samo obogaten z dosežki izobraževalno-komunikacijske tehnologije, pač pa je tudi pestrejše organiziran. Ponuja fleksibilnost glede časa, prostora, vsebine in tempa izobraževanja. Učni proces je organiziran v smislu pridobivanja in ustvarjanja novega znanja, v katerem učitelj ni več edini prenašalec znanja in posredovalec določenih dejstev. Učenci znanje pridobivajo iz različnih virov, kar jim omogoča sodobna informacijsko- komunikacijska tehnologija in napredek v razvoju telekomunikacij (Praprotnik 2004). Učno okolje, obogateno s spletom, omogoča ne samo u č enje, ampak tudi ocenjevanje nau č enega po meri posameznega učenca. Za učitelja je izbira testov, ki bi bili hkrati reprezentativni in bi zahtevali malo časa za reševanje, pomembna naloga v njegovem strokovnem delu. V pričujočem članku si prizadevamo, da bi z uporabo metod strojnega učenja olajšali delo učiteljem pri ocenjevanju znanja učencev. Radi bi izdelali sistem za samodejno generiranje testov, ki se bo prilagajal trenutnemu znanju učenca oziroma posamezniku. Pri uspešnih učencih bi testiranje lahko izvedli le na pomembnejših nalogah, saj so osnovne naloge zanje praviloma nezanimive in dolgočasne. Dobrim učencem, ki se le malo razlikujejo od odličnih, bi predlagali ponavljanje le tistih tem, ki jih pri strojnem ocenjevanju »ločijo« od odličnih. Slabšim učencem, pa bi s pomočjo zgrajenih modelov predlagali le ponovitev pomembnejših tem, saj so zaradi slabega poznavanja osnov večkrat slabše ocenjeni. S pomoč jo prijemov umetne inteligence, kot so odkrivanje znanja iz podatkov (ang. Knowledge Discovery from Data - KDD), ki je netrivialen proces odkrivanja implicitnega, doslej neznanega in potencialno uporabnega znanja iz podatkov (Bohanec 2004), skušamo odkriti zakonitosti, ki omogočajo hitro in individualno prilagojeno testiranje. S podatkovnim rudarjenjem (ang. Data Mining- DM), ki je faza odkrivanja znanja iz podatkov v kateri dejansko pride do »odkrivanja znanja«, skušamo analizirati podatkovno bazo, ki je sestavljena iz testov učencev, katerim je bil predstavljen določen tematski sklop s strani učitelja. Podatkovna baza skriva zakonitosti učnega uspeha učencev pri absorpciji znanja, ki se nanaša na omenjen učni sklop. Z metodami podatkovnega rudarjenja bi radi zgradili sistem za