Confusion matrix o missclassification error e framtana.
2. Confusion matrisen ser i överlag bra ut. hade svårast för 7,8,9,1. Framförallt 9.
3. De lättaste fallen för 8 är enkla att tyda men de svåraste kan man förstå att det är svårt genom heatmap. Missclassification för training är 0,045 oc tes 0,053.
4. Komplexiteten r som öst då k r lägst. Dvs komplexiteten minskar när k ökar. Optimalt k är när validation error (0,0215) är lägst, vilket är då k = 3. test error = 0,024. Vilket är högre än träningsdatan men lite lägre än valideringsdatan. Enligt oss är det en bra model då den misslyckas på typ var 40-50e tal. Det beror ju såklart på vad modellen ska appliceras på också.
5. Optimal k = 6. Då entropin r som lägst då. cross entropy tar hänsyn till confidence till en prediction. dvs storleken på felet tar den hänsyn till. Vilket är en bättre representation av hur bra modellen är om det är multionmial distribution.
Part 2
2. DFA är viktigast men även PPE och HNR i minskande ordning. Framförallt DFA
test: lambda = 1 : mse = 0,9347, lambda = 100: 0,9341, lambda = 1000: mse = 0,9678. 100 verkar va bästa penaltyn då det minska inte testfelet med lägre degrees of freedom, enlgit tetningsdatan.