<?xml version="1.0" encoding="UTF-8"?>
<collection xmlns="http://www.loc.gov/MARC21/slim">
 <record>
  <leader>04579ntm a22005417i 4500</leader>
  <controlfield tag="001">000722917</controlfield>
  <controlfield tag="003">CZ-PrVSE</controlfield>
  <controlfield tag="005">20250608110309.0</controlfield>
  <controlfield tag="006">m        d</controlfield>
  <controlfield tag="007">cr n||||||||||</controlfield>
  <controlfield tag="008">250608s2025    xr     fsbm   000 0 cze d</controlfield>
  <datafield tag="STA" ind1=" " ind2=" ">
   <subfield code="a">NEZPRACOVANÝ IMPORT</subfield>
  </datafield>
  <datafield tag="040" ind1=" " ind2=" ">
   <subfield code="a">ABA006</subfield>
   <subfield code="b">cze</subfield>
   <subfield code="c">ABA006</subfield>
   <subfield code="d">ABA006</subfield>
   <subfield code="e">rda</subfield>
  </datafield>
  <datafield tag="100" ind1="1" ind2=" ">
   <subfield code="a">Janošíková, Lucie</subfield>
   <subfield code="%">ISIS:149306</subfield>
   <subfield code="4">dis</subfield>
  </datafield>
  <datafield tag="242" ind1="1" ind2="0">
   <subfield code="a">Evaluation of the results of classification tasks</subfield>
   <subfield code="y">eng</subfield>
  </datafield>
  <datafield tag="245" ind1="1" ind2="0">
   <subfield code="a">Hodnocení výsledků klasifikačních úloh /</subfield>
   <subfield code="c">Lucie Janošíková</subfield>
  </datafield>
  <datafield tag="264" ind1=" " ind2="0">
   <subfield code="c">2025</subfield>
  </datafield>
  <datafield tag="300" ind1=" " ind2=" ">
   <subfield code="a">?? stran :</subfield>
   <subfield code="3">digital, PDF soubor</subfield>
  </datafield>
  <datafield tag="500" ind1=" " ind2=" ">
   <subfield code="a">Vedoucí práce: Hana Řezanková</subfield>
  </datafield>
  <datafield tag="502" ind1=" " ind2=" ">
   <subfield code="a">Diplomová práce (Ing.)—Vysoká škola ekonomická v Praze. Fakulta informatiky a statistiky, 2025</subfield>
  </datafield>
  <datafield tag="504" ind1=" " ind2=" ">
   <subfield code="a">Obsahuje bibliografii</subfield>
  </datafield>
  <datafield tag="516" ind1=" " ind2=" ">
   <subfield code="a">Textový (vysokoškolská kvalifikační práce)</subfield>
  </datafield>
  <datafield tag="518" ind1=" " ind2=" ">
   <subfield code="a">Rok obhajoby 2025</subfield>
  </datafield>
  <datafield tag="520" ind1="3" ind2=" ">
   <subfield code="a">Klasifikace dat představuje jednu z klíčových oblastí statistiky. Práce stručně představuje vybrané klasifikační metody, přičemž hlavní důraz je kladen na metody hodnocení výsledků klasifikačních úloh. Popsány jsou klasifikační tabulky pro binární i nebinární úlohy a z nich odvozené metriky, stejně jako pokročilejší míry úspěšnosti a souhlasu, například Cohenovo kappa, Matthewsův korelační koeficient nebo Brier skóre. Praktická část práce obsahuje analýzu několika datových souborů, které zahrnují jak reálná data z různých odvětví, tak uměle generované soubory pro binární klasifikaci i pro klasifikaci pro více tříd. Na každý datový soubor jsou aplikovány vybrané modely a jejich výstupy jsou vyhodnoceny pomocí představených metrik. Cílem práce je posoudit vhodnost metrik při hodnocení klasifikačních úloh v různých typech dat. V závislosti na vlastnostech dat, některé metriky mohou poskytovat odlišné nebo zavádějící informace. Analýza ukazuje, že AUC (Area Under Curve) je spolehlivou metrikou pro měření rozlišovací schopnosti modelu, zejména v binárních úlohách. Přesnost a úplnost se ukázaly jako klíčové při interpretaci výkonnosti v nerovnoměrně rozdělených třídách, kde každá z těchto metrik zachycuje jiný aspekt chyb klasifikace. Pro posouzení kvality pravděpodobnostních predikcí byly použity Brier skóre a logaritmická ztráta. V úlohách s více než dvěma třídami bylo hodnocení složitější, avšak metriky jako AUC nebo logaritmická ztráta stále poskytovaly srovnatelné výsledky. Dále byla zkoumána role Lasso regularizace, která měla pozitivní vliv na hodnoty AUC i Brier skóre, zejména u nevyvážených dat, u kterých přispěla ke zlepšení úplnosti méně zastoupených tříd. Po aplikaci Lasso byly výsledky modelů stabilnější a méně náchylné k přeučení, což vedlo k lepší generalizaci na nevyv</subfield>
  </datafield>
  <datafield tag="520" ind1="8" ind2=" ">
   <subfield code="a">U logistické regrese a lineární diskriminační analýzy se po aplikaci Lasso zlepšila schopnost modelu rozlišovat mezi třídami, zatímco klasifikační stromy vykázaly pokles výkonu, protože redukce dimenzionality odstranila některé důležité proměnné. Hlavním přínosem práce je systematické porovnání evaluačních ukazatelů a jejich interpretací, které může sloužit jako návod pro volbu vhodné metriky pro konkrétní klasifikační úlohy.</subfield>
  </datafield>
  <datafield tag="538" ind1=" " ind2=" ">
   <subfield code="a">Způsob přístupu: Internet</subfield>
  </datafield>
  <datafield tag="653" ind1="0" ind2=" ">
   <subfield code="a">statistika [obor dipl. práce]</subfield>
  </datafield>
  <datafield tag="655" ind1=" " ind2="7">
   <subfield code="a">diplomové práce</subfield>
   <subfield code="7">fd132022</subfield>
   <subfield code="2">czenas</subfield>
  </datafield>
  <datafield tag="655" ind1=" " ind2="9">
   <subfield code="a">master's theses</subfield>
   <subfield code="2">eczenas</subfield>
  </datafield>
  <datafield tag="690" ind1=" " ind2=" ">
   <subfield code="a">Klasifikační úlohy</subfield>
  </datafield>
  <datafield tag="690" ind1=" " ind2=" ">
   <subfield code="a">klasifikační tabulka</subfield>
  </datafield>
  <datafield tag="690" ind1=" " ind2=" ">
   <subfield code="a">binární klasifikace</subfield>
  </datafield>
  <datafield tag="690" ind1=" " ind2=" ">
   <subfield code="a">klasifikace pro více tříd</subfield>
  </datafield>
  <datafield tag="690" ind1=" " ind2=" ">
   <subfield code="a">míry úspěšnosti a souhlasu</subfield>
  </datafield>
  <datafield tag="700" ind1="1" ind2=" ">
   <subfield code="a">Řezanková, Hana,</subfield>
   <subfield code="d">1956-</subfield>
   <subfield code="7">ola2004231522</subfield>
   <subfield code="4">ths</subfield>
  </datafield>
  <datafield tag="700" ind1="1" ind2=" ">
   <subfield code="a">Šulc, Zdeněk</subfield>
   <subfield code="7">vse20191023055</subfield>
   <subfield code="4">opn</subfield>
  </datafield>
  <datafield tag="710" ind1="2" ind2=" ">
   <subfield code="a">Vysoká škola ekonomická v Praze.</subfield>
   <subfield code="b">Fakulta informatiky a statistiky</subfield>
   <subfield code="7">kn20010709399</subfield>
   <subfield code="4">dgg</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2="0">
   <subfield code="u">https://insis.vse.cz/zp/85753/podrobnosti</subfield>
   <subfield code="y">VŠKP v InSIS</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2="0">
   <subfield code="u">https://insis.vse.cz/zp/85753</subfield>
   <subfield code="y">Hlavní práce</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2="0">
   <subfield code="u">https://insis.vse.cz/zp/85753/posudek/vedouci</subfield>
   <subfield code="y">Hodnocení vedoucího</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2="0">
   <subfield code="u">https://insis.vse.cz/zp/85753/posudek/oponent/85722</subfield>
   <subfield code="y">Oponentura</subfield>
  </datafield>
  <datafield tag="856" ind1="4" ind2="0">
   <subfield code="u">https://insis.vse.cz/zp/85753/priloha/31038</subfield>
   <subfield code="y">Přiloha k práci</subfield>
  </datafield>
  <datafield tag="999" ind1="4" ind2="0">
   <subfield code="u">https://insis.vse.cz/zp/85753/podrobnosti</subfield>
   <subfield code="y">dc:identifier</subfield>
  </datafield>
  <datafield tag="993" ind1=" " ind2=" ">
   <subfield code="x">NEPOSILAT</subfield>
   <subfield code="y">VSKP</subfield>
  </datafield>
  <datafield tag="999" ind1="4" ind2="9">
   <subfield code="a">vse85753</subfield>
   <subfield code="b">250605</subfield>
  </datafield>
  <datafield tag="999" ind1="4" ind2="5">
   <subfield code="x">85753</subfield>
  </datafield>
 </record>
</collection>
