Klasifikavimo algoritmai

Straipsnis iš Vikipedijos, laisvosios enciklopedijos.
Peršokti į: navigaciją, paiešką
 NoFonti.svg  Šiam straipsniui ar jo daliai trūksta šaltinių ar nuorodų į juos.
Jūs galite padėti Vikipedijai įrašydami tinkamas išnašas ar nuorodas į šaltinius.

Klasifikavimo (arba mašininio mokymosi) algoritmai – algoritmai, automatiškai suskirstantys pradinę objektų aibę į dvi ar daugiau grupių, kuomet atrankos kriterijai nėra trivialūs.

Klasifikuodamas algoritmas remiasi galimomis nustatyti objektų savybėmis (angl. attributes). Kiekviena savybė turi vardą ir tipą. Savybės gali būti tolydžios (pvz., ilgis) arba diskrečios (pvz., metai). Diskrečios savybės gali būti rūšiuojamos (pvz., sėklų skaičius ankštyje) arba neturinčios akivaizdžios rūšiavimo sekos (pvz., žmogaus profesija).

Klasifikavimo algoritmui pateikiamas savybių sąrašas, jau (paprastai žmogaus) suklasifikuota „apmokymo aibe“ (angl. training set) bei vienas ar keli objektai, kurių grupė iš anksto nežinoma ir ją reikia nustatyti šiuo algoritmu. Algoritmo kokybė tikrinama jo darbe nenaudojama žinomai suklasifikuota tikrinimo aibe (angl. testing set).

Klasifikavimo algoritmai plačiai naudojami bioinformatikoje (baltymų ir DNR sekoms klasifikuoti), elektroninio pašto sistemose (žinutėms rūšiuoti ir šlamštui filtruoti) ir kitose srityse. Paprastai iš anksto neaišku, kuris iš daugybės žinomų algoritmų geriausiai dirbs konkrečiu atveju, todėl jie bandomi naudojant kurią nors klasifikavimo algoritmų biblioteką.

Nuorodos[taisyti | redaguoti kodą]