Klasifikavimo algoritmas

Šiam straipsniui ar jo daliai trūksta išnašų į patikimus šaltinius.
Jūs galite padėti Vikipedijai pridėdami tinkamas išnašas su šaltiniais.

Klasifikavimo (arba mašininio mokymosi) algoritmas – algoritmas, automatiškai suskirstantis pradinę objektų aibę į dvi ar daugiau grupių, kuomet atrankos kriterijai nėra trivialūs.

Klasifikuodamas algoritmas remiasi galimomis nustatyti objektų savybėmis (angl. attributes). Kiekviena savybė turi vardą ir tipą. Savybės gali būti tolydžios (pvz., ilgis) arba diskrečios (pvz., metai). Diskrečios savybės gali būti rūšiuojamos (pvz., sėklų skaičius ankštyje) arba neturinčios akivaizdžios rūšiavimo sekos (pvz., žmogaus profesija).

Klasifikavimo algoritmui pateikiamas savybių sąrašas, jau (paprastai žmogaus) suklasifikuota „apmokymo aibe“ (angl. training set) bei vienas ar keli objektai, kurių grupė iš anksto nežinoma ir ją reikia nustatyti šiuo algoritmu. Algoritmo kokybė tikrinama jo darbe nenaudojama žinomai suklasifikuota tikrinimo aibe (angl. testing set).

Klasifikavimo algoritmai plačiai naudojami bioinformatikoje (baltymų ir DNR sekoms klasifikuoti), elektroninio pašto sistemose (žinutėms rūšiuoti ir šlamštui filtruoti) ir kitose srityse. Paprastai iš anksto neaišku, kuris iš daugybės žinomų algoritmų geriausiai dirbs konkrečiu atveju, todėl jie bandomi naudojant kurią nors klasifikavimo algoritmų biblioteką.

Nuorodos[redaguoti | redaguoti vikitekstą]