Rikiavimo algoritmų sudėtingumas

Šį straipsnį yra pasiūlyta sujungti su „Rikiavimo algoritmas“.
Dėl kokių priežasčių palikta ši žymė, galite sužinoti diskusijų puslapyje.

Dažnai greitam darbui su duomenimis būtina duomenis surikiuoti, bet esant dideliems duomenų kiekiams labai svarbu ir paties rikiavimo algoritmo sudėtingumas – atlikimo greičio priklausomybė nuo duomenų kiekio.

Duomenų rikiavimo uždavinys apibrėžiamas taip:

Turint N elementų seką (a₁, a₂, …, a_N), reikia išdėstyti šiuos elementus taip, kad gautume naują N elementų seką (a₁', a₂', …, a_N'), tenkinančią salygą a_i <= a_j, kai i<j.

Problematika[redaguoti | redaguoti vikitekstą]

Algoritmų analizėje duomenų rikiavimo problema laikoma pačia svarbiausia, nes tai viena dažniausiai pasitaikančių operacijų programavime. Efektyvus rikiavimo algoritmo pasirinkimas gali turėti netgi lemiamą įtaką programos vykdymo spartai didėjant duomenų kiekiui.

Paprasčiausių rikiavimo algoritmų (išrinkimo rikiavimo algoritmas, įterpimo rikiavimo algoritmas, burbulo metodas) sudėtingumas yra kvadratinis (žymima O(N²). Dažnai greičiausiu laikomo greitojo rikiavimo (quicksort) algoritmo sudėtingumas daugeliu atveju yra O(N log N), tačiau rikiuojant beveik surikiuotus duomenis, šio algoritmo sudėtingumas siekia O(N²).

Algoritmo sudėtingumas svarbus tik esant dideliam duomenų kiekiui. Palyginimui pateikiama lentelė kaip skiriasi procesoriaus operacijų skaičius didėjant duomenų kiekiui, naudojant du skirtingus algoritmus – pirmasis naudoja 5 N² operacijų, o antrasis – 20 N log N.

Duomenų elementų skaičius	Santykinis laikas burbulo algoritmu	Santykinis laikas quicksort algoritmu
10	500	200
100	50 000	4 000
1000	5 000 000	60 000
10000	500 000 000	800 000

Jei duomenų kiekis nedidelis, mums dažniausiai visiškai nesvarbu, kiek mikrosekundžių bus vykdomas rikiavimas, tačiau esant didesniems duomenų kiekiams šis skirtumas yra milžiniškas. Kita vertus, esant labai mažiems duomenų kiekiams efektyvesnis bus burbuliuko metodas. Taip pat algoritmų sudėtingumas priklauso nuo duomenų savybių. Pavyzdžiui, burbuliuko metodas bus daug greitesnis, jei bus bandoma rikiuoti surikiuotus duomenis – tada jo sudėtingumas yra O(n).

Dažniausiai matuojamas algoritmų sudėtingumas vidutiniu atveju, dažnai blogiausiu atveju ir tik kartais – geriausiu. Tas pats algoritmas, būdamas labai greitas geriausiu atveju, gali būti labai blogas vidutiniu ar blogiausiu atveju.

Pagrindiniai algoritmų kursuose pateikiami rikiavimo algoritmai ir jų sudėtingumas (vertinant palyginimo operacijų atžvilgiu):

Algoritmų sudėtingumų lentelė[redaguoti | redaguoti vikitekstą]

Algoritmas	Blogiausias	Vidutinis	Geriausias	Pastabos
Skaitmeninis radixsort	O(2d N)	O(2d N)	O(2d N)	Tik skaitmeninėms teigiamoms duomenų reikšmėms, kur d yra skaitmenų sk. Reikalauja papildomos atminties
Greitojo rikiavimo (quicksort)	O(N²)	O(N log N)	O(N log N)	Beveik nenaudoja papildomos atminties
Kombinuotas	O(N log N)	O(N (log N)²)
Krūvos (heapsort)	O(N log N)	O(N log N)	O (N log N)
Šelo (Shell sort)	O(N²)	O(N^1,2)	O(N)
Sąlajos (mergesort)	O(N log N)	O(N log N)	O(N log N)	Stabilus, naudoja papildomą atmintį. Tinka kai nevisus duomenis iškarto galime nuskaityti į operatyvią atmintį
Burbulo (bubble)	O(N²)	O(N²)	O(N)
Įterpimo (insertion)	O(N²)	O (N²)	O(N)
Išrinkimo (selection)	O(N²)	O(N²)	O(N²)

Lygiagretieji algoritmai[redaguoti | redaguoti vikitekstą]

Naudojant daugiaprocesorinį kompiuterį ar paskirstytą kompiuterių tinklą galima pasiekti ir dar geresnių rezultatų. Geriausiu atveju pasiekiamas sudėtingumas O((log N)²).