Rikiavimo algoritmų sudėtingumas

Straipsnis iš Vikipedijos, laisvosios enciklopedijos.
Peršokti į: navigacija, paiešką

Dažnai greitam darbui su duomenimis būtina duomenis surikiuoti, bet esant dideliems duomenų kiekiams labai svarbu ir paties rikiavimo algoritmo sudėtingumas – atlikimo greičio priklausomybė nuo duomenų kiekio.

Duomenų rikiavimo uždavinys apibrėžiamas taip:

Turint N elementų seką (a1, a2, …, aN), reikia išdėstyti šiuos elementus taip, kad gautume naują N elementų seką (a1', a2', …, aN'), tenkinančią salygą ai <= aj, kai i<j.

Problematika[redaguoti | redaguoti vikitekstą]

Algoritmų analizėje duomenų rikiavimo problema laikoma pačia svarbiausia, nes tai viena dažniausiai pasitaikančių operacijų programavime. Efektyvus rikiavimo algoritmo pasirinkimas gali turėti netgi lemiamą įtaką programos vykdymo spartai didėjant duomenų kiekiui.

Paprasčiausių rikiavimo algoritmų (išrinkimo rikiavimo algoritmas, įterpimo rikiavimo algoritmas, burbulo metodas) sudėtingumas yra kvadratinis (žymima O(N²). Dažnai greičiausiu laikomo greitojo rikiavimo (quicksort) algoritmo sudėtingumas daugeliu atveju yra O(N log N), tačiau rikiuojant beveik surikiuotus duomenis, šio algoritmo sudėtingumas siekia O(N²).

Algoritmo sudėtingumas svarbus tik esant dideliam duomenų kiekiui. Palyginimui pateikiama lentelė kaip skiriasi procesoriaus operacijų skaičius didėjant duomenų kiekiui, naudojant du skirtingus algoritmus – pirmasis naudoja 5 N² operacijų, o antrasis – 20 N log N.

Duomenų elementų
skaičius
Santykinis laikas
burbulo algoritmu
Santykinis laikas
quicksort algoritmu
10 500 200
100 50 000 4 000
1000 5 000 000 60 000
10000 500 000 000 800 000

Jei duomenų kiekis nedidelis, mums dažniausiai visiškai nesvarbu, kiek mikrosekundžių bus vykdomas rikiavimas, tačiau esant didesniems duomenų kiekiams šis skirtumas yra milžiniškas. Kita vertus, esant labai mažiems duomenų kiekiams efektyvesnis bus burbuliuko metodas. Taip pat algoritmų sudėtingumas priklauso nuo duomenų savybių. Pavyzdžiui, burbuliuko metodas bus daug greitesnis, jei bus bandoma rikiuoti surikiuotus duomenis – tada jo sudėtingumas yra O(n).

Dažniausiai matuojamas algoritmų sudėtingumas vidutiniu atveju, dažnai blogiausiu atveju ir tik kartais – geriausiu. Tas pats algoritmas, būdamas labai greitas geriausiu atveju, gali būti labai blogas vidutiniu ar blogiausiu atveju.

Pagrindiniai algoritmų kursuose pateikiami rikiavimo algoritmai ir jų sudėtingumas (vertinant palyginimo operacijų atžvilgiu):

Algoritmų sudėtingumų lentelė[redaguoti | redaguoti vikitekstą]

Algoritmas Blogiausias Vidutinis Geriausias Pastabos
Skaitmeninis
radixsort
O(2d N) O(2d N) O(2d N) Tik skaitmeninėms teigiamoms duomenų reikšmėms, kur d yra skaitmenų sk. Reikalauja papildomos atminties
Greitojo rikiavimo (quicksort) O(N²) O(N log N) O(N log N) Beveik nenaudoja papildomos atminties
Kombinuotas O(N log N) O(N (log N)²)
Krūvos (heapsort) O(N log N) O(N log N) O (N log N)
Šelo (Shell sort) O(N²) O(N1,2) O(N)
Sąlajos
(mergesort)
O(N log N) O(N log N) O(N log N) Stabilus, naudoja papildomą atmintį. Tinka kai nevisus duomenis iškarto galime nuskaityti į operatyvią atmintį
Burbulo (bubble) O(N²) O(N²) O(N)
Įterpimo (insertion) O(N²) O (N²) O(N)
Išrinkimo (selection) O(N²) O(N²) O(N²)

Lygiagretieji algoritmai[redaguoti | redaguoti vikitekstą]

Naudojant daugiaprocesorinį kompiuterį ar paskirstytą kompiuterių tinklą galima pasiekti ir dar geresnių rezultatų. Geriausiu atveju pasiekiamas sudėtingumas O((log N)²).