Аlgoritam upoređivanja Unicode-a

Algoritam upoređivanja Unicode-a (engl. Unicode collation algorithm, UCA) algoritam je opisan u njegovom tehničkom izveštaju br. 10 koji definiše prilagodljive metode za poređenje dve niske. Ta poređenja se potom mogu koristiti za sređivanje ili sortiranje teksta u bilo kom pisanom sistemu ili jeziku predstavljenom u Unicode-u.

Tehnički izveštaj Unicode-a br. 10 precizira Podrazumevanu tabelu elemenata upoređivanja Unicode-a (engl. Default Unicode Collation Element Table, DUCET). Ova datoteka podataka određue podrazumevani redosled svrstavanja. DUCET je prilagodiv različitim jezicima. Mnoga takva prilagođavanja mogu se naći u Zajedničkom lokalnom skladištu podataka (engl. Common Locale Data Repository, CLDR).

Važna implementacija otvorenog koda UCA uključena je u Međunarodne komponente Unicode-a (engl. International Components for Unicode, ICU). ICU podrazumeva i upoređivanje i sređivanje iz CLDR je uključeno u ICU. U Lokalnom istražicaču ICU-a (engl. ICU Locale Explorer) mogu se videti dejstva sređivanja i veliki broj posebnih jezičkih upoređivanja.

Spoljašnje veze

uredi