UTF-8 — разлика између измена

Садржај обрисан Садржај додат
м Измена назива шаблона
Ред 4:
 
== Развој електронског записа текста ==
Први рачунари су били прављени претежно за енглеско говорно подручје и имали су подршку само за енглески алфабет, за бројеве, заграде и још по неки контролни карактер, што је чинило укупно 128 могућих слова (у 7 бита). То је био тзв. ''-{ASCII}-'' или ''-{US-ASCII}-'' стандард.
 
Касније1968. године је скуп карактера проширен на 256 (8 бита), а „горњих“ 128 карактера је било коришћено за додатне карактере. Из неке навике је и овај проширени ''-{ASCII}-'' називан ''-{ASCII}-'', тако да ту често долази до забуне. Да би постојала подршка за више језика, смишљане су тзв. кодне стране (''-{Code Page}-'') које дефинишу понашање тог додатног скупа слова. Основна кодна страна на персоналним рачунарима (''-{PC437}-'') у том горњем сету карактера дефинише разне графичке карактере за цртање текстуалних прозора и слично. Касније је развијено још пуно кодних страна које подржавају одређене језике. Тако постоје ''-{Latin1}-'' (''-{ISO-8859-1}-'') за латинична писма Западне Европе (Француска, Немачка, Шпанија, ...), ''-{Latin2}-'' (''-{ISO-8859-2}-'') и ''-{Windows-1250}-'' за латинична писма Источне Европе (нашасрпска латиница и сл.), ''-{ISO-8859-5}-'', ''-{KOI8-R}-'' и ''-{Windows-1251}-'' за ћирилицу.., итд. Основни проблем са кодним странама је то што се међусобно искључују, тј. цео документ мора да буде написан истим писмом. То углавном није проблем реализовати, али ако би било потребно помешати два писма, као на пример у неком туристичком водичу где заједно постоји и текст на српском, на енглеском и на француском, наилази се на проблем. Због тога се дошло до идеје да се направи јединствени запис за све језике - Јуникод (''-{Unicode}-'') (''-{united}-'' - уједињен, заједнички; ''-{code}-'' - код, запис).
 
== Преглед постојећих верзија Unicode-а ==
Преузето из „https://sr.wikipedia.org/wiki/UTF-8