UTF-8 — разлика између измена

Садржај обрисан Садржај додат
Поништена измена 8327967 корисника 178.222.185.40 (разговор)
→‎Преглед постојећих верзија Unicode-а: убачен линк унутар документа
Ред 13:
Сада се јавља проблем алокације простора за Unicode поруку на медијуму који се користи. Ако је реч о неком документу на диску, он ће да заузима дупло више простора него конвенционалан документ јер ће се сваки карактер записивати са два бајта уместо само са једним. Ако је реч о преносу података преко рачунарске мреже, биће потребно пренети дупло више података, па ће самим тим и пренос да траје дупло више (односно да кошта дупло више). Поставља се питање да ли је то сувише велика цена за универзално писмо и да ли постоји неки начин да се тај проблем превазиђе и избегне. Као решење увек стоји могућност да се записује неком одговарајућом кодном страницом и троши бајт по карактеру, ако није неопходно коришћење више писама у истом документу (што се ретко дешава). Друго решење је коришћење тзв. трансформационих шеме за погоднији запис и пренос података коришћењем Unicode-а.
 
Прво је развијена Unicode трансформациона шема са основном јединицом од 8 бита ([[UTF]]-8). Помоћу ње се карактер записује у једном, два или три бајта, у зависности од тога о ком је карактеру реч. Ова трансформациона шема је превасходно згодна за употребу у језицима који користе латиницу. О UTF-8 ће бити више речи у поглављу ''[[UTF-8#.D0.A3.D0.BA.D1.80.D0.B0.D1.82.D0.BA.D0.BE_.D0.BE_UTF-8|Укратко о UTF-8]]''.
 
Један део [[MTA|Mail Transfer Agent]]-а, као и званични стандард за Интернет пошту (IETF: [[STD 11]], [[RFC 822]]) подржава само 7-битне маил поруке. [[MIME]] стандарди ([[RFC 2045]], [[RFC 2046]], [[RFC 2047]], [[RFC 2048]] и [[RFC 2049]]) омогућавају пренос вишебитних речи преко Интернет маил-а, користећи [[Base64]] и [[Quoted Printable]] начине кодирања, међутим, они нису прављени за пренос Unicode-а него за пренос било каквих фајлова и нису били најоптималнија решења. Због тога је касније развијена 7-битна трансформациона шема UTF-7. Ту се карактер записује у једном или у неколико бајтова, слично као и у UTF-8. Основна разлика је у томе што UTF-7 користи само Base64 карактере који без проблема могу да се преносе путем електронске поште. За такву намену се показало да је UTF-7 оптималнији запис него UTF-8 када се кодира са Base64 или са Quoted Printable алгоритмима кодирања.
Преузето из „https://sr.wikipedia.org/wiki/UTF-8