Kod jezika

симбол да опише језик

Kôd jezika je kod koji dodeljuje slova i/ili brojeve kao identifikatore ili klasifikatore za jezike. Ovi kodovi mogu da budu korišćeni za organizaciju bibliotekarskih kolekcija ili prezentacija podataka, da se izaberu tačne lokalizacije i prevodi u procesiranju, i kao skraćenice za dužu formu imena jezika.

Problemi u klasifikaciji uredi

Šeme koda jezika pokušavaju da se klasifikuju unutar kompleksnog sveta ljudskih jezika, dijalekata i varijanti. Većina šema pravi neke kompromise između opštosti i bivanja doboljno potpunim da podrže specifične dijalekte.

Na primer, većina ljudi u Južnoj i Centralnoj Americi govore španski. Španski govorni jezik u Meksiku je nešto drugačiji od španskog govornog jezika Perua. Različite regije Meksika će imati nešto drugačije dijalekte i akcente španskog jezika. Šema koda jezika će probati da grupiše sve to kao „španski” za biranje FIKSMEEEEEElejaoutFIKSMEEEEE tastature, većinu kao „španski” za opštu upotrebu, ili će izdvojiti svaki dijalekt da dozvoli idiome specifične za respektivnu regiju.

Uobičajene šeme uredi

Neke uobičajene šeme sadrže:

Šeme Napomene Primeri
Kodovi za Engleski Kodovi za Španski
Glottolog kodovi Napravljen za manjinske jezike kao naučna alternativa industrijskom ISO 639‑3 standardu.

Namerno izbegava sličnosti sa skraćenicama.

  • stan1293 – Standardni engleski
  • macr1271 – Makro-engleski (Moderni engleski)
  • midd1317 – Srednji engleski
  • merc1242 – Mersijski (Srednje - moderan engleski)
  • olde1238 – Stari engleski
  • angl1265 – Angliski (Staro - moderan engleski, uklj. Škote)
  • stan1288 – Standardni španski
  • olds1249 – Stari španski
  • cast1243 – Kastilijanski (Staro - moderan španski)
IETF language tag Najbolja praksa IETF-a, trenutno specifikovana RFC 5646 i RFC 4647, za oznake jezika lako parsirane računarom. Sistem označavanja je proširiv na region, dijalekt i privatne zamisli.
  • en – Engleski, kao najkraći ISO 639 kod.
  • en-US – Engleski korišćen u Sjedinjenim Američkim Državama (US je ISO 3166‑1 državni kod za SAD)

(source: IETF memo[1])

  • es – Španski, kao najkraći ISO 639 kod.
  • es-419 – Španski prikladan za Latinsku Ameriku i Karipski region, koristeći UN M.49 regionski kod
ISO 639 Originalni ISO standard od 1967 do 2002. Sada prevaziđen, zamenjen je sa ISO 639‑1, ISO 639‑2 i ISO 639‑3. Ponekad korišćen kao skraćenica za uniju svih 639 standardnih kodova.
  • eng – three-letter code
  • enm – Middle English, c. 1100–1500
  • ang – Old English, c. 450–1100
  • cpe – other English-based creoles and pidgins
  • EN – English or American two-letter capital code

(source: Library of Congress[2])

  • esl – three-letter code
  • spa – alternative three-letter code
  • ES – Spanish two-letter capital code
ISO 639‑1 Two-letter code system made official in 2002, containing 136 codes. Many systems use two-letter ISO 639‑1 codes supplemented by three-letter ISO 639‑2 codes when no two-letter code is applicable.
  • en

(from List of ISO 639‑1 codes)

  • es – Spanish
ISO 639‑2 Three-letter system of 464 codes.
  • eng – three-letter code
  • enm – Middle English, c. 1100–1500
  • ang – Old English, c. 450–1100
  • cpe – other English-based creoles and pidgins

(from List of ISO 639‑2 codes)

  • spa – Spanish
ISO 639‑3 An extension of ISO 639‑2 to cover all known, living or dead, spoken or written languages in 7,589 entries.
  • eng – three-letter code
  • enm – Middle English, c. 1100–1500
  • aig – Antigua and Barbuda Creole English
  • ang – Old English, c. 450–1100
  • svc – Vincentian Creole English
  • others

(from List of ISO 639‑3 codes)

  • spa – Spanish
  • spq – Spanish, Loreto-Ucayali
  • ssp – Spanish sign language
  • others
LS‑2010 Two-digit + one to six letter Linguasphere code system published in 2000, updated 2010, containing over 32,000 codes.

(within hierarchy of Linguasphere-2010 codes, as follows:)

  • 5= Indo-European phylosector
  • 52= Germanic phylozone
  • 52-A Germanic set
  • 52-AB English + Anglo-Creole chain
  • 52-ABA English
    net
  • 52-ABA-c
    Global English
    outer unit
    52-ABA-ca to
    52-ABA-cwe
    (186 varieties)

compare: 52-ABA-a Scots + Northumbrian
outer unit &
52-ABA-b "Anglo-English" outer unit
(= South Great Britain traditional varieties + Old Anglo-Irish)

(within hierarchy of Linguasphere-2010 codes, as follows:)

  • 5= Indo-European phylosector
  • 51= Romanic phylozone
  • 51-A Romance set
  • 51-AA Romance chain
  • 51-AAA West Romance net
  • 51-AAA-b Español/Castellano
    outer unit
    51-AAA-ba to
    51-AAA-bkk
    (58 varieties)

compare: 51-AAA-a Português + Galego outer unit &
51-AAA-c Astur + Leonés outer unit, etc.

SIL codes (10th–14th editions) Codes created for use in the Ethnologue, a publication of SIL International that lists language statistics. The publication now uses ISO 639‑3 codes. ENG SPN
Verbix Language Codes Constructed codes starting with old SIL codes and adding more information.[3]    

Reference uredi