Bit (računarstvo)

Bit (engl. bit) je najmanja jedinica informacije u računarstvu. Jedan bit predstavlja količinu informacije potrebnu za razlikovanje dva međusobna isključiva stanja, često predstavljana kao jedan (1) i nula (0), da/ne, tačno/netačno, ima/nema napona, itd. Bit se takođe koristi kao ime cifre u binarnom brojnom sistemu (sistem sa osnovom 2). Sama reč je prvi put upotrebljena 1948. godine u radu Kloda Šenona i nastala je sklapanjem početka engleske reči „binarna” i kraja reči „cifra” ili „jedinica” na engleskom jeziku (binary digit ili binary unit). On je rekao da reč potiče od Džona Takija.

Bit je najosnovnija jedinica informacija u računarstvu i digitalnim komunikacijama.[1] Ime je kontrakcija binarne cifre (engl. binary digit).[2] Bit predstavlja logičko stanje sa jednom od dve moguće vrednosti. Ove vrednosti se najčešće predstavljaju kao 1” ili „0, ali se obično koriste i druge reprezentacije kao što su tačno/netačno, da/ne, +/ ili uključeno/isključeno.

Korespondencija između ovih vrednosti i fizičkih stanja osnovnog skladišta ili uređaja je stvar konvencije, a različite dodele se mogu koristiti čak i unutar istog uređaja ili programa. Može se fizički implementirati sa uređajem sa dva stanja.

Simbol za binarnu cifru je ili 'bit' po preporuci standarda IEC 80000-13:2008 ili malo slovo 'b', kao što preporučuje standard IEEE 1541-2002.

Neprekidna grupa binarnih cifara se obično naziva niz bitova, vektor bita ili jednodimenzionalni (ili višedimenzionalni) niz bitova. Grupa od osam binarnih cifara se zove jedan bajt, ali istorijski veličina bajta nije striktno definisana. Često se pola, pune, dvostruke i četvorostruke reči sastoje više bajtova što su mala stepeni dvojke.

U teoriji informacija, jedan bit je informaciona entropija binarne slučajne promenljive koja je 0 ili 1 sa jednakom verovatnoćom,[3] ili informacija koja se dobija kada vrednost takve promenljive postane poznata.[4][5] Kao jedinica informacija, bit je poznat i kao šenon,[6] nazvan po Klodu E. Šenonu.

Istorija uredi

Kodiranje podataka diskretnim bitovima korišćeno je u bušenim karticama koje su izmislili Basil Bošon i Žan-Baptist Falkon (1732), koje je razvio Žozef Mari Žakard (1804), a kasnije su to usvojili Semjon Korsakov, Čarls Babidž, Herman Holerit i rani proizvođači računara poput IBM-a. Varijanta te ideje bila je perforirana papirna traka. U svim tim sistemima, medijum (kartica ili traka) je konceptualno nosio niz pozicija rupa; svaka pozicija može biti ili probijena ili ne, noseći tako jedan bit informacije. Kodiranje teksta po bitovima je takođe korišćeno u Morzeovom kodu (1844) i ranim digitalnim komunikacionim mašinama kao što su teletipovi i tikerne mašine (1870).

Ralf Hartli je predložio upotrebu logaritamske mere informacija 1928. godine.[7] Klod E. Šenon je prvi put upotrebio reč „bit“ u svom seminalnom radu iz 1948. „Matematička teorija komunikacije“.[8][9][10] On je njegovo poreklo pripisao Džonu V. Tukiju, koji je 9. januara 1947. napisao memorandum Bel Labsa u kome je „binarnu informaciju cifru“ kontrahovao na jednostavno „bit“.[8] Vanevar Buš je 1936. godine pisao o „bitovima informacija“ koji su mogli da se čuvaju na bušenim karticama koje su se koristile u mehaničkim računarima tog vremena.[11] Prvi programabilni računar, koji je napravio Konrad Zus, koristio je binarnu notaciju za brojeve.[12]

Jedinica i simbol uredi

Bit nije definisan u Međunarodnom sistemu jedinica (SI). Međutim, Međunarodna elektrotehnička komisija izdala je standard IEC 60027, koji precizira da simbol za binarnu cifru treba da bude 'bit', i to treba da se koristi u svim višekratnicima, kao što je 'kbit', za kilobit.[13] Međutim, malo slovo 'b' se takođe široko koristi i preporučeno od strane IEEE 1541 standarda (2002). Nasuprot tome, veliko slovo 'B' je standardni i uobičajeni simbol za bajt.

Umnošci bita uredi

Umnošci bita
Odomaćena upotreba i
(ređe binarno značenje)
Standard za binarne
prefikse po IEC 60027-2
Naziv Oznaka Količina Naziv Oznaka Količina
kilobit kb 103 (210) kibibit Kibit 210
megabit Mb 106 (220) mebibit Mibit 220
gigabit Gb 109 (230) gibibit Gibit 230
terabit Tb 1012 (240) tebibit Tibit 240
petabit Pb 1015 (250) pebibit Pibit 250
eksabit Eb 1018 (260) eksbibit Eibit 260
zetabit Zb 1021 (270) zebibit Zibit 270
jotabit Yb 1024 (280) jobibit Yibit 280
Vidi još: bajt, nibl, neodređenost umnožaka

Više bitova se može izraziti i predstaviti na nekoliko načina. Za praktičnost predstavljanja grupa bitova koji se često ponavljaju u informacionoj tehnologiji, tradicionalno se koristi nekoliko jedinica informacija. Najčešća je jedinica bajt, koji je skovao Verner Bakholc u junu 1956. godine. Ona je istorijski korišteno za predstavljanje grupe bitova koji se koriste za kodiranje jednog karaktera teksta (dok nije preuzeto UTF-8 višebajtno kodiranje) u računaru[14][15][16][17][18] i iz tog razloga je korišćen kao osnovni adresabilni element u mnogim računarskim arhitekturama. Trend u dizajnu hardvera konvergirao je na najčešću implementaciju korišćenja osam bitova po bajtu, kao što se danas široko koristi. Međutim, zbog dvosmislenosti oslanjanja na osnovni hardverski dizajn, oktet jedinica je definisan da eksplicitno označava sekvencu od osam bitova.

Grupisanje bitova uredi

Radi praktičnosti baratanja i korišćenja informacija, bitovi se grupišu u fizičke i logičke skupove. Najčešće su to:

  • Nibl – grupa od 4 bita, fizički skup bitova ali ne i adresibilni.
  • Bajt – najmanja adresabilna grupa bitova. U početku je broj bio vrlo promenljiv a kasnije je skoro potpuno standardizovan na 8.
  • Oktet je grupa od 8 bitova i, za razliku od Francuske, često se koristi reč bajt umesto oktet jer se podrazumeva da je to isto.
  • Reč je veća grupa bitova, obično 2 bajta, ali nije standardizovana (postoje arhitekture sa rečima od 4, 8 ili više bajtova). Reč je najčešća adresibilna memorijska jedinica za podatke i za program. Po dužini reči se razlikuju računarske arhitekture, pa se govori o šesnaestobitnoj, trideset dvobitnoj ili šezdeset četvorobitnoj arhitekturi.
  • Prefiksi SI sistema (k-kilo, M-mega, G-giga, itd) su u početku korišćeni da označavaju slične ali ne iste umnoške. Tako je kilobit bio 210=1.024 bita, megabit 1.024 kilobita, itd. jer dekadna vrednost 1.000 nije prilagođena binarnom brojnom sistemu računara a 1.024 je približna vrednost. Kasnije je, međutim došlo do zabune i standardizovanja novih prefiksa (kibi-, mebi-, itd) – pogledajte tabelu.

Brzina prenosa uredi

Prilikom prenosa digitalnog signala kroz neki medijum kao jedinica mere se koristi broj bita u sekundi tj. b/s. Obično su brzine veće pa se koriste veće jedinice kao kb/s, Mb/s itd.

Reference uredi

  1. ^ Information in small bits Arhivirano na sajtu Wayback Machine (21. oktobar 2021) Information in Small Bits is a book produced as part of a non-profit outreach project of the IEEE Information Theory Society. The book introduces Claude Shannon and basic concepts of Information Theory to children 8 and older using relatable cartoon stories and problem-solving activities.
  2. ^ Mackenzie, Charles E. (1980). Coded Character Sets, History and Development. The Systems Programming Series (1 izd.). Addison-Wesley Publishing Company, Inc. str. x. ISBN 978-0-201-14460-4. LCCN 77-90165. Arhivirano iz originala 2016-11-18. g. Pristupljeno 2016-05-22.  [1]
  3. ^ Anderson, John B.; Johnnesson, Rolf (2006), Understanding Information Transmission 
  4. ^ Haykin, Simon (2006), Digital Communications 
  5. ^ IEEE Std 260.1-2004
  6. ^ „Units: B”. Arhivirano iz originala 2016-05-04. g. 
  7. ^ Abramson, Norman (1963). Information theory and coding. McGraw-Hill. 
  8. ^ a b Shannon, Claude Elwood (jul 1948). „A Mathematical Theory of Communication” (PDF). Bell System Technical Journal. 27 (3): 379—423. doi:10.1002/j.1538-7305.1948.tb01338.x. hdl:11858/00-001M-0000-002C-4314-2 . Arhivirano iz originala (PDF) 1998-07-15. g. „The choice of a logarithmic base corresponds to the choice of a unit for measuring information. If the base 2 is used the resulting units may be called binary digits, or more briefly bits, a word suggested by J. W. Tukey. 
  9. ^ Shannon, Claude Elwood (oktobar 1948). „A Mathematical Theory of Communication”. Bell System Technical Journal. 27 (4): 623—666. doi:10.1002/j.1538-7305.1948.tb00917.x. hdl:11858/00-001M-0000-002C-4314-2 . 
  10. ^ Shannon, Claude Elwood; Weaver, Warren (1949). A Mathematical Theory of Communication (PDF). University of Illinois Press. ISBN 0-252-72548-4. Arhivirano iz originala (PDF) 1998-07-15. g. 
  11. ^ Bush, Vannevar (1936). „Instrumental analysis”. Bulletin of the American Mathematical Society. 42 (10): 649—669. doi:10.1090/S0002-9904-1936-06390-1 . Arhivirano iz originala 2014-10-06. g. 
  12. ^ "The World's Technological Capacity to Store, Communicate, and Compute Information" Arhivirano 2013-07-27 na sajtu Wayback Machine, especially Supporting online material Arhivirano 2011-05-31 na sajtu Wayback Machine, Martin Hilbert and Priscila López (2011), Science, 332(6025), 60-65; free access to the article through here: martinhilbert.net/WorldInfoCapacity.html
  13. ^ National Institute of Standards and Technology (2008), Guide for the Use of the International System of Units. Online version. Arhivirano 3 jun 2016 na sajtu Wayback Machine
  14. ^ Bemer, Robert William (2000-08-08). „Why is a byte 8 bits? Or is it?”. Computer History Vignettes. Arhivirano iz originala 2017-04-03. g. Pristupljeno 2017-04-03. „[…] With IBM's STRETCH computer as background, handling 64-character words divisible into groups of 8 (I designed the character set for it, under the guidance of Dr. Werner Buchholz, the man who DID coin the term "byte" for an 8-bit grouping). […] The IBM 360 used 8-bit characters, although not ASCII directly. Thus Buchholz's "byte" caught on everywhere. I myself did not like the name for many reasons. […] 
  15. ^ Buchholz, Werner (1956-06-11). „7. The Shift Matrix” (PDF). The Link System. IBM. str. 5—6. Stretch Memo No. 39G. Arhivirano (PDF) iz originala 2017-04-04. g. Pristupljeno 2016-04-04. „[…] Most important, from the point of view of editing, will be the ability to handle any characters or digits, from 1 to 6 bits long […] the Shift Matrix to be used to convert a 60-bit word, coming from Memory in parallel, into characters, or "bytes" as we have called them, to be sent to the Adder serially. The 60 bits are dumped into magnetic cores on six different levels. Thus, if a 1 comes out of position 9, it appears in all six cores underneath. […] The Adder may accept all or only some of the bits. […] Assume that it is desired to operate on 4 bit decimal digits, starting at the right. The 0-diagonal is pulsed first, sending out the six bits 0 to 5, of which the Adder accepts only the first four (0-3). Bits 4 and 5 are ignored. Next, the 4 diagonal is pulsed. This sends out bits 4 to 9, of which the last two are again ignored, and so on. […] It is just as easy to use all six bits in alphanumeric work, or to handle bytes of only one bit for logical analysis, or to offset the bytes by any number of bits. […] 
  16. ^ Buchholz, Werner (februar 1977). „The Word "Byte" Comes of Age...”. Byte Magazine. 2 (2): 144. „[…] The first reference found in the files was contained in an internal memo written in June 1956 during the early days of developing Stretch. A byte was described as consisting of any number of parallel bits from one to six. Thus a byte was assumed to have a length appropriate for the occasion. Its first use was in the context of the input-output equipment of the 1950s, which handled six bits at a time. The possibility of going to 8 bit bytes was considered in August 1956 and incorporated in the design of Stretch shortly thereafter. The first published reference to the term occurred in 1959 in a paper "Processing Data in Bits and Pieces" by G A Blaauw, F P Brooks Jr and W Buchholz in the IRE Transactions on Electronic Computers, June 1959, page 121. The notions of that paper were elaborated in Chapter 4 of Planning a Computer System (Project Stretch), edited by W Buchholz, McGraw-Hill Book Company (1962). The rationale for coining the term was explained there on page 40 as follows:
    Byte
    denotes a group of bits used to encode a character, or the number of bits transmitted in parallel to and from input-output units. A term other than character is used here because a given character may be represented in different applications by more than one code, and different codes may use different numbers of bits (ie, different byte sizes). In input-output transmission the grouping of bits may be completely arbitrary and have no relation to actual characters. (The term is coined from bite, but respelled to avoid accidental mutation to bit.)
    System/360 took over many of the Stretch concepts, including the basic byte and word sizes, which are powers of 2. For economy, however, the byte size was fixed at the 8 bit maximum, and addressing at the bit level was replaced by byte addressing. […]
     
  17. ^ Blaauw, Gerrit Anne; Brooks, Jr., Frederick Phillips; Buchholz, Werner (1962), „Chapter 4: Natural Data Units” (PDF), Ur.: Buchholz, Werner, Planning a Computer System – Project Stretch, McGraw-Hill Book Company, Inc. / The Maple Press Company, York, PA., str. 39—40, LCCN 61-10466, Arhivirano iz originala (PDF) 2017-04-03. g., Pristupljeno 2017-04-03 
  18. ^ Bemer, Robert William (1959). „A proposal for a generalized card code of 256 characters”. Communications of the ACM. 2 (9): 19—23. S2CID 36115735. doi:10.1145/368424.368435. 

Spoljašnje veze uredi

  • Bit Calculator – a tool providing conversions between bit, byte, kilobit, kilobyte, megabit, megabyte, gigabit, gigabyte
  • BitXByteConverter – a tool for computing file sizes, storage capacity, and digital information in various units