Operacije sa bitovima u programskom jeziku C
Uobičajeni logički operatori u programskom jeziku C: &&
, ||
, ^^
i !
, operišu nad celobrojnim promenljivama i uzimaju u obzir vrednosti operanada u celosti, pri čemu se vrednost 0 tumači kao "NETAČNO", a bilo koja vrednost različita od 0 (ne samo 1), tumači se kao "TAČNO" - i pri tom nije moguće pristupati pojedinačnim bitovima.
U većini uobičajenih situacija, pristup pojedinačnim bitovima nije neophodan, međutim, postoje i situacije u kojima pristup bitovima sasvim dobro dođe.
Prethodna konstatacija odnosi se pre svega na sistemsko programiranje, koje - između ostalog - podrazumeva pristup hardveru, a pristup hardveru podrazumeva pristup pojedinačnim pinovima hardverskih komponenti (uključivanje, isključivanje, ili naprosto očitavanje vrednosti pojedinačnih pinova na određenom hardverskom portu i sl) - što su operacije koje se mogu obaviti samo preko operatora koji imaju mogućnost operisanja nad pojedinačnim bitovima.
Može se takođe reći i da su operacije nad pojedinačnim bitovima veoma zanimljive same po sebi (u očima većine programera), a vredi spomenuti i to da bitovski operatori pružaju zanimljive mogućnosti i u svakodnevnom programiranju.
Pregled bitovskih operatora u C-u
U programskom jeziku C, pristup pojedinačnim bitovima pri obavljanju logičkih operacija, postiže se upotrebom specijalizovanih operatora:
&
- bitovska konjunkcija (bitovsko I)|
- bitovska disjunkcija (bitovsko ILI)^
- bitovska ekskluzivna disjunkcija (bitovski XOR)~
- invertovanje bitova (bitovsko NE)<<
- pomeranje bitova ulevo>>
- pomeranje bitova udesno
Međutim, potrebno je odmah naglasiti da navedeni bitovski operatori nisu u stanju da obave operaciju na samo jednom paru bitova u dve celobrojne promenljive (bar ne direktno), već operišu nad svim parovima susednih bitova u dve promenljive koje učestvuju u operaciji.
Shodno navedenim uslovima, za konjunkciju, disjunkciju i XOR važi sledeće pravilo: bit na poziciji p
u rezultatu, dobija se obavljanjem operacije nad bitovima na poziciji p
u operandima a
i b
(a u slučaju operacije invertovanja, kao rezultat invertovanja bita na poziciji p
u promenljivoj a
).
Situacija u kojoj se ne može direktno pristupati pojedinačnim bitovima, može delovati pomalo problematično (i svakako zaslužuje pažnju), ali - uz pažljivo promišljanje - željeni rezultat se uvek može postići.
Za početak, pogledajmo kako funkcionišu sami operatori.
Operator & (bitovska konjunkcija)
Operacija logičke konjunkcije (koja je poznata i kao "logičko i", zbog idejne povezanosti sa veznikom "i" iz govornih jezika), obavlja se u skladu sa sledećom istinitosnom tablicom:
p | q | p ∧ q |
⊥ | ⊥ | ⊥ |
⊥ | ⊤ | ⊥ |
⊤ | ⊥ | ⊥ |
⊤ | ⊤ | ⊤ |
Tablica istinitosti za bitovski operator konjunkcije, prikazana je na sledećoj slici:
a | b | a & b |
0 | 0 | 0 |
0 | 1 | 0 |
1 | 0 | 0 |
1 | 1 | 1 |
Bitovski operator konjunkcije &
(bitovsko I), operiše nad dve celobrojne vrednosti, pristupajući nezavisno parovima bitova na istoj poziciji u obe promenljive, pri čemu se na svaku pojedinačnu poziciju primenjuje gornja tablica.
Kada se bitovski operator &
upotrebi između dve osmobitne celobrojne promenljive, * dobija se sledeći rezultat:
1 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | |
& | 1 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |
= | 1 | 0 | 0 | 0 | 1 | 0 | 0 | 1 |
Operator | (bitovska disjunkcija)
Logička disjunkcija (poznata i kao "logičko ILI", zbog idejne povezanosti sa veznikom ili), obavlja se u skladu sa sledećom istinitosnom tablicom:
p | q | p ∨ q |
⊥ | ⊥ | ⊥ |
⊥ | ⊤ | ⊤ |
⊤ | ⊥ | ⊤ |
⊤ | ⊤ | ⊤ |
Tablica istinitosti za bitovski operator disjunkcije, prikazana je na sledećoj slici:
a | b | a | b |
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 1 |
Bitovski operator disjunkcije |
(bitovsko ILI), takođe je binarni operator (a primer upotrebe bitovskog operatora disjunkcije, možemo videti na sledećoj slici):
1 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | |
| | 1 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |
= | 1 | 0 | 1 | 1 | 1 | 1 | 1 | 1 |
Operator ^ (bitovska isključiva disjunkcija)
Logička operacija ekskluzivne disjunkcije (isključivo ILI, odnosno XOR (ovoga puta nećemo tražiti očigledne 'paralele' sa govornim jezikom :))), obavlja se u skladu sa sledećom istinitosnom tablicom:
p | q | p ⊻ q |
⊥ | ⊥ | ⊥ |
⊥ | ⊤ | ⊤ |
⊤ | ⊥ | ⊤ |
⊤ | ⊤ | ⊥ |
Tablica istinitosti za bitovski operator XOR, prikazana je na sledećoj slici:
a | b | a ^ b |
0 | 0 | 0 |
0 | 1 | 1 |
1 | 0 | 1 |
1 | 1 | 0 |
Kada tablica sa slike #8 primeni na dve celobrojne vrednosti, preko bitovskog operatora ekskluzivne disjunkcije ^
(bitovski XOR), dobija se sledeći rezultat:
1 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | |
^ | 1 | 0 | 1 | 0 | 1 | 0 | 1 | 1 |
= | 0 | 0 | 1 | 1 | 0 | 1 | 1 | 0 |
Operator ~ (bitovska negacija / invertovanje bitova)
Operacija logičke negacije (invertovanje/logičko NE), obavlja se u skladu sa sledećom istinitosnom tablicom:
p | ¬p |
⊥ | ⊤ |
⊤ | ⊥ |
Tablica istinitosti za bitovski operator logičke negacije, prikazana je na sledećoj slici:
a | ~a |
0 | 1 |
1 | 0 |
Za razliku od drugih operatora koji su do sada opisani (i nekoliko operatora koji tek slede), bitovski operator negacije ~
je unarni operator, što znači da operiše nad jednom promenljivom.
Primer upotrebe bitovskog operatora ~
možemo videti na donjoj slici:
~ | 1 | 0 | 0 | 1 | 1 | 1 | 0 | 1 |
= | 0 | 1 | 1 | 0 | 0 | 0 | 1 | 0 |
Operator << (pomeranje bitova ulevo)
Operator <<
je binarni bitovski operator preko koga se svi bitovi celobrojne promenljive pomeraju određeni broj mesta ulevo.
U naredbi a << n
, svi bitovi promenljive a
pomeraju se za n
mesta ulevo, pri čemu važe sledeća pravila:
- uključeni bitovi sa leve strane, za koje posle pomeranja ulevo nema mesta - jednostavno se zanemaruju
- sa desne strane dopisuju se nule
Na primer, ukoliko promenljiva a
na početku ima vrednost 1
, posle operacije a << 2
imaće vrednost 4
.
Praktičan primer upotrebe operatora <<
možemo videti na donjoj slici:
1 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | |
<< | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
= | 0 | 1 | 1 | 1 | 0 | 1 | 0 | 0 |
Pri upotrebi operatora pomeranja bitova ulevo, mora se uvek voditi računa o 'levim bitovima' promenljive, jer (baš kao u slučaju sa gornje slike), lako se može desiti da neki od bitova praktično budu izbrisani!
Pomenuli smo na početku da bitovski operatori dobro dođu i u svakodnevnim situacijama, i stoga, u praktičnom smislu (ukoliko sa leve strane ima dovoljno mesta za jedinice koje se pomeraju), upotrebom operatora <<
, određena vrednost lako se može pomnožiti nekim od stepena broja dva (vrednostima kao što su 2, 4 .... 64, 128 .... 512 i sl).
Operator >> (pomeranje bitova udesno)
Operator >>
je binarni bitovski operator preko koga se svi bitovi celobrojne promenljive pomeraju određeni broj mesta udesno.
U naredbi a >> n
, svi bitovi promenljive a
pomeraju se za n
mesta udesno, pri čemu važe sledeća pravila:
- uključeni bitovi sa desne strane, za koje posle pomeranja udesno nema mesta - jednostavno se zanemaruju
- sa leve strane dopisuju se nule
Na primer, ukoliko promenljiva a
na početku ima vrednost 8
, posle operacije a >> 2
imaće vrednost 2
.
Praktičan primer upotrebe operatora >>
možemo videti na donjoj slici:
1 | 0 | 0 | 1 | 1 | 1 | 0 | 1 | |
>> | 0 | 0 | 0 | 0 | 0 | 0 | 1 | 0 |
= | 0 | 0 | 1 | 0 | 0 | 1 | 1 | 1 |
Pri upotrebi operatora pomeranja bitova udesno, takođe se mora uvek voditi računa o jedinicama sa (ovoga puta) desne strane.
Međutim, ukoliko se operator >>
koristi kao mehanizam za "brzinsko deljenje nekim od stepena dvojke", jasno je da je u pitanju celobrojno deljenje bez ostatka, ali, takođe je jasno (shodno svemu što smo prethodno naveli), da se uvek dobija korektan rezultat.
Složene operacije sa bitovima
Pošto smo se upoznali sa osnovnim operatorima, upoznaćemo se i sa tipičnim složeni(ji)m operacijama koje se obavljaju nad pojedinačnim bitovima celobrojnih promenljivih.
Pre svega, vraćamo se na jedno od glavnih pitanja sa početka: kako se može izvesti da određeni operator utiče samo na određeni bit u promenljivoj (a ne, na celu promenljivu)?
Maskiranje bita
Operacija koja se popularno naziva "maskiranje bit(ov)a", podrazumeva (tipično, ali ne i uvek; videćemo u nastavku), upotrebu pomoćne promenljive koja ima isključene sve bitove, i jedan uključen bit - na poziciji na kojoj je u glavnoj promenljivoj potrebno očitati vrednost bita ili obaviti neku drugu operaciju.
Uključivanje određenog bita (u pomoćnoj promenljivoj), najlakše se izvodi tako što se prvo uključi samo prvi bit (praktično, preko naredbe dodele m = 1
), posle čega se prvi bit, preko operatora pomeranja ulevo m = m << (p - 1);
, postavlja na poziciju p
.
m (maska) | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
p | 4 | |||||||
m << (p - 1) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
Na ovom mestu iznećemo i jednu napomenu tehničke prirode.
U idejnom smislu, postupak koji smo videli na slici je korektan, ali, u praktičnom smislu (u programskim jezicima), naredba kao što je ....
.... neće zapravo dovesti do pomeranja bitova u promenljivoj m
- jer se rezultat ne čuva!
Da bi rezultat bio sačuvan, neophodno je koristiti naredbu dodele:
Pogledajmo kako tehnike maskiranja pomažu pri izvođenju 'konkretnijih' operacija sa pojedinačnim bitovima.
Uključivanje pojedinačnog bita
Za uključivanje određenog bita (odnosno, za zadavanje vrednosti 1 određenom bitu), potrebno je prvo "maskirati" poziciju ....
m | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
p | 4 | |||||||
m << (p - 1) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
.... i potom pozvati bitovski operator disjunkcije (bitovsko ILI):
a | 1 | 1 | 0 | 1 | 0 | 1 | 0 | 1 |
m (maska) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
a = a | m | 1 | 1 | 0 | 1 | 1 | 1 | 0 | 1 |
Svi bitovi, osim "maskiranog" bita, zadržaće svoje vrednosti, a maskirani bit će posle izvršavanja operacije obavezno imati vrednost 1.
Isključivanje pojedinačnog bita
Za isključivanje određenog bita, prvo je potrebno napraviti standardnu masku (kakvu smo koristili i u prethodnom primeru):
m | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
p | 4 | |||||||
m << (p - 1) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
U sledećem koraku, maska se invertuje (preko operatora ~
, menjaju se vrednosti svih bitova, tako da nule postanu jedinice, a jedinice nule).
Na kraju, poziva se bitovski operator konjunkcije (bitovsko I):
a | 1 | 1 | 0 | 1 | 1 | 1 | 0 | 1 |
~m | 1 | 1 | 1 | 1 | 0 | 1 | 1 | 1 |
a = a & ~m | 1 | 1 | 0 | 1 | 0 | 1 | 0 | 1 |
Preko invertovane maske, postigli smo da se isključi samo bit na poziciji p
(koji je potrebno isključiti, i koji biva isključen).
Očitavanje vrednosti pojedinačnog bita
Može se reći da je očitavanje vrednosti bita na određenoj poziciji, najopštija od svih operacija koje se ('ikako') mogu izvoditi nad pojedinačnim bitovima, međutim, za razliku od prethodno opisanih operacija za koje praktično postoji jedan uobičajeni/optimalni postupak (koji se gotovo uvek koristi), za očitavanje bita postoje dva različita uobičajena pristupa, i upravo zato smo kraću diskusiju o operaciji očitavanja vrednosti bita ostavili "za pred kraj".
Varijanta 1
Sa jedne strane, očitavanje bita na određenoj poziciji, može se izvesti upotrebom standardne maske kakvu smo već koristili:
a | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 1 |
m (maska) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
a = a & m | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
Ideja se može implementirati na sledeći način:
.... pri čemu se kao rezultat dobija: ili 0, ili (praktično), "kopija" promenljive m
(maske).
Varijanta 2
U praksi (budući da prethodni algoritam nije baš pogodan za ekonomično zapisivanje u jednoj liniji koda), tipično se sprovodi postupak preko koga se traženi bit prvo pomera na najnižu poziciju, i potom se očitava vrednost krajnjeg desnog bita (ili, u praktičnom smislu - vrednost traženog bita).
Ako je potrebno očitati (na primer) 4. bit sa desne strane u promenljivoj a
, prvo je potrebno dovesti četvrti bit promenljive a
na krajnju desnu poziciju, preko operatora >>
:
a | 1 | 1 | 1 | 0 | 1 | 0 | 0 | 1 |
p | 4 | |||||||
a >> (p - 1) | 0 | 0 | 0 | 1 | 1 | 1 | 0 | 1 |
U drugom koraku - uz korišćenje bitovskog operatora konjunkcije - rezultat se svodi na 0 ili 1 (i pamti se preko dodatne promenljive).
x | 0 | 0 | 0 | 1 | 1 | 1 | 0 | 1 |
1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
r = x & 1 | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
Programski kod je još jednostavniji (nego što bi se dalo naslutiti posmatranjem primera sa prethodne dve slike):
Cela naredba zapisuje se u jednom redu, nema pomoćnih promenljivih, a sama promenljiva a
zadržava (prethodnu) vrednost.
Da pojasnimo dodatno: vrednost promenljive a
kopira se na (neimenovanu) pomoćnu memorijsku lokaciju, obavlja se pomeranje bitova, računa se krajnji rezultat (koji se smešta u promenljivu r
), i budući da nema naredbe dodele koja bi promenila vrednost promenljive a
- promenljiva a
zadržava vrednost.
Invertovanje ("obrtanje") bita na poziciji p
Sa jedne strane, invertovanje pojedinačnog bita, zapravo je krajnje jednostavna operacija (možda i najjednostavnija od svih).
Sa druge strane (bez obzira na prethodno navedenu jednostavnost), upotreba operatora XOR - koji naizgled nije namenjen "obrtanju" pojedinačnih bitova, na prvi pogled deluje manje intuitivno od upotrebe operatora ~
koji doslovno jeste namenjen invertovanju bitova (ali u ovom slučaju neće biti od pomoći), i stoga smo operaciju invertovanja pojedinačnih bitova ostavili za kraj.
U svakom slučaju, dovoljno je samo maskirati određeni bit ....
m | 0 | 0 | 0 | 0 | 0 | 0 | 0 | 1 |
p | 4 | |||||||
m << (p - 1) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
.... i pozvati bitovski operator XOR:
a | 1 | 1 | 0 | 1 | 0 | 1 | 0 | 1 |
m (maska) | 0 | 0 | 0 | 0 | 1 | 0 | 0 | 0 |
a = a ^ m | 1 | 1 | 0 | 1 | 1 | 1 | 0 | 1 |
.... koji (sada je jasno), deluje "kao poručeno" za ovakav zahvat.
Operator XOR (bilo da je u pitanju bitovska ili "nebitovska" varijanta), ima i brojne druge primene (o čemu ćemo pisati u nekom od narednih članaka), a za sam kraj vam ostavljamo da uživate u jednostavnosti i eleganciji algoritma za invertovanje pojedinačnih bitova.