ArvutidInfotehnoloogia

Encoding teksti informatsiooni arvuti

Arvuti - keerukas seade, millega saab luua, muuta, ja salvestada teavet. Kuid arvuti ei tööta väga arusaadavalt meile - graafiline, teksti ja numbrilise andmed salvestatakse binaarne massiivid numbrid. Selles artiklis me vaatleme, kuidas kodeering teksti informatsiooni.

Mis meil on teksti arvuti - tähemärkide jada. Iga sümbol tähistab teatud hulk ühtede ja nullide. Vastavalt sümbolid tähendas mitte ainult suur- ja väiketähti tähtedega ladina tähestiku, vaid ka kirjavahemärke, märgiga, erimärkide erisümboleid ja isegi ruumi.

Binaarkodeeringuga tekstilise teabe

Vajutades teatud klahvi sisemine kontroller saadab elektrilise signaali, mis on ümber kahendkoodi. Kood on sobitatud teatud sümbol, mis kuvatakse ekraanil. Esitamiseks ladina tähestikku digitaalkujul ASCII koodis rahvusvahelise süsteem loodi. See nõuab 1 bait nii ühe sümboli seega koosneb kaheksast-sümbolijada ühtede ja nullide. Salvestus intervalli - alates 00000000 kuni 11111111, st kodeerimine teksti informatsiooni kasutades seda süsteem võimaldab meil esindama 256 tähemärki. Enamikul juhtudel on see piisav.

ASCII on jagatud kahte ossa. Esimene 127 tähemärki (00000000-01111111) on rahvusvaheline ja on omased sümbolid ja tähed inglise tähestikku. Teine osa - laiend (10000000-11111111) - on mõeldud esindama riigi tähestikus, kirjalikult, mis erineb ladina.

Encoding teksti informatsiooni ASCII on ehitatud põhimõttel kasvav jada, st suuremat järjenumbrit tähed, seda suurem väärtus selle ASCII-kood. Arvud ja vene osa tabelis on ehitatud samal põhimõttel.

Kuid maailmas on mitu liiki kodeering kirillitsa tähed. Kõige tavalisem - on KOI-8 (kaheksa-bitine kodeering, et on kasutatud 70. esimeses ruifitsirovannyh Unix operatsioonisüsteemi), ISO 8859-5 (välja töötanud Rahvusvaheline Standardiorganisatsioon Bureau), CP 1251 (kodeerimine tekstilist teavet kasutatakse kaasaegne OS Windows), samuti 2-baitkodeerimist Unicode, mida saab kasutada, et tutvustada 65536 tähemärki. Selline erinevaid kodeeringuid tingitud asjaolust, et nad on välja arendanud eri aegadel, eri operatsioonisüsteemide ja erinevaid kaalutlusi. Selle tõttu on sageli raskusi kandes teksti ühest meediumist teise - alates ebakõla, mis kodeerib kasutaja näeb komplekt segane ikoonid. Kuidas ma saan määrata see olukord? Wordis näiteks siis, kui dokument on avatud, sõnumi probleeme tekstiga ekraan ja pakub mitmeid võimalusi transkodeerimine.

Seega, kodeerimine ja töötlemine tekstilist teavet arvuti kõht - protsess on keeruline ja aeganõudev korraldatud. Kõik sümbolid mis tahes tähestik on ainult teatud numbrite jada kahendsüsteemi, üks rakk - see on üks bait teavet.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 et.birmiss.com. Theme powered by WordPress.