ArvutidInfotehnoloogia

Encoding "Unicode": iseloomu kodeerimise standard

Iga Interneti kasutaja, püüdes luua üks või teine oma funktsiooni vähemalt kord nägin ekraanil kirjutatud ladina tähtedega sõna "Unicode". Mis on see, õpid lugedes seda artiklit.

määratlus

Encoding "Unicode" - märgikodeering standardile. Tehti ettepanek Unicode Inc. mittetulundusühing 1991. aastal. Standard on loodud koondada võimalikult palju erinevaid märke dokumendis. Page, mis loodi selle alusel, võib sisaldada tähti ja märke eri keeltes (vene Korea) ja matemaatilise märke. Sel juhul on kõik märgid kooditabel kuvatakse ilma probleemideta.

Põhjused loomiseks

Kunagi ammu, ammu enne ilmumist ühtne süsteem "Unicode" on valitud kodeering põhineb eelistuste dokumendi autor. Sel põhjusel sageli lugeda dokumenti, oli vaja kasutada erinevaid tabeleid. Mõnikord on vaja teha mitu korda, mis oluliselt raskendab elu tavakasutaja. Nagu juba mainitud, lahendus sellele probleemile 1991 kutsuti Unicode Inc. mittetulunduslik organisatsioon pakkuda uut tüüpi kodeeringu. Selle eesmärk oli ühendada vananenud ja erinevaid standardeid. "Unicode" - kodeering ozvolila saavutada mõeldamatu ajal: luua vahend, mis toetab suurt hulka märke. Tulemuseks ületas paljude ootusi - seal olid dokumendid samaaegselt sisaldavad nii inglise ja vene teksti ladina ja matemaatilised avaldised.

Aga loomine ühtne kodeerimine eelneb vaja lahendada mitmeid probleeme, mis on tekkinud seetõttu, et väga erinevaid standardeid juba sel ajal. Kõige tavalisem neist:

  • Haldjate kirjalikult või "plära";
  • piirangutest kooditabelisse
  • Probleem muuta codings;
  • font dubleerimist.

Väike ajalooline ekskurss

Kujutage ette, et õue 80.. Arvuti riistvara ei ole nii levinud ja on erinevas vormis täna. Kuigi iga OS on unikaalne ja rafineeritud iga entusiast erivajadustele. Vajadus teabevahetust konverteeritakse veel ümbertegemine kõike. Proovin lugeda dokumendi loodud teise operatsioonisüsteemi, sageli kuvab kummaline märkide ja mäng algab kodeeringut. See ei ole alati seda teha kiiresti ja mõnikord vajalik dokument ei saa avada kuus kuud ja isegi hiljem. Inimesed, kes sageli vahetavad teavet, luua ise teisendustabel. Ja siis nendega töötada paljastab huvitav detail: vajadus luua neile kahes suunas, "minu oma" edasi-tagasi. Tee banaalne inversioon arvuti masin ei saa seda paremas veerus allika ja vasakul - tulemus, kuid mitte vastupidi. Kui näete vajadust kasutada erimärke dokumendis, pidid nad lisatakse esimese ja seejärel teise, ning selgitada partneri, mida ta peab tegema, et need märgid ei saanud "plära." Ja ärgem unustagem, et iga kodeeringut oli arendada või rakendada oma fonte, mis viiski tohutu hulk kordusi OS.

Kujutage veel, et fondid lehel näed 10 tükki identsed Times New Roman väikese märkus: UTF-8, UTF-16, ANSI, UCS-2. Nüüd saate aru, et areng universaalsete standarditega oli hädavajalik?

"Alusepanijaid loojad"

Päritolu loomine Unicode võib leida 1987. Dzho Bekker Xerox koos Lee Collins ja Mark Davis Apple hakkas teadus valdkonnas praktiline loomine universaalne märgisüsteem. 1988. aasta augustis, Dzho Bekker avaldas eelnõu loomine 16-bitine mitmekeelse rahvusvahelise kodeerimissüsteemi.

Paar kuud hiljem Unicode töörühm laienenud ka Ken Whistler ja Mike Kernegana alates RLG, Glenn Rayt Sun Microsystems ja mitmed teised spetsialistid, mis võimaldab lõpetamist töö esialgse moodustamine ühise kodeerimise standard.

üldkirjeldus

Unicode põhineb mõiste sümbol. Selle definitsiooni kohaselt viitab abstraktne nähtus, mis eksisteerib teatud vormis kirjalikult ja realiseerub grafeeni (nende "portreed"). Iga märk on toodud "Unicode" unikaalne kood, mis kuulub eelkõige üksuse standard. Nt grafeeni B on ka inglise ja vene tähestikku, kuid see vastab Unicode 2 erinevat tähemärki. Nad alluvad konversioon väiketähed, t. E., millest igaüks kirjeldab peamisi andmebaasi kogum omadusi ja täisnimi.

Eelised Unicode

Teistest kaasaegsetest kodeerivad "UNICODE" Seal on tohutu varu märke "krüpteerimine" märki. Asjaolu, et tema eelkäijad olid 8 bitti, mis on toetatud 28 märki, kuid uus kujundus oli juba 216 tähemärki, mis oli suur samm edasi. See võimaldas kodeerida peaaegu kõiki olemasolevaid ja ühine tähestikke.

Tekkega "Unicode" ei pea enam kasutada teisendustabel: ühe standard see lihtsalt olematuks vajadust. Samamoodi on nad vajunud unustusse, ja "seosetu" - ühtse standardi tegi nad võimatuks, samuti välistada vajadust luua Topeltfonte.

arengut Unicode

Muidugi, edu ei ole paigas, ja kuna esimene esitlus on möödunud 25 aastat. Kuid charset "Unicode" kangekaelselt hoiab oma positsiooni maailmas. Paljuski on see saanud võimalikuks tänu sellele, et see on muutunud lihtne rakendada ja on levinud, on tunnustatud arendajad varaliste (makstud) ja avatud lähtekoodiga tarkvara.

Me ei tohiks arvata, et täna me näeme sama koodi "Unicode", nagu veerand sajandit tagasi. Praegu see asendati versioon 5.h.h ja arvu kodeeritud sümbolite kasvanud 231. On võimalus kasutada suurema Reunusmerkkien keeldus endiselt toetust Unicode-16 (kodeerimine, kus maksimaalne summa nende piiratud arv 216). Alates selle loomisest kuni versiooni 2.0.0 "Unicode Standard" on suurendanud arvu märke, et see oli peaaegu 2 korda. võimalused ja jätkuvat kasvu lähiaastatel. Versioonile 4.0.0 juba on vaja suurendada standard ise, ja mis oli tehtud. Selle tulemusena "Unicode" on leidnud vormi, mis me teame seda täna.

Mida on Unicode?

Lisaks suur, pidevalt uuendatakse märkide arvu, "Unicode" kodeerivaid teksti informatsiooni on teine kasulik omadus. See on nn normaliseerumist. Selle asemel, et kerida kogu dokumendi tähthaaval ja asendada ikoonid kirjavahetus tabeli kasutada mõne olemasoleva normaliseerumine algoritme. Mis see on?

Selle asemel, et raisata ressursse arvuti regulaarselt kontrollida sama iseloomuga, mis võib olla sarnane erinevate tähestike, kasutades spetsiaalset algoritmi. See võimaldab teil teha sarnase sümbolid eraldi veerus lookup tabeli ja rakendada juba neile ei ikka ja jälle, et kontrollida üle kõik andmed.

Sellised algoritmid on välja töötatud ja rakendatud neli. Iga muundamise toimub rangelt kindlat põhimõtet, erinev teistest, nii et helistada ükskõik neist ei ole kõige tõhusam võimalik. Iga mõeldud spetsiifilistele vajadustele, oli varjatud ja edukalt kasutada.

avaldamispoliitikat

25 aastat ajalugu kodeering "UNICODE" Olen saanud ilmselt kõige levinum maailmas. Selle standardi reguleerida programmide ja kodulehekülgedele. Laius võib taotluses, et Unicode nüüd kasutada rohkem kui 60% Interneti ressursse.

Nüüd sa tead, kui "Unicode" standard ilmunud. Mis see on, siis ka teab ja oskab hinnata tähendust tervikuna leiutise tehtud ekspertide rühm Unicode Inc. Rohkem kui 25 aastat tagasi.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 et.birmiss.com. Theme powered by WordPress.