KompjuteraTeknologjisë së informacionit

Encoding "Unicode": Karakteri kodim standarde

Çdo përdorues interneti në një përpjekje për të ngritur një ose të tjera të saj funksioni të paktën një herë pashë në ekran Shkruar në latinisht letra fjala "Unicode." Çfarë është kjo, ju do të mësoni duke lexuar këtë artikull.

përcaktim

Encoding "Unicode", - karakter encoding standarde. Ai u ofroi një organizatë jo-fitimprurëse Unicode Inc. në vitin 1991. Standardi është projektuar për të sjellë së bashku numrin më të madh të mundshëm të llojeve të ndryshme të karaktereve në një dokument. Page, e cila është themeluar në bazë të saj, mund të përmbajë shkronja dhe karaktere nga gjuhë të ndryshme (nga ruse për Koreançe) dhe shenjat matematikore. Në këtë rast, të gjithë personazhet në grup karakter janë shfaqur pa ndonjë problem.

Arsyet për krijimin e

Njëherë e një kohë, shumë kohë para shfaqjen e një sistemi të vetëm "Unicode" encoding është zgjedhur në bazë të preferencave të autorit të dokumentit. Për këtë arsye, shpesh për të lexuar një dokument, ishte e nevojshme për të përdorur tavolina të ndryshme. Ndonjëherë është e nevojshme për të bërë disa herë, të cilat në masë të madhe e komplikon jetën e përdoruesit mesatare. Siç është përmendur tashmë, zgjidhja për këtë problem në vitin 1991 u ftua në një organizatë jo-fitimprurëse Unicode Inc., do të ofrojë një lloj të ri të karakterit encoding. Ajo ishte projektuar për të kombinuar vjetëruar dhe një shumëllojshmëri të standardeve. "Unicode" - një encoding se ozvolila arritur pamendueshme në atë kohë: për të krijuar një mjet që mbështet një numër i madh karaktere. Rezultati tejkaluar shumë pritjet - ka pasur dokumente njëkohësisht përmbajnë edhe anglisht dhe tekstin rus, latinisht, dhe shprehjeve matematikore.

Por krijimi i një kodim të unifikuar paraprirë nga nevoja për të zgjidhur një sërë problemesh që kanë lindur për shkak të larmi të madhe të standardeve ekzistuese në atë kohë. Më e zakonshme e tyre:

  • shkrim magjik, ose "dërdëllisje";
  • kufizimet e vendosur karakter;
  • Problemi transformuar codings;
  • dyfishim font.

excursus vogël historik

Paramendoni se 80 oborr. hardware kompjuteri nuk është aq e zakonshme dhe ka një formë të ndryshme nga sot. Ndërsa çdo OS është unik dhe të rafinuar nevojat specifike të çdo entuziast së. Nevoja për shkëmbimin e informacionit është konvertuar në një Rework çdo gjë shtesë. Duke u përpjekur për të lexuar një dokument i krijuar nga një tjetër operativ sistemi, shpesh tregon një grup i çuditshëm karaktere, dhe loja fillon me encoding. Ajo nuk ka gjithmonë të bëjë atë sa më shpejt, dhe nganjëherë dokument i nevojshëm paaftë për të hapur në gjashtë muaj, dhe madje edhe më vonë. Njerëzit të cilët shpesh shkëmbejnë informacione, të krijojë për veten e tyre një tabelë konvertimit. Dhe pastaj të punojnë në ato zbulon një detaj interesant: nevoja për të krijuar ato në dy drejtime ", nga im në tuaj" mbrapa dhe me radhë. Bëni banal përmbysja makinë informatikë nuk mund të, për atë në kolonën e djathtë e burimit, dhe e majta - rezultati, por jo anasjelltas. Nëse ju shikoni nevoja për të përdorur ndonjë karakter të veçantë në dokument, ata kishin për të shtuar të parë, dhe pastaj një tjetër, dhe për të shpjeguar të partnerit atë që ai duhet të bëjë për këto karaktere nuk bëhet një "dërdëllisje." Dhe le të mos harrojmë se për çdo encoding kishte për të zhvilluar ose zbatuar fonts tyre, të cilat çuan në krijimin e një numri të madh të kopje identike në OS.

Imagjinoni më tutje se fonts në faqe, ju do të shihni 10 copa të njëjta Times New Roman me një shënim të vogël: për UTF-8, UTF-16, ANSI, SHDU-2. Tani ju e kuptoni se zhvillimi i standardeve universale ishte e domosdoshme?

"Etërit themelues të krijuesit të"

Origjina e krijimit të Unicode të gjendet në vitin 1987, kur Dzho Bekker nga Xerox, së bashku me Lee Collins dhe Mark Davis nga Apple filloi hulumtimet në fushën e krijimit praktik të një sërë karakter universal. Në gusht të vitit 1988, Dzho Bekker publikoi një projekt-propozim për krijimin e 16-bit multi-gjuhësor sistemin ndërkombëtar kodimit.

Pas disa muajsh grupi i punës Unicode u zgjerua për të përfshirë Ken Whistler dhe Mike Kernegana nga RLG, Glenn Wright i Sun Microsystems dhe disa specialistë të tjerë, duke mundësuar përfundimin e punës në formimin paraprak të një standardi të përbashkët kodim.

përshkrim të përgjithshëm

Unicode bazuar në konceptin e simbolit. Nën ky përkufizim i referohet një fenomen abstrakt që ekziston në një formë të veçantë të të shkruarit dhe të realizohet përmes një grapheme ( "portrete" e tyre). Secili karakter është dhënë në kodin "Unicode" unike që i përkasin një standard të veçantë njësi. P.sh. grapheme B është gjithashtu në anglisht dhe rusisht alfabete, por ajo korrespondon me Unicode 2 ndryshme karaktere. Ata janë subjekt i konvertimit të vogle, t. E., Secili nga e cila përshkruan bazën e të dhënave kyç, një grup i pronave dhe emrin e plotë.

Përfitimet e Unicode

Nga bashkëkohësit e tjera Encoding "Unicode" Nuk është një gjendje e madhe e shenjave për personazhet e "encryption". Fakti se paraardhësit e tij kishin 8 bit, e cila është mbështetur nga 28 karaktere, por dizajni i ri tashmë ishte 216 karaktere, që ishte një hap gjigant përpara. Kjo shifroj lejoi pothuajse të gjitha alfabetet ekzistuese dhe të përbashkëta.

Me ardhjen e "Unicode" nuk duhet të përdorin një tabelë konvertimit: si një standard të vetëm ai thjesht mohuar nevojën për ta. Në mënyrë të ngjashme, ata kanë zhytur në harresë, dhe "dërdëllisje" - një standard i vetëm i bëri ata të pamundur, si dhe përjashtoi nevojën për të krijuar fonts kopjuar.

zhvillimi i Unicode

Sigurisht, progresi nuk është në vend, dhe që nga prezantimi i parë ka kaluar për 25 vjet. Megjithatë, charset "Unicode" kokëfortësi e mban pozitën e saj në botë. Në shumë mënyra kjo është bërë e mundur në sajë të faktit se ajo është bërë të lehtë për të zbatuar dhe është përhapur, duke u njohur zhvilluesve të pronarit (paguar) dhe softuer.

Ne nuk duhet të besojmë se sot ne shohim kodin e njëjtë "Unicode" si në tremujorin e një shekulli më parë. Në këtë moment, ai u zëvendësua nga version 5.h.h, dhe numri i simboleve të koduara është rritur në 231. Mbi mundësinë e përdorimit të një diferencë më të madhe shënon refuzoi të ende mbajnë mbështetje për Unicode-16 (encoding, ku shuma maksimale e numrit të tyre të kufizuar 216). Që nga fillimi i tij dhe deri në versionin 2.0.0 "Standardi Unicode" ka rritur numrin e karaktereve që përfshihen pothuajse në 2 herë. mundësitë dhe rritja e vazhdueshme në vitet e ardhshme. Për versionin 4.0.0 tashmë ka një nevojë për të rritur standardin vetë, dhe kjo është bërë. Si rezultat, "Unicode" ka gjetur formën në të cilën e njohim ne sot.

Çfarë tjetër është në Unicode?

Përveç të madhe, përditësuar vazhdimisht me numrin e karaktereve, "Unicode" -Encoding informacion teksti është një tjetër tipar i dobishëm. Kjo është e ashtuquajtura normalizimi. Në vend se të lëvizni nëpër të gjithë karakterin e dokumentit me karakter, dhe të zëvendësojë ikonat e tabelës korrespondencës, përdorni një nga algoritme ekzistuese normalizimit. Çfarë është ajo?

Në vend të humbur burimet e kompjuterit në një kontroll të rregullt të të njëjtit karakter, i cili mund të jetë i ngjashëm në alfabete të ndryshme, duke përdorur një algoritëm të veçantë. Kjo ju lejon të bëni një simbole të ngjashme të veçantë tryezë kolonë lookup dhe të aplikojnë tashmë për ta, jo pushim për të recheck të gjitha të dhënat.

Algoritme të tilla janë zhvilluar dhe implementuar katër. Çdo konvertimit zhvillohet në një parim të përcaktuar në mënyrë rigoroze, ndryshe nga të tjerët, kështu që e quaj asnjë prej tyre nuk është më efektive të mundshme. Çdo projektuar për nevoja të veçanta, është ngulitur dhe përdorur me sukses.

standarde shpërndarja

Në 25 vitet e historisë së saj encoding "Unicode" Unë kam marrë ndoshta më e përhapur në botë. Sipas këtij standardi janë të rregulluara si programet dhe web-faqet. Gjerësia e aplikimit mund të tregojnë se Unicode tani përdoret nga më shumë se 60% të burimeve të internetit.

Tani, ju e dini, kur standardi "Unicode" u shfaq. Çfarë është ajo, edhe ju e dini dhe të jetë në gjendje të vlerësojmë rëndësinë e plotë të shpikjes, të bërë nga një grup ekspertësh Unicode Inc. Më shumë se 25 vjet më parë.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sq.birmiss.com. Theme powered by WordPress.