KompjuteraTeknologjisë së informacionit

Encoding e informacionit tekst në kompjuter

Computer - një pajisje të sofistikuar me të cilën ju mund të krijoni, convert, dhe të ruajtur informacione. Megjithatë, kompjuteri nuk punon mënyrë shumë të kuptueshme për ne - grafik, tekst dhe të dhënat numerike është e ruajtur si vargjeve binare numra. Në këtë artikull ne do të shikojmë se si kodimin e informacionit tekst.

Ajo që për ne është teksti i një kompjuter - një sekuencë e karaktereve. Çdo simbol përfaqëson një grup të caktuar të zero dhe ato. Sipas simbolet do të thotë jo vetëm sipërme dhe rastin më të ulët shkronjat e Latine alfabetit, por edhe shenjat e pikësimit, shenjat aritmetike, karaktere të veçanta, simbole të veçanta dhe madje edhe hapësirë.

encoding Binary e informatave tekstuale

Duke shtypur një buton të caktuar në kontrollues të brendshëm dërgon një sinjal elektrik që është konvertuar në një kod binar. Kodi po kompletohet me një simbol të caktuar, e cila shfaqet në ekran. Për dorëzimin në alfabetin latin në një format ASCII dixhital coding sistemin ndërkombëtar u krijua. Ajo kërkon 1 bajt për regjistrimin e një simbol pra përbëhet nga tetë-simbol sekuencë e zero dhe ato. interval Regjistrimi - nga 00000000 11111111 për të, dmth kodimi i informatave tekst duke përdorur këtë sistem na lejon për të përfaqësuar 256 karaktere. Në shumicën e rasteve, kjo është e mjaftueshme.

ASCII është i ndarë në dy pjesë. 127 karakteret e para (nga 00000000 deri 01111111) janë ndërkombëtare dhe janë simbole të veçanta dhe shkronjat e alfabetit anglez. Pjesa e dytë - extension (nga 10000000 për 11111111) - ka për qëllim të përfaqësojë alfabetin kombëtar, shkrimi i të cilit është e ndryshme nga latinishtja.

Encoding informacion tekst në ASCII është ndërtuar mbi parimin e rend në rritje, pra, sa më i madh numri rend e letrave, aq më e madhe vlera e saj ASCII-kod. Shifrat dhe pjesë ruse e tabelës janë ndërtuar në të njëjtin parim.

Megjithatë, në botë ka disa lloje të encoding për shkronja cirilike. Më të zakonshme - është KOI-8 (tetë-bit encoding që është përdorur në vitet '70 në ruifitsirovannyh parë sistemin operativ Unix), ISO 8859-5 (zhvilluar nga Byroja Ndërkombëtare për Standardizim), CP 1251 (kodimit informacione tekstuale të përdorura në modern OS Windows), si dhe encoding 2-byte e Unicode, e cila mund të përdoret për të futur 65.536 karaktere. Tillë një shumëllojshmëri të encodings për shkak të faktit se ata ishin zhvilluar në kohë të ndryshme, për sisteme të ndryshme operative dhe konsiderata të ndryshme. Për shkak të kësaj, shpesh kanë vështirësi kur transferimin tekstin nga një medium në një tjetër - nga një mospërputhje kodon e përdoruesit do të shihni një grup të ikonave konfuze. Si mund ta rregulluar këtë situatë? Në Word, për shembull, kur një dokument është i hapur, një mesazh në lidhje me problemet me të shfaqur tekstin dhe ofron disa opsione për transcoding.

Kështu, coding dhe përpunimin e informacionit tekstual në zorrët e kompjuterit - procesi është i vështirë dhe koha-konsumojnë organizuar. Të gjitha simbolet e çdo alfabetit janë vetëm një sekuencë të caktuar të shifrave të sistemit binar, një qelizë - kjo është një bajt e informacionit.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 sq.birmiss.com. Theme powered by WordPress.