Уницоде фрее табела знакова

10. 5. 2019.

Уницоде је међународни стандард за кодирање знакова који вам омогућава да текстове прикажете равномерно на било ком рачунару у свету, без обзира на системски језик који се користи на њему.

Основе

Да бисмо разумели зашто је потребна табела Уницоде симбола, хајде да прво погледамо механизам за приказивање текста на екрану монитора. Рачунар, као што знамо, обрађује све информације у дигиталном облику, и мора бити приказан у графичкој форми за исправну перцепцију од стране особе. Дакле, да бисмо могли прочитати овај текст, морамо ријешити најмање два проблема:

  • Кодирање знакова за штампање у дигиталном облику.
  • Обезбедите оперативном систему могућност да усклади дигитални облик са векторским симболима, другим речима, пронађите исправна слова.

Фирст енцодингс

Предак свих кодирања се сматра америчким АСЦИИ. Описао је латиницу која се користи на енглеском језику знакове интерпункције и Арапски бројеви. Управо је 128 карактера који су коришћени у њему постали основа за даљи развој - чак их и модерна табела Уницоде симбола користи. Од тада, слова латинице су заузимала прву позицију у било ком кодирању.

Уницоде табела знакова

Све у свему, АСЦИИ је дозволио да сачува 256 карактера, али пошто је првих 128 било на латиници, преосталих 128 је почело да се користи широм света за креирање националних стандарда. На пример, у Русији су ЦП866 и КОИ8-Р створени на његовој основи. Такве варијације називане су проширене верзије АСЦИИ-а.

Кодне странице и Црацкдовнс

Даљи развој технологије и појава ГУИ довела је до тога да је Амерички институт за стандардизацију креирао кодирање АНСИ. За руске кориснике, посебно са искуством, његова верзија је позната као Виндовс 1251. По први пут у њему је коришћен концепт "кодна страница". Помоћу кодних страница које су садржавале симболе националних писама, осим латинског, успостављено је „међусобно разумијевање“ између рачунала која се користе у различитим земљама.

Међутим, присуство великог броја различитих кодирања за један језик почело је да ствара проблеме. Било је такозваних кракозабрија. Они су настали услед неусаглашености оригиналне кодне странице, на којој су све информације креиране, и кодне странице која се подразумевано користи на рачунару крајњег корисника.

Уницоде табела знакова

Као пример, могу се навести горе наведене кодирања ЦП866 и КОИ8-Р. Писма у њима разликовала су позиције кодова и принципе пласмана. У првом су распоређени по абецедном реду, ау другом - произвољно. Можете замислити шта се дешавало пред очима корисника који је покушао да отвори такав текст без неопходне кодне странице или ако је рачунар погрешно протумачио.

Цреате Уницоде

Ширење Интернета и сродних технологија, као што је е-маил, довело је до тога да је на крају ситуација са изобличењем текстова престала да одговара свима. Водеће ИТ компаније формирале су Уницоде конзорцијум ("Уницоде Цонсортиум"). Табела карактера, која им је представљена 1991. године под именом УТФ-32, дозволила је похрањивање више од милијарду јединствених знакова. То је био најважнији корак на путу дешифровања текстова.

Уницоде табела знакова знакова

Међутим, прва универзална табела Уницоде УТФ-32 кодова знакова није била широко коришћена. Главни разлог је био вишак похрањених информација. То је брзо израчунато за земље у којима латиница шифрован помоћу нове универзалне табеле, текст ће заузети четири пута више простора него када се користи проширена АСЦИИ табела.

Уницоде развој

Следећа Уницоде УТФ-16 табела симбола је решила овај проблем. Кодирање је извршено у пола броја битова, али се истовремено смањио и број могућих комбинација. Уместо милијарди карактера, омогућава вам да уштедите само 65.536, али је био толико успешан да је овај број, према одлуци Конзорцијума, одређен као основни простор за складиштење карактера Уницоде стандарда.

Упркос овом успеху, УТФ-16 није одговарао свима, јер је количина похрањених и пренесених информација још увијек била двоструко већа. Универзално решење је УТФ-8, Уницоде табела променљиве дужине. Ово се може назвати пробој у овој области.

Уницоде таблица знакова Руссиан

Тако, уз увођење последња два стандарда, табела са Уницоде симболима решила је проблем једног простора кода за све тренутно коришћене фонтове.

Уницоде за руски језик

Због променљиве дужине кода који се користи за приказивање знакова, латиница се кодира у Уницоде на исти начин као у АСЦИИ праотацу, тј. У једном биту. За друге алфабете, слика може изгледати другачије. На пример, знаци грузијске абецеде се користе за кодирање три бајта, а знакови ћириличног писма - два. Све то је могуће у оквиру коришћења Уницоде УТФ-8 стандарда (табела симбола). Руски језик или ћирилично писмо заузимају 448 позиција у општем простору кода подељеном у пет блокова.

Уницоде табела кодова знакова

Ових пет блокова обухватају главну ћириличну и црквенословенску абецеду, као и додатна слова других језика који користе ћирилицу. Одређени број позиција је додељен за приказ старих облика представљања ћириличних слова, док је 22 мјеста од укупног броја остало слободно.

Тренутна верзија Уницоде-а

Решењем свог основног задатка, а то је стандардизација фонтова и креирање једног кода за њих, Конзорцијум није зауставио свој рад. Уницоде се стално развија и расте. Најновија верзија овог стандарда, 9.0, објављена је 2016. године. Укључио је шест додатних алфабета и проширио листу стандардизованих емотикона.

Треба напоменути да, како би се поједноставила истраживања, чак и тзв мртви језици. То име су добили јер нема људи за које би то били рођаци. Ова група укључује и језике који су се сводили на наше вријеме само у облику писаних споменика.

У принципу, свако може да се пријави за додавање знакова у нову Уницоде спецификацију. Истина, ово ће морати попунити пристојну количину изворних докумената и потрошити пуно времена. Живи пример за то је прича о програмеру Теренцеу Едену. Године 2013. поднео је захтев за укључивање у спецификацију карактера везаних за одређивање контролних тастера за контролу напајања рачунара. У техничкој документацији, они су коришћени од средине 70-их година прошлог века, али док се спецификација 9.0 није појавила, они нису били део Уницоде-а.

Табела симбола

На сваком рачунару, без обзира на оперативни систем који се користи, користи се табела Уницоде симбола. Како користити ове табеле, гдје их пронаћи и зашто могу бити корисне просјечном кориснику?

уницоде табела знакова како се користи

На Виндовс-у, табела са симболима се налази у менију "Тоолс". У Линук породици оперативних система, она се обично може наћи у подсекцији “Стандард”, иу МацОС-у у поставкама тастатуре. Главна сврха ове табеле је да унесете знакове у текстуалне документе који се не налазе на тастатури.

Апликација за такве табеле може се наћи најшири: од уноса техничких симбола и икона националних монетарних система до писања инструкција за практичну примену Тарот карата.

У закључку

Уницоде се користи свуда и улази у наше животе заједно са развојем Интернета и мобилних технологија. Захваљујући његовом коришћењу, систем међуетничке комуникације је значајно поједностављен. Можемо рећи да је увођење Уницода индикативно, али потпуно неприметно из примјера кориштења технологије за опће добро цијелог човјечанства.