Besplatno Unicode tablica znakova

Unicode je međunarodni standard kodiranja znakova koji vam omogućuje prikaz teksta na bilo kojem računalu na svijetu na isti način, bez obzira na jezik sustava koji se na njemu koristi.

Osnove

Da bismo razumjeli što je potrebna tablica Unicode znakova, najprije ćemo razumjeti mehanizam prikazivanja teksta na zaslonu monitora. Računalo, kao što znamo, obrađuje sve informacije digitalno, ali da bi ga izveo za ispravnu percepciju osobe mora biti u grafici. Dakle, da bismo mogli pročitati ovaj tekst, moramo riješiti najmanje dva zadatka:
  • Kodirati tiskane znakove u digitalnom obliku.
  • Omogućiti operacijskom sustavu usporedbu digitalnog oblika s vektorskim simbolima, drugim riječima, pronaći ispravna slova.
  • Prvo kodiranje

    Preteča svih kodiranja smatra se američkim ASCII. Opisao je englesku abecedu s interpunkcijskim znakovima i arapskim brojevima. 128 znakova koji su korišteni postali su temelj daljnjeg razvoja - koristi se čak i moderna Unicode tablica znakova. Od tada, prva slova u bilo kojem kodiranju zauzimaju slova latinice.
    Svi ASCII-ovi dopuštali su spremanje 256 znakova, ali budući da su prvih 128 bili latinski, preostalih 128 je korišteno globalno za izradu nacionalnih standarda. Na primjer, u Rusiji, na njegovoj osnovi stvoreni su CP866 i KOI8-R. Te su se varijacije zvale proširenjaASCII verzije.

    Kodirane stranice i Crazzybras

    Daljnji razvoj tehnologije i pojavljivanje grafičkog sučelja doveli su do stvaranja ANSI kodiranja od strane Američkog instituta za standardizaciju. Za ruske korisnike, osobito s iskustvom, njegova verzija je poznata kao Windows 1251. Prvo je uvela koncept "kodne stranice". Uz pomoć kodnih stranica koje su sadržavale simbole nacionalnih pisama, osim latinskog, postojalo je "međusobno razumijevanje" između računala koja se koriste u različitim zemljama.

    Međutim, prisutnost velikog broja različitih kodiranja korištenih za isti jezik, počela je uzrokovati probleme. Bilo je takozvanih karkozybrisa. Oni su nastali zbog nepodudarnosti izvorne kodne stranice na kojoj su neke informacije stvorene i kodne stranice koja se prema zadanim postavkama koristi na računalu krajnjeg korisnika.
    Kao primjer, mogu se navesti gore spomenute ćirilične kodiranja CP866 i KOI8-R. Pisma u njima razlikovala su se po pozicijama kodova i načelima smještaja. U prvom su bili raspoređeni po abecednom redu, au drugom - na proizvoljan način. Možete zamisliti što se događalo pred očima korisnika koji je pokušao otvoriti takav tekst bez šifre koju želite ili pogrešnog tumačenja računala.

    Stvaranje Unicoda

    Širenje Interneta i srodnih tehnologija, kao što je e-pošta, dovelo je do činjenice da je tekstualna poruka na kraju prestala odgovarati svima. Vodeće tvrtke na tom područjuIT je stvorio Unicode konzorcij (Unicode Consortium), tablicu simbola koju je uvela 1991. pod imenom UTF-32, koja je dopuštala pohranu više od milijardu jedinstvenih znakova, što je bio najvažniji korak u dešifriranju tekstova.
    Međutim, prva univerzalna tablica kodova znakova Unicode UTF-32 nije bila široko distribuirana. Glavni razlog bio je višak pohranjenih podataka. Brzo je izračunato da će za zemlje koje koriste latinicu, kodirane pomoću nove univerzalne proračunske tablice, tekst zauzimati četiri puta više prostora nego korištenje proširene ASCII tablice.

    Unicode razvoj

    Sljedeća tablica znakova UTF-16 Unicode riješila je ovaj problem. Kodiranje je provedeno u pola broja bitova, ali se istovremeno smanjio i broj mogućih kombinacija. Umjesto milijardi znakova, omogućuje vam uštedu samo 65.536, no pokazalo se da je tako uspješan da je taj broj, prema odluci Konzorcija, definiran kao temeljni Unicode prostor za pohranu znakova. Unatoč tom uspjehu, UTF-16 nije svima odgovarao, budući da je količina pohranjenih i prenesenih informacija još uvijek preplavljena dva puta. Univerzalno rješenje je UTF-8 Unicode tablica znakova s ​​promjenjivom duljinom pisanja. To se može nazvati proboj na ovom području.
    Tako, uz uvođenje posljednja dva standarda, tablica znakova Unicode riješila je problem jednog prostora koda za sve trenutno primijenjene fontove.

    Unicode za ruski jezik

    HvalaDuljina promjenjivog koda koja se koristi za prikazivanje simbola, latinica je kodirana u Unicode formatu, baš kao u ASCII-u, to jest, jedan bit. Za druge alfabete slika može izgledati drugačije. Na primjer, znakovi gruzijske abecede koriste se za kodiranje tri bajta, a znakovi ćiriličnog pisma su dva. Sve je to moguće u UTF-8 Unicode standardu (Karta znakova). Ruski jezik ili ćirilično pismo zauzima 448 mjesta u općem prostoru koda, podijeljenom u pet blokova.


    U tih pet blokova nalaze se glavna ćirilična i crkveno-slovenska pisma, kao i dodatna slova drugih jezika koji koriste ćirilično pismo. Broj pozicija je istaknut kako bi se prikazali stari oblici prikazivanja slova ćiriličnog pisma, a 22 mjesta ukupnog iznosa ostaju slobodna.

    Trenutna verzija Unicode-a

    Odlukom o svom prioritetnom zadatku, a to je standardizacija fontova i stvaranje jedinstvenog koda za njih, "Konzorcij" nije prestao s radom. Unicode se stalno razvija i obnavlja. Najnovija stvarna verzija ovog standarda 9.0 objavljena je 2016. godine. Uključio je šest dodatnih abecedi i prošireni popis standardiziranih emotikona.
    Treba napomenuti da se, kako bi se pojednostavilo istraživanje, čak i takozvani mrtvi jezici dodaju Unicodeu. Takvo su ime dobili jer ljudi za koje je bio rođak ne postoje. U ovu skupinu ubrajaju se i jezici koji su do danas ostali samo u obliku pisanih spomenika. uprincip, primijeniti za dodavanje znakova na novu specifikaciju Unicode može bilo tko. Istina, za to će morati ispuniti pristojan iznos izvornih dokumenata i potrošiti puno vremena. Živi primjer toga može biti povijest programera Terencea Edena. Godine 2013. podnio je zahtjev za uključivanje u specifikaciju simbola koji se odnose na gumbe za upravljanje energijom računala. U tehničkoj dokumentaciji, oni su korišteni od sredine 70-ih godina prošlog stoljeća, ali prije specifikacije, 9.0 nije bio dio Unicode-a.

    Tablica znakova

    Na svakom računalu, bez obzira na operativni sustav koji se koristi, tablicu Unicode znakova. Kako koristiti ove proračunske tablice, gdje ih pronaći i što mogu učiniti za običnog korisnika?
    U sustavu Windows tablica simbola nalazi se u odjeljku izbornika "Usluge". U obitelji operacijskih sustava Linux obično se može naći u odjeljku "Standard", au MacOS-u - u postavkama tipkovnice. Glavna svrha ove tablice je unos znakova u tekstualne dokumente koji se ne nalaze na tipkovnici. Primjena takvih tablica može biti široka: od uvođenja tehničkih simbola i ikona nacionalnih monetarnih sustava do pisanja priručnika o praktičnoj primjeni Tarot karata.

    U zaključku

    Unicode se koristi svugdje i ulazi u naše živote zajedno s razvojem Interneta i mobilnih tehnologija. Zbog njegove primjene, sustav međunarodnih komunikacija znatno je pojednostavljen. To možete rećiuvođenje Unicoda je indikativan, ali potpuno nevidljiv primjer uporabe tehnologije za opće dobro cijelog čovječanstva.

    Povezane publikacije