Što je snaga abecede

Pismo abecede u računalnoj znanosti naziva se sustavom znakova, preko kojeg možete poslati informativnu poruku. Da bismo razumjeli suštinu ove definicije, dajemo nekoliko dodatnih teorijskih činjenica:

  • Sve poruke sastoje se od abecede. Na primjer, ovaj članak je poruka. Tada se sastoji od znakova n alfabeta.
  • Pod simbolom možemo razumjeti najmanje značajan dio abecede. Također, nedjeljive čestice nazivaju se atomi. Simboli u ruskoj abecedi su "a", "b", "in" i tako dalje.
  • U teoriji abeceda ne mora nužno biti više kodirana. Na primjer, u tiskanoj knjizi, znakovi u abecedi znače sami, što znači da nemaju nikakvo kodiranje.
  • Ali u praksi imamo sljedeće: računalo ne razumije što su slova. Stoga, za prijenos informativne poruke, prvo se mora kodirati na jeziku koji je razumljiv računalu. Da biste nastavili dalje, morate unijeti dodatne uvjete.

    Što je snaga abecede

    Pod snagom abecede, podrazumijevamo ukupan broj znakova u njoj. Da biste saznali koja je snaga abecede, trebate samo brojiti broj znakova u njoj. Razumimo. Za rusku abecedu, snaga abecede je 33 ili 32 znaka ako ne koristite "e". Pretpostavimo da su svi simboli u našoj abecedi jednako vjerojatni. Ta se pretpostavka može shvatiti kao: pretpostavimo da imamo torbu s potpisanimkocke. Broj kocki u njemu je beskonačan, a svaki je potpisan samo s jednim znakom. Zatim, s ravnomjernom raspodjelom, bez obzira koliko dobivamo kockice iz vrećice, broj kocki s različitim simbolima bit će isti ili će to nastojati s porastom broja kocki koje dobivamo iz vrećice.

    Procjena težine informativnih poruka

    Prije gotovo stotinu godina, američki inženjer Ralph Hartley izveo je formulu po kojoj možete procijeniti količinu informacija u poruci. Njegova formula radi za probabilističke događaje i izgleda ovako: i = log 2 M Gdje je - broj nedjeljivih informacijskih atoma (bitova) u poruci, "M" - snaga abecede. Idemo dalje. Pomoću matematičkih transformacija možemo utvrditi da se snaga abecede može izračunati na sljedeći način:

    M = 2 i Ova formula općenito definira odnos između broja jednako vjerojatnih događaja "M" i količine informacija "i".

    Izračunavamo snagu

    Najvjerojatnije već znate iz školskog kolegija informatike da se u modernim računalnim sustavima izgrađenim na von Neumannovoj arhitekturi koristi binarni sustav kodiranja. Kodira i aplikacije i podatke. Kako bi se prikazao tekst u računalnom sustavu, koristite jedinstveni kod od osam znamenki. Smatra se da jedinstveni kod sadrži fiksni skup elemenata - 0 i 1. Vrijednosti u takvom kodu su određene određenim redoslijedom tih elemenata. Kod osmobitnog koda možemo kodirati poruke od 256 bita, prema formuliHartley: M 8 = 2 8 = 256 bita informacija. Takva situacija s binarnim kodom za kodiranje znakova povijesno je formirana. Ali teoretski bismo mogli koristiti druge alfabete za prikaz podataka. Na primjer, u abecedi od četiri znaka svaki znak ima težinu ne jednu, već dva bita, u osam znamenki - 3 bita, i tako dalje. To se izračunava pomoću binarnog logaritma danog gore (i = log 2 M).
    Budući da je u abecedi od 256 bita dodijeljeno osam binarnih znamenki koje označavaju jedan znak, odlučeno je da se unese dodatna mjera informacija - bajt. Jedan bajt sadrži jedan znak tablice ASCII koda i sadrži osam bitova.

    Kako se mjere informacije

    Osam stotina tekstualnih kodiranja koje se koriste u ASCII tablici kodova omogućuju vam da sadržavate osnovni skup latinične i ćirilične abecede u gornjem i donjem slučaju, brojevima, znakovima interpunkcije i drugim osnovnim simbolima. Kako bi se izmjerili veliki volumeni podataka, koristiti posebne prefikse za riječi bajtova i bita. Takve su konzole navedene u sljedećoj tablici:
    Mnogi ljudi koji su proučavali fiziku poriču da bi bilo racionalno koristiti klasične suglasnike za označavanje informacijskih jedinica (kao što su kilo i mega), ali u stvarnosti to nije posve točno, budući da ovi prefiksi za vrijednosti označavaju množenje jednog ili drugog. stupanj broja deset, kada se u računalnoj znanosti posvuda koristi binarni sustav mjerenja.

    Točni nazivi jedinica mjerenja podataka

    Kako bi se ukloniliU ožujku 1999. Međunarodna komisija za elektrotehniku ​​odobrila je nove jedinice za jedinice koje se koriste za određivanje količine informacija u elektroničkom računalstvu. Takvi prefiksi su "mebia", "kibi", "gibi", "tebi", "eksby", "pety". Dok se ove jedinice još ne ostvare, vrlo je vjerojatno da je potrebno vrijeme za provedbu ovog standarda i njegovo širenje. Kako napraviti prijelaz s klasičnih jedinica na novo odobrene, možete definirati u sljedećoj tablici:

    Pretpostavimo da imamo tekst koji sadrži K znakova. Zatim, koristeći abecedni pristup, možete izračunati količinu informacija koje sadrži V. Bit će jednaka snazi ​​proizvoda abecede prema težini informacija jednog znaka u njoj. Prema Hartleyjevoj formuli, znamo izračunati količinu informacija kroz binarni logaritam. Uz pretpostavku da je broj znakova u abecedi N, a broj znakova u zapisu informacija o poruci je K, dobivamo sljedeću formulu za izračunavanje volumena poruke: V = K? abecedni pristup pokazuje da će volumen informacija ovisiti samo o kapacitetu abecede i veličini poruka (tj. broju znakova u njoj), ali neće biti vezan za semantički sadržaj za osobu.

    Primjeri izračuna snage

    Razredi informatike često daju zadatak pronalaženju moći abecede, dužine poruke ili količine informacija. Ovdje je jedan od sljedećih zadataka:"Tekstovna datoteka zauzima 11 Kbyta prostora na disku i sadrži 11264 znakova. Odredite snagu abecede ove tekstualne datoteke." Što će biti rješenje može se vidjeti na slici ispod.
    Tako abeceda s kapacitetom od 256 znakova nosi samo 8 bitova informacija, što se u računalnoj znanosti naziva jedan bajt. Bajt opisuje 1 znak ASCII tablice, koja, ako mislite, nije mnogo.

    Jedan bajt - je li to puno ili nije?

    Primjeri suvremenih podatkovnih skladišta Google i podatkovni centri na Facebooku sadrže ne manje od desetaka petabajta informacija. Točna količina podataka, međutim, bit će teško izračunati čak i za sebe, jer tada ćete morati zaustaviti sve procese na poslužiteljima i zatvoriti korisnike za pristup snimanju i uređivanju njihovih osobnih podataka.
    Ali da bi se zamislili takvi nezamislivi volumeni podataka, mora se jasno shvatiti da se sve sastoji od malih detalja. Potrebno je razumjeti zašto je snaga abecede jednaka (256) i koliko bitova sadrži 1 bajt informacija (kao što se sjećate, 8).

    Povezane publikacije