Pre kompetentné používanie ASCII je potrebné rozširovať poznatky v tejto oblasti a o možnostiach kódovania.
Čo to je?
ASCII je kódovacia tabuľka tlačených znakov (pozri snímku obrazovky č. 1) napísaná na klávesnici počítača na prenos informácií a niektorých kódov. Inými slovami, abeceda a desatinné číslice sú zakódované do zodpovedajúcich symbolov, ktoré predstavujú a nesú potrebné informácie.
Kódovanie ASCII bolo vyvinuté v Amerike, takže štandardná tabuľka kódovania zvyčajne obsahuje anglickú abecedu s číslami, spolu asi 128 znakov. Potom však vyvstáva spravodlivá otázka: čo robiť, ak je potrebné kódovanie národnej abecedy?
Na riešenie týchto problémov boli vyvinuté ďalšie verzie tabuľky ASCII. Napríklad v prípade jazykov so štruktúrou cudzieho jazyka boli písmená anglickej abecedy buď odstránené, alebo k nim boli pridané ďalšie znaky vo forme národnej abecedy. Takže v kódovaní ASCII môžu byť ruské písmená pre národné použitie (pozri snímku obrazovky č. 2).
Kde sa používa systém kódovania ASCII?
Tento systém kódovania je potrebný nielen na písanie textových informácií na klávesnici. Používa sa aj v grafike. Napríklad v programe ASCII Art Maker sa grafické obrázky rôznych rozšírení skladajú zo spektra znakov ASCII (pozri snímku obrazovky č. 3).
Spravidla je možné takéto programy rozdeliť na tie, ktoré vykonávajú funkciu grafických editorov, invertujú obrázok na text, a tie, ktoré konvertujú obrázok na grafiku ASCII. Známy emotikon (alebo ako sa tiež nazýva „ usmievavá ľudská tvár") Je tiež príkladom kódovacieho znaku.
Táto metóda kódovania môže byť užitočná aj pri písaní alebo vytváraní dokumentu HTML. Napríklad zadáte špecifickú a potrebnú sadu znakov a pri zobrazení samotnej stránky sa na obrazovke zobrazí znak zodpovedajúci tomuto kódu.
Okrem iného je tento typ kódovania nevyhnutný pri vytváraní viacjazyčnej stránky, pretože znaky, ktoré nie sú zahrnuté v tej či onej národnej tabuľke, bude potrebné nahradiť ASCII kódmi. Ak má čitateľ priamy vzťah k informačným a komunikačným technológiám (IKT), bude pre neho užitočné oboznámiť sa s takými systémami, ako sú:
- Prenosná znaková sada;
- riadiace znaky;
- EBCDIC;
- VISCII;
- YUSCII;
- Unicode;
- umenie ASCII;
- KOI-8.
Vlastnosti tabuľky ASCII
Ako každý systematizovaný program, aj ASCII má svoje charakteristické vlastnosti. Napríklad desiatková číselná sústava (číslice od 0 do 9) sa prevedie na dvojkovú číselnú sústavu (t. j. každá desiatková číslica sa prevedie na binárne 288 = 1001000).
Písmená umiestnené v hornom a dolnom stĺpci sa od seba líšia len o kúsok, čo výrazne znižuje náročnosť kontroly a úpravy malých a veľkých písmen.
So všetkými týmito vlastnosťami funguje kódovanie ASCII ako osembitové, hoci pôvodne sa predpokladalo ako sedembitové.
Aplikácia ASCII v programoch balíka Microsoft Office:
V prípade potreby je možné túto možnosť kódovania informácií použiť v programe Microsoft Notepad a Microsoft Office Word. V rámci týchto aplikácií je možné dokument uložiť vo formáte ASCII, v tomto prípade však nebude možné pri písaní využívať niektoré funkcie.
Najmä výber tučným a tučným písmom bude nedostupný, pretože kódovanie zachováva iba význam zadaných informácií, nie všeobecný vzhľad a formu. Takéto kódy môžete do dokumentu pridať pomocou nasledujúcich softvérových aplikácií:
- Microsoft Excel;
- Microsoft FrontPage;
- Microsoft InfoPath
- Microsoft OneNote
- Microsoft Outlook;
- Microsoft PowerPoint;
- Microsoft Project.
Treba mať na pamäti, že pri písaní ASCII kódu v týchto aplikáciách musíte podržať kláves ALT na klávesnici.
Všetky potrebné kódy si samozrejme vyžadujú dlhšie a podrobnejšie štúdium, ale to už je nad rámec nášho dnešného článku. Dúfam, že to považujete za užitočné.
Dobudúcna!
Dobrý zlý
Prekryvné symboly
Znak BS (backspace) umožňuje tlačiarni prepísať jeden znak. V ASCII bolo poskytnuté pridávanie diakritiky k písmenám týmto spôsobom, napríklad:
- a BS "→ á
- a BS `→ à
- a BS ^ → â
- o BS / → ø
- c BS, → ç
- n BS ~ → ñ
Poznámka: v starých typoch písma bol apostrof „nakreslený šikmo doľava a vlnovka ~ bola posunutá nahor, takže presne zodpovedali úlohe akútnej a vlnovky navrchu.
Ak je rovnaký symbol prekrytý znakom, dosiahne sa efekt tučného písma a ak sa znak prekryje podčiarknutím, získa sa podčiarknutý text.
- a BS a → a
- a BS _ → a
Poznámka: toto sa používa napríklad v systéme pomoci mužovi.
Národné varianty ASCII
Norma ISO 646 (ECMA-6) poskytuje možnosť umiestniť národné znaky na miesto @ [ \ ] ^ ` { | } ~ ... Okrem toho na mieste # sa dá ubytovať £ a na mieste $ - ¤ ... Tento systém je vhodný pre európske jazyky, kde je potrebných len niekoľko znakov navyše. Verzia ASCII bez národných znakov sa nazýva US-ASCII alebo „medzinárodná referenčná verzia“.
Následne sa ukázalo ako pohodlnejšie použiť 8-bitové kódovania (kódové stránky), kde spodnú polovicu kódovej tabuľky (0-127) zaberajú znaky US-ASCII a hornú polovicu (128-255) je obsadené ďalšími znakmi vrátane súboru národných znakov. Horná polovica tabuľky ASCII sa teda pred rozšíreným prijatím Unicode aktívne používala na reprezentáciu lokalizovaných znakov, písmen miestneho jazyka. Neexistencia jednotného štandardu pre umiestňovanie znakov azbuky do ASCII tabuľky spôsobila mnohé problémy s kódovaním (KOI-8, Windows-1251 a iné). Iné jazyky s iným ako latinským písmom tiež trpeli prítomnosťou niekoľkých rôznych kódovaní.
.0 | .1 | .2 | .3 | .4 | .5 | .6 | .7 | .8 | .9 | .A | .B | .C | .D | .E | .F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0. | NUL | SOM | EOA | EOM | EQT | WRU | RU | BELL | BKSP | Ht | LF | VT | FF | ČR | SO | SI |
1. | DC 0 | DC 1 | DC 2 | DC 3 | DC 4 | ERR | SYNC | LEM | S 0 | S 1 | S 2 | S 3 | S 4 | S 5 | S 6 | S 7 |
2. | ||||||||||||||||
3. | ||||||||||||||||
4. | PRÁZDNÝ | ! | " | # | $ | % | & | " | ( | ) | * | + | , | - | . | / |
5. | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
6. | ||||||||||||||||
7. | ||||||||||||||||
8. | ||||||||||||||||
9. | ||||||||||||||||
A. | @ | A | B | C | D | E | F | G | H | ja | J | K | L | M | N | O |
B. | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ← | |
C. | ||||||||||||||||
D. | ||||||||||||||||
E. | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | |
F. | p | q | r | s | t | u | v | w | X | r | z | ESC | DEL |
Na tých počítačoch, kde minimálna adresovateľná jednotka pamäte bola 36-bitové slovo, sa pôvodne používali 6-bitové znaky (1 slovo = 6 znakov). Po prechode na ASCII na takýchto počítačoch začali do jedného slova umiestňovať buď 5 sedembitových znakov (1 bit zostal nadbytočný), alebo 4 deväťbitové znaky.
ASCII kódy sa tiež používajú na identifikáciu stlačeného klávesu počas programovania. Pre štandardnú QWERTY klávesnicu vyzerá tabuľka kódov takto:
Počítač rozumie procesu svojej transformácie do formy, ktorá umožňuje organizovať pohodlnejší prenos, ukladanie alebo automatické spracovanie týchto údajov. Na tento účel sa používajú rôzne tabuľky. Kódovanie ASCII je prvý systém vyvinutý v Spojených štátoch na prácu s textom v anglickom jazyku, ktorý sa následne rozšíril po celom svete. Nasledujúci článok je venovaný jeho popisu, vlastnostiam, vlastnostiam a ďalšiemu použitiu. Zobrazenie a ukladanie informácií v počítačiSymboly na monitore počítača alebo ten či onen mobilný digitálny prístroj sú tvorené na základe súborov vektorových foriem všetkých druhov znakov a kódu, ktorý vám umožňuje nájsť medzi nimi symbol, ktorý je potrebné vložiť na správne miesto. Je to séria bitov. Každý znak teda musí jednoznačne zodpovedať množine núl a jednotiek, ktoré stoja v špecifickom, jedinečnom poradí. Ako to všetko začaloHistoricky prvé počítače boli v angličtine. Na zakódovanie symbolickej informácie v nich stačilo použiť iba 7 bitov pamäte, pričom na tento účel bol pridelený 1 bajt, pozostávajúci z 8 bitov. Počet znakov, ktorým počítač rozumel, sa v tomto prípade rovnal 128. Počet takýchto znakov zahŕňal anglickú abecedu s jej interpunkčnými znamienkami, číslami a niektorými špeciálnymi znakmi. Sedembitové kódovanie v anglickom jazyku s príslušnou tabuľkou (kódovou stránkou), vyvinuté v roku 1963, dostalo názov American Standard Code for Information Interchange. Zvyčajne sa na jeho označenie používala skratka „ASCII encoding“ a používa sa dodnes. Prechod k viacjazyčnostiPostupom času sa počítače začali vo veľkej miere používať aj v neanglicky hovoriacich krajinách. V tejto súvislosti vznikla potreba kódovania, ktoré by umožňovalo používanie národných jazykov. Bolo rozhodnuté znovu nevynájsť koleso a ako základ použiť ASCII. Tabuľka kódovania v novom vydaní sa výrazne rozšírila. Použitie 8. bitu umožnilo preložiť do počítačového jazyka 256 znakov. PopisKódovanie ASCII má tabuľku, ktorá je rozdelená na 2 časti. Len prvá polovica sa považuje za všeobecne uznávaný medzinárodný štandard. Obsahuje:
Niektoré vlastnostiK zvláštnostiam kódovania ASCII patrí rozdiel medzi písmenami „A“ – „Z“ malých a veľkých písmen len o jeden bit. Táto okolnosť značne zjednodušuje prevod registra, ako aj jeho kontrolu príslušnosti k určenému rozsahu hodnôt. Okrem toho sú všetky písmená v systéme kódovania ASCII reprezentované vlastnými poradovými číslami v abecede, ktoré sú zapísané 5 číslicami v binárnom zápise, pred ktorými sú 011 2 pre malé písmená a 010 2 pre veľké písmená. Medzi vlastnosti kódovania ASCII možno považovať zobrazenie 10 číslic - "0" - "9". V druhom číselnom systéme začínajú 00112 a končia 2 číslami. Napríklad 0101 2 je ekvivalentné desiatkovej päťke, takže znak „5“ sa zapíše ako 0011 01012. Na základe toho môžete jednoducho previesť BCD na reťazec ASCII pridaním 00112 ku každému kúsku naľavo. "Unicode"Ako viete, na zobrazenie textov v jazykoch skupiny juhovýchodnej Ázie sú potrebné tisíce znakov. Takýto počet z nich nie je v žiadnom prípade opísaný v jednom byte informácií, takže ani rozšírené verzie ASCII už nedokázali uspokojiť zvýšené potreby používateľov z rôznych krajín. Vznikla tak potreba vytvoriť univerzálne kódovanie textu, ktoré vyvinulo konzorcium Unicode v spolupráci s mnohými lídrami globálneho IT priemyslu. Jeho špecialisti vytvorili systém UTF 32. V ňom bolo na kódovanie 1 znaku alokovaných 32 bitov, ktoré tvorili 4 bajty informácie. Hlavnou nevýhodou bolo prudké zvýšenie množstva potrebnej pamäte až o 4-násobok, čo prinieslo veľa problémov. Zároveň pre väčšinu krajín s úradnými jazykmi patriacimi do indoeurópskej skupiny je počet znakov rovný 2 32 viac ako nadbytočný. V dôsledku ďalšej práce špecialistov z konzorcia Unicode sa objavilo kódovanie UTF-16. Stal sa možnosťou transformácie symbolických informácií, ktorá vyhovovala každému tak z hľadiska množstva potrebnej pamäte, ako aj počtu kódovaných znakov. To je dôvod, prečo bol štandardne akceptovaný UTF-16 a vyžaduje, aby boli pre jeden znak vyhradené 2 bajty. Aj táto pomerne pokročilá a úspešná verzia „Unicode“ mala určité nevýhody a po prechode z rozšírenej verzie ASCII na UTF-16 zdvojnásobila váhu dokumentu. V tejto súvislosti sa rozhodlo použiť kódovanie s premennou dĺžkou UTF-8. V tomto prípade je každý znak zdrojového textu zakódovaný sekvenciou s dĺžkou 1 až 6 bajtov. Vzťah s americkým štandardným kódom pre výmenu informáciíVšetky znaky latinskej abecedy v UTF-8 s premenlivou dĺžkou sú kódované v 1 bajte, ako v systéme kódovania ASCII. Zvláštnosťou UTP-8 je, že v prípade textu v latinke bez použitia iných znakov vám ho stále umožnia prečítať aj programy, ktoré nerozumejú „Unicode“. Inými slovami, základná časť kódovania textu ASCII je jednoducho zlúčená do nového UTF s premenlivou dĺžkou. Cyrilické znaky v UTP-8 zaberajú 2 bajty a napríklad gruzínske - 3 bajty. Vytvorenie UTF-16 a 8 vyriešilo hlavný problém vytvorenia jednotného kódového priestoru vo fontoch. Odvtedy môžu výrobcovia písiem vyplniť tabuľku len vektorovými formami textových znakov podľa svojich potrieb. V rôznych operačných systémoch sú preferované rôzne kódovania. Aby bolo možné čítať a upravovať texty napísané v inom kódovaní, používajú sa programy na konverziu ruského textu. Niektoré textové editory obsahujú vstavané transkodéry a umožňujú vám čítať text bez ohľadu na kódovanie. Teraz viete, koľko znakov je v ASCII a ako a prečo bol vyvinutý. Samozrejme, dnes je najrozšírenejším štandardom na svete „Unicode“. Netreba však zabúdať, že bol vytvorený na báze ASCII, preto treba oceniť prínos jeho vývojárov do oblasti IT. Ako viete, počítač ukladá informácie v binárnej forme a predstavuje ich ako postupnosť jednotiek a núl. Aby sa informácie previedli do formy, ktorá je vhodná pre ľudské vnímanie, každá jedinečná sekvencia čísel sa pri zobrazení nahradí zodpovedajúcim symbolom. Jedným zo systémov na koreláciu binárnych kódov s tlačiteľnými a riadiacimi znakmi je Pri súčasnej úrovni rozvoja výpočtovej techniky sa od používateľa nevyžaduje poznať kód každého špecifického symbolu. Všeobecné pochopenie toho, ako sa kódovanie vykonáva, je však mimoriadne užitočné a pre niektoré kategórie špecialistov dokonca nevyhnutné. vytváranie ASCIIVo svojej pôvodnej podobe bolo kódovanie vyvinuté v roku 1963 a potom dvakrát aktualizované v priebehu 25 rokov. V pôvodnej verzii ASCII znaková tabuľka obsahovala 128 znakov, neskôr sa objavila rozšírená verzia, kde bolo uložených prvých 128 znakov a dovtedy chýbajúce znaky boli priradené kódom so zapojeným ôsmym bitom. Po mnoho rokov je toto kódovanie najpopulárnejšie na svete. V roku 2006 zaujal vedúcu pozíciu Latin 1252 a od konca roku 2007 až do súčasnosti si vedúcu pozíciu pevne drží Unicode. Počítačová reprezentácia ASCIIKaždý znak ASCII má svoj vlastný kód pozostávajúci z 8 znakov, ktoré predstavujú nulu alebo jednotku. Minimálne číslo v takejto reprezentácii je nula (osem núl v dvojkovej sústave), čo je kód prvého prvku v tabuľke. Dva kódy v tabuľke boli vyhradené na prepínanie medzi štandardným US-ASCII a jeho národnou verziou. Po tom, čo ASCII začalo obsahovať nie 128, ale 256 znakov, sa rozšíril variant kódovania, v ktorom bola pôvodná verzia tabuľky uložená v prvých 128 kódoch s nulovým 8. bitom. Znaky národného písma sa držali v hornej polovici tabuľky (pozície 128-255). Používateľ nemusí poznať kódy znakov ASCII priamo. Zvyčajne stačí, aby vývojár softvéru poznal číslo prvku v tabuľke, aby v prípade potreby vypočítal jeho kód pomocou binárneho systému. ruský jazykPo vývoji kódovania pre škandinávske jazyky, čínštinu, kórejčinu, gréčtinu atď. na začiatku 70. rokov začal svoju vlastnú verziu vytvárať aj Sovietsky zväz. Čoskoro bola vyvinutá verzia 8-bitového kódovania s názvom KOI8, ktorá zachováva prvých 128 kódov znakov ASCII a prideľuje rovnaký počet pozícií pre písmená národnej abecedy a ďalšie znaky. Pred zavedením Unicode dominoval KOI8 v ruskom segmente internetu. K dispozícii boli možnosti kódovania pre ruskú aj ukrajinskú abecedu. Problémy ASCIIKeďže počet prvkov ani v rozšírenej tabuľke nepresahoval 256, nebolo možné umiestniť niekoľko rôznych skriptov do jedného kódovania. V 90. rokoch sa v Runete objavil problém „crocozyabr“, keď sa texty napísané v ruských znakoch ASCII zobrazovali nesprávne. Problém bol v tom, že kódy rôznych ASCII variantov sa navzájom nezhodovali. Pripomeňme, že pozície 128-255 môžu obsahovať rôzne znaky a pri zmene jedného kódovania cyriliky na iné boli všetky písmená textu nahradené inými, ktoré mali v inej verzii kódovania rovnaké číslo. Aktuálny stavS príchodom Unicode popularita ASCII prudko klesla. Dôvodom je skutočnosť, že nové kódovanie umožnilo prispôsobiť znaky takmer všetkých písaných jazykov. V tomto prípade prvých 128 znakov ASCII zodpovedá rovnakým znakom v Unicode. V roku 2000 bolo ASCII najpopulárnejším kódovaním na internete a používalo sa na 60 % webových stránok indexovaných spoločnosťou Google. Do roku 2012 podiel takýchto stránok klesol na 17 % a Unicode (UTF-8) zaujalo miesto najobľúbenejšieho kódovania. ASCII je teda dôležitou súčasťou histórie informačných technológií, no jej využitie v budúcnosti sa javí ako neperspektívne.
Tabuľka kódov znakov ASCII systému Windows. Treba poznamenať, že spočiatku sa riadiace znaky ASCII tabuľky používali na zabezpečenie výmeny údajov pomocou teletypu, zadávanie údajov z diernej pásky a na najjednoduchšie ovládanie externých zariadení. |
kód | Popis |
---|---|
NUL, 00 | Nulová, prázdna |
SOH, 01 | Začiatok kurzu, začiatok kurzu |
STX, 02 | Začiatok TeXtu, začiatok textu. |
ETX, 03 | Koniec TeXtu, koniec textu |
EOT, 04 | Koniec prenosu, koniec prenosu |
ENQ, 05 | Opýtajte sa. Prosím o potvrdenie |
ACK, 06 | Poďakovanie. Potvrdzujem |
BEL, 07 | Zvonček, zvonček |
BS, 08 | Backspace, návrat o jeden znak späť |
TAB, 09 | Karta, horizontálna karta |
LF, 0A | Line Feed, line feed. Teraz sa vo väčšine programovacích jazykov označuje ako \ n |
VT, 0B | Vertikálna karta, vertikálna karta. |
FF, 0C | Informačný kanál formulára, kanál stránky, nová stránka |
ČR, 0D | Vrátenie vozíka Teraz sa vo väčšine programovacích jazykov označuje ako \ r |
TAK, 0E | Shift Out, zmeňte farbu atramentovej pásky v tlačovom zariadení |
SI, 0F | Shift In, vráťte farbu atramentovej pásky v tlačovom zariadení späť |
DLE, 10 | Data Link Escape, prepnite kanál na prenos dát |
DC1, 11 DC2, 12 DC3, 13 DC4, 14 | Device Control, symboly ovládania zariadenia |
NAK, 15 | Negatívne potvrdenie, neuznávam. |
SYN, 16 | Synchronizácia. Symbol synchronizácie |
ETB, 17 | Koniec textového bloku, koniec textového bloku |
CAN, 18 | Zrušiť, zrušenie predtým prejdenej |
EM, 19 | Koniec média, koniec dátového nosiča |
SUB, 1A | Náhradník Umiestnené namiesto postavy, ktorej hodnota sa počas prenosu stratila alebo poškodila |
ESC, 1B | Escape Escape sekvencia |
FS, 1C | Oddeľovač súborov, oddeľovač súborov |
GS, 1D | Oddeľovač skupín, oddeľovač skupín |
RS, 1E | Oddeľovač záznamov, oddeľovač záznamov |
USA, 1F | Oddeľovač jednotiek, oddeľovač jednotiek |
DEL, 7F | Vymazať, vymazať posledný znak. |
Hodnota avatarov v psychológii
Hodnota avatarov v psychológii
Ako zdôrazniť písmeno v MS Word
Čo to znamená, ak je avatar osoby
Ako si vytvoriť svoj vlastný Twitter moment