Kódovanie metaznačiek utf 8. Zmeňte kódovanie stránky. .Htaccess kódovanie - AddDefaultCharset

  • 06.04.2019

Prvý vážny problém, s ktorým sa väčšina začiatočníkov stretáva, je spojená so súborom postáv (angl. znaková sada). Tento problém s kódovaním je vyjadrený v takzvanom „krakozyabriki“, ktorý dostávame namiesto znakov uvedených v súbore HTML. V tomto článku sa chcem podrobnejšie venovať problému s kódovaním, pokúsiť sa dať všetko na police a dať riešenia.

  • Čo je kódovanie?
  • Kódovanie súborov (upraviť v programe Poznámkový blok ++)
  • Kódovanie displeja (zobraziť v prehliadači)
  • Ako určím kódovanie stránky HTML? (metaznačka charset)
  • Stále máte problém s kódovaním? (hlavičková sada v php)

Čo je kódovanie?

Relatívne povedané, každý symbol (znak) sa skladá z kód a snímky... Tu kód je jedinečný identifikátor znaku v znakovej sade, ktorý je určený vybraným znakom kódovaniea obrázok je vizuálne znázornenie symbolu, ktorý je obsiahnutý v súbor písma v bunke zodpovedajúcej kódu znaku.

Inými slovami, kódovanie (angl. znaková sada) je súbor vzťahov kódy znakov z ich vizuálne znázornenie písmom.

Kódovanie súborov

Stránka HTML je normálna textový súborktorých kódovanie sa vyberie pri vytváraní a / alebo ukladaní na úložné zariadenie (hDD, flash disk atď.).

V prípade Notepad ++ sa kódovanie nového dokumentu nastavuje v nastaveniach textový editor... Vyberte si z ponuky: Možnosti\u003e Nastavenia ... - a choďte na nový dokument „. Tu nás zaujíma sekcia „ Kódovanie„. Predvolene je vybraté kódovanie ANSI.

Pripomínam, že toto je kódovanie, v ktorom bude uložený súbor HTML.

Vždy však môžete previesť kódovanie Stránky HTML pomocou vhodných funkcií textového editora. Napríklad v programe Poznámkový blok ++ to urobíte kliknutím na položku ponuky „ Kódovania»A vyberte požadovanú transformáciu.

IN v tomto prípade súbor bol zakódovaný ANSI a konvertoval som to na UTF-8 (bez kusovníka). O tom, čo je tento kusovník, si môžete prečítať v mojom článku: PHP: ako odstrániť kusovník v WordPress - podľa pokynov v.

Kódovanie displeja

Je dôležité zdieľať kódovanie súborov a kódovanie displeja... Bez ohľadu na to, v akom kódovaní je súbor uložený, môže byť zobrazený v akomkoľvek inom kódovaní. To je jeden z dôvodov problémov s kódovaním.

Napríklad ak ste uložili stránku HTML s kódovaním ANSI a otvorte ho v prehliadači, namiesto ruských symbolov môžete získať takzvaný „krakozyabriki“.

V takom prípade si musíme byť istí, že kódovanie súborov sa zhoduje s kódovanie displeja súbor v prehliadači. Urobíte to tak, že vo Firefoxe kliknete na ikonu ponuky a potom na položku „ Kódovanie„. Ak žiaden nemáte, kliknite na položku „ Upraviť„A pridať prvok“ Kódovanie„v ponuke.

Ako vidíte, prehliadač zobrazí súbor kódovaný ako „ Unicode» (napr. UTF-8) , pričom súbor bol uložený v kódovaní ANSI (napr. Windows-1251) ... Výberom požadovaného kódovania dosiahneme požadovaný výsledok.

V prípade programu Poznámkový blok ++ je tiež možné zvoliť kódovanie displeja. Kliknite na položku ponuky „ Kódovania", a potom požadovaná možnosť slúži na zobrazenie kódovania.

V tomto prípade som zmenil kódovanie displeja ANSI na UTF-8 (bez kusovníka).

Ako určím kódovanie stránky HTML?

A tak sme už prišli na to, čo je kódovanie a aký je rozdiel medzi kódovaním súborov a kódovaním displeja. Teraz musíme vyriešiť problém s kódovaním, ktoré je nesprávna interpretácia prehliadač (alebo akýkoľvek iný klient) Kódovanie stránky HTML.

Prečo sú problémy s kódovaním? Nie je ľahké určiť kódovanie stránky HTML a často to nie je možné. rovnaký prehliadač nemá o ňom informácie alebo je uvedený nesprávne.

Na označenie kódovania stránky HTML sa používa špeciálna metaznačka. V HTML5 to vyzerá takto:

V takom prípade je uvedené kódovanie UTF-8 (Unicode).

V starších verziách HTML vyzerá táto metaznačka takto:

Táto metaznačka vytvára hlavičku Content-Type HTTP, ktorá určuje typ dokumentu text / html a jeho kódovanie Windows-1251 (ANSI).

Osobne odporúčam využiť túto možnosť, pretože s ním bude najmenší problém. Hlavná vec je, že takáto metaznačka je prítomná v sekcii HEAD a kódovanie v nej uvedené zodpovedá kódovaniu súborov. Vo väčšine prípadov to bude postačujúce.

Stále máte problém s kódovaním?

V niektorých prípadoch nebude stačiť zadanie metaznačky kódovanej HTML. Tento problém môže byť spôsobený nastaveniami samotného servera, ktorý obsahuje súbor stránky HTML. Faktom je, že server je schopný vydávať tvoj Hlavička HTTP Content-Type, ktorá bude mať relatívne povedané prednosť pred metaznačkou.

V takom prípade je možné tento problém vyriešiť vykonaním zmien v nastaveniach servera. Nebudem zachádzať do podrobností táto záležitosť a iba by som odporučil vypnúť toto všetko prekódovanie prostredníctvom súboru .htaccess, napr .:

CharsetDisable Off

Môžete tiež vykonať zmeny v hlavičke HTTP typu obsahu a softvérom... V rovnakom PHP sa na to používa funkcia header (), napríklad:

hlavička ("Content-Type: text / html; charset \u003d UTF-8");

Upozorňujeme vás na skutočnosť, že špecifikácia hlavičiek HTTP musí byť povinná predtým zobrazovanie niektorých informácií na obrazovke, inak sa zobrazí chybové hlásenie.

Kódovanie dokumentu HTML sa nastavuje v textovom editore. Napríklad

Program Windows Poznámkový blok predvolene ukladá textové súbory v kódovaní Windows-1251.

Aby mohol prehliadač správne zobraziť stránku HTML, musíte

nastavte správne kódovanie v špeciálnej značke .

Pokiaľ nie je zadané žiadne kódovanie, prehliadač sa ho pokúsi „uhádnuť“, ale nie

vždy sa to končí úspechom. Užívateľ si môže zvoliť kódovanie

nezávisle v ponuke prehliadača (v prehliadačoch Internet Explorer a Mozilla Firefox: Zobraziť → Kódovanie). Pri vývoji webových stránok by sa malo zabrániť problémom s kódovaním. väčšina používateľov okamžite opustí stránku, keď na obrazovke uvidí nečitateľnú sadu písmen.

Špeciálne znaky v html

HTML poskytuje mechanizmus na vkladanie akýchkoľvek znakov Unicode do dokumentu - substitúcií alebo entít. Striedanie dovoľuje

používajte znaky, ktoré nie sú na klávesnici alebo dokonca v použitom kódovaní (t.j. aj pomocou kódovania Windows-1251 môžete vložiť písmeno gréckej abecedy). Suplovanie sa začína znakom „ampersand“ a je napísané ako DDDD; kde DDDD je desatinný kód znaku Unicode. Môžete tiež napísať kód v hexadecimálnom formáte vo forme HHHH; Niektoré symboly majú špeciálne názvy - mnemotechnické pomôcky. Napríklad značka autorských práv © môže byť určená kódom © alebo © alebo mnemotechnickou značkou ©.

Základy CSS

CSS (Cascading Style Sheets, vyslovuje sa „c-es-es“) je technológia na kontrolu vzhľadu prvkov (značiek) webovej stránky. CSS poskytuje oveľa viac možností štýlov stránok ako HTML. Napríklad pomocou štýlov CSS môžete odstrániť podčiarknutie z odkazov, vytvoriť tabuľku s bodkovanými okrajmi alebo dokonca zmeniť kurzor myši. V súčasnosti CSS používajú takmer všetky weby v sieti WWW.

Syntax CSS

Poďme sa pozrieť na syntax CSS. Štýly určujú množinu pravidiel zobrazovania v pároch „vlastnosť - hodnota“ a na aké prvky sa vzťahujú (selektor):

Selektor

vlastnosť1: hodnota1;

vlastnosť2: hodnota2;

vlastnosť3: hodnota3 hodnota4;

Pravidlá sú napísané vo vnútri zložených zátvoriek a sú navzájom oddelené bodkočiarkami. Medzi vlastnosti a ich hodnoty je vložený dvojbodka.

CSS rovnako ako HTML ignoruje medzery. Komentáre môžete pridať ich uzavretím medzi / * a * /.

Selektory

Selektor určuje, ktoré prvky (značky) stránky použijú pravidlá určené dvojicami hodnota-hodnota.

Ako selektor môžete použiť:

    Názov značky - potom sa štýl použije na všetky takéto značky.

Príklad:

A (veľkosť písma: 12 bodov; dekorácia textu: žiadna)

TABUĽKA (orámovanie: čierna plná 1px)

Prvý riadok tohto CSS nastavuje všetky odkazy na 12. veľkosť písma a odstraňuje podčiarknutie. Druhý riadok označuje, že všetky tabuľky budú mať čierne ohraničenie, plné a široké 1 pixel.

    Viac značiek oddelených čiarkami - potom sa štýl použije na všetky uvedené značky.

Príklad:

H1, H2, H3, H4, H5, H6 (farba: červená) / * všetky nadpisy označte červenou farbou * /

    Niekoľko značiek oddelených medzerou:

TABUĽKA A (veľkosť písma: 120%)

Pravidlo platí pre všetky značky A vnorené do značky TABLE. Veľkosť písma sa od základnej zvýši o 20%.

    ID položky... V štýloch je za znakom # označený jedinečný identifikátor - pravidlá sa použijú na značku s atribútom id \u003d "identifier". Príklad:

#supersize (veľkosť písma: 200%)

Adresár

HTML a CSS

Do dokumentu nemôžete pridať viac prvkov s rovnakým ID!

    Symbol * - pravidlá sa budú vzťahovať na všetky prvky dokumentu.

    Triedy

Triedy

Často je potrebné, aby sa štýl aplikoval nie na všetky značky na stránke, ale iba na niektoré prvky (napríklad nie na všetky odkazy na stránke, ale iba na tie, ktoré sa nachádzajú v ponuke stránok). Na to sa používajú triedy: TAG.class_name (...)

Pravidlá špecifikované po takomto selektore sa budú vzťahovať iba na značky s atribútom class \u003d "class_name": <ТЕГ class="имя_класса"> …

Názov značky môžete vynechať, potom sa pravidlá uplatnia na všetky značky s vhodnou hodnotou atribútu triedy.

Uvažujme príklad:

Pre všetky značky s atribútom class \u003d "class1" pridajte textové podčiarknutie

a zmenšiť veľkosť písma a pre značku odstráňte podčiarknutie.

.class1 (výzdoba textu: podčiarknuté; veľkosť písma: 80%)

A.class1 (dekorácia textu: žiadny;)

V kóde HTML zadáme názov triedy pre značky:

< h1 trieda=" trieda1 "\u003e Moje obľúbené stránkyh1>

Yandex

Google

Redut.ru

Začínajúci blogeri a nielen začiatočníci sa často stretávajú s problémom kódovania html stránky. Keď sa namiesto textu a čitateľných znakov zobrazia nepochopiteľné KRAKOSYABRY. Toto je názov symbolov, ktoré nezodpovedajú tým, ktoré by sa mali zobrazovať na stránke. Odkiaľ pochádzajú nepochopiteľné hieroglyfy?

Aby ste to pochopili, musíte zistiť, čo je kódovanie stránky HTML. Akýkoľvek text v počítači je reprezentovaný ako sada bajtov. Každý z týchto bajtov má špecifický kód - kódovaný je iba jeden jediný znak. Pre správne dešifrovanie alebo dekódovanie sady bajtov a jej prezentáciu v podobe čitateľnej pre človeka musí prehliadač zodpovedať jednej z kódových tabuliek.

Základným kódovaním je kódovanie ASCII, ktoré obsahuje kódy pre 128 znakov latinskej abecedy a špeciálne znaky (zátvorky, hash atď.). Potom sa objavili prvé kódovania ruských znakov CP866 a KOI8-R a od nich vyšlo kódovanie windows-1251 známe dnešným správcom webových stránok. Aj napriek tomu, že všetky tieto kódovania sú určené na zobrazovanie ruského textu, v kódoch sa navzájom líšia.

Pokiaľ bol text napísaný v kódovaní CP866 a prehliadač sa ho pokúsil dekódovať pomocou kódovej tabuľky windows-1251, dostaneme vo výsledku nečitateľné slová. Okrem mien tých kódovaní, ktoré som tu uviedol, existuje ešte veľa ďalších úvodzoviek. S takým množstvom kódovacích tabuliek sa vytvoril problém s kompatibilitou kódovania. Otázka vytvorenia univerzálneho kódovania vznikla veľmi naliehavo. Dnes bolo vynájdené univerzálne kódovanie utf-8. Pri programovaní webu existujú štyri body, ktoré vyžadujú zhodu s jedným štandardom pre kódovanie textu.

  • Kódovanie skriptov.
  • Kódovanie tabuľky MySQL.
  • Samotné kódovanie stránky HTML.
  • Miestne nastavenie používané prehliadačom používateľa.

Vo všetkých týchto komponentoch stránky by sa malo použiť jediné kódovanie - najlepšie utf-8, pretože je univerzálne. Ak stlačíte kombináciu klávesov CTRL + U, uvidíte kód stránky, ktorý ukazuje, ktoré kódovanie sa v tomto dokumente použije.

Ak otvoríte svoj blog a namiesto ruských symbolov uvidíte nejaké nepochopiteľné znaky, potom je kódovanie nastavené nesprávne.

Ako zmením kódovanie?

Aby sme eliminovali chyby a problémy s kódovaním vášho blogu, používame FTP klienta. S jeho pomocou skopírujte súbor wp-config.php na „Pracovnú plochu“ vášho počítača a otvorte ho v textovom editore Notepad ++. Tento súbor obsahuje informácie o vašom blogu - vrátane hesiel, kódovania databázy a ďalších. Zistite, či je kódovanie nejaké iné, musíte ho zmeniť na UTF-8.

  • -uložte toto kódovanie.
  • - vo vnútri kódu databázy zmeníme kódovanie na UTF-8.

Uložte súbor v editore Notepad ++ v hodnote „UTF-8 bez podpisu kusovníka“ a nahrajte ho na svoj hosting, to znamená, zmeňte starý súbor wp-config.php na hostingu , na novom.

Tieto akcie spravidla stačia na to, aby sa vo vašom blogu všetko zobrazilo správne. Ak sa po vykonaných krokoch nič nestalo, môžete skúsiť iný spôsob zmeny kódovania. Ak to chcete urobiť, musíte vykonať zmeny v súbore .htaccess. Ak to chcete opraviť, otvorte súbor .htaccess pomocou editora Poznámkový blok ++ a na začiatok pridajte jeden z týchto riadkov:

  • AddDefaultCharset UTF-8
  • CharsetDisable On
  • CharsetDefault UTF-8
  • CharsetSourceEnc UTF-8

Možno bude stačiť zmeniť jednu z možností, niekedy stačí aj prvá. Ak to nefunguje, prejdeme ručne po nasledujúcich možnostiach, postupne zadáme nasledujúce možnosti. Nezabudnite na postupnosť akcií:

  1. Otvorte súbor v editore.
  2. Vykonávanie zmien.
  3. Šetríme.
  4. Nahrávanie na hosting.
  5. Prebieha kontrola.

Chcem tiež spomenúť jeden z problémov, ktoré môžu nastať a s ktorým som sa stretol pri vytváraní stránok na zaznamenávanie. Pri nahrávaní súborov zo zachytávacej stránky na hostiteľský server môže nastať situácia, že sa nebudú zhodovať kódovania. V takom prípade musíte opraviť súbor index.html. Za týmto účelom pomocou programu FaleZilla rozbaľte súbor a preneste ho na „plochu“ počítača. Ďalej otvorte súbor pomocou bežného programu Poznámkový blok.

Po otvorení súboru v programe Poznámkový blok kliknite ľavým tlačidlom myši na položky „Súbor“ a „Uložiť ako ...“.

Zdravím, čitatelia a predplatitelia môjho blogu. V dnešnej publikácii som sa rozhodol dotknúť sa veľmi dôležitej a objemnej témy, ktorú musí poznať každý vývojár a návrhár dispozícií. Po prečítaní všetkého materiálu zistíte, aké je kódovanie html dokumentov, na čo slúži a čo sa zmení pri inštalácii tohto alebo toho typu kódovania.

S akými problémami sa môžete stretnúť pri nesprávnom výbere, v ktorých softvérových produktoch môžete tento parameter zmeniť, ako aj pri spôsobe jeho nastavenia v kóde. Myslím, že je čas pustiť sa do práce!

Prečo je kódovanie také dôležité a aké typy existujú?

Hneď ako sa začala IT sféra rozvíjať, začalo sa s ňou vyvíjať a vylepšovať kódovanie. Prečo sú také dôležité pre vývoj a tvorbu webov?

Správne zobrazovanie symbolov na displeji zariadení je v skutočnosti dosť komplikovaná vec, pretože nejde o priamy proces. Akýkoľvek znak súvisiaci s azbukou, latinkou, číslami a inými abecedami sa vytvára vďaka dvom parametrom:

  1. Vektorové znázornenie (formy) najrôznejších jednotiek rôznych abeced, ktoré sú uložené v dokumentoch s písmami na každom osobnom počítači;
  2. Číslo alebo kód, pod ktorým sa uvedený symbol nachádza v týchto dokumentoch.

Pretože za kódovanie znakov a potom za programy, v ktorých pracujete, je zodpovedný operačný systém, všetok ich textový obsah vyzerá ako sada bajtov. Okrem toho je každý bajt zodpovedný za konkrétny znak. Z toho získate určité veľkosti súborov.

Ako OS nahradí potrebné písmená a znaky? Všetko je pre ňu veľmi jednoduché. Symbol je vyhľadaný prečítaným kódom v dokumente písma a potom nahradený.

Dnes existuje niekoľko hlavných kódovacích štandardov a ich podtypov. Patria sem ASCII a jeho podradené typy CP866, KOI8-R a Windows 1251, Unicode s kódovaním UTF. Do dnešného dňa však všetky čestné vavríny putovali na UTF-8. A toto je oprávnené. Aby ste jasne pochopili súčasnú situáciu, prejdeme k ďalšej kapitole.

Dokumentácia o Asuke

Začnem svoj príbeh predkom opísanej rodiny, ktorý stojí na čele symbolického displeja.

ASCII (Aski) a prví dediči

V prvých verziách Asuka bolo k dispozícii iba 128 znakov, medzi ktoré sa zmestili latinské písmená, arabské čísla a ďalšie znaky. Kvôli nedostatku hodnôt sa však kódovanie rozšírilo dvakrát (t.j. až na 256). Vďaka tomu bolo možné k existujúcim hodnotám pridať vlastné. To je pravdepodobne dôvod, prečo existuje niekoľko druhov tabuliek s ruskými symbolmi.

Prvý, ktorý obsahuje ruskú abecedu CP866. Okrem toho rozšírená verzia obsahovala aj pseudo-grafiku.

Po nej analóg videl svetlo - KOI8-R. Funkciou KOI8-R je usporiadanie ruských písmen nie abecedne, ale v približne rovnakých stĺpcoch ako spoluhláskové písmená.

V tom „železnom veku“ IT technológií nebolo také množstvo grafických operačných systémov, takže pseudografika zachránila vývojárov a pomohla im vytvárať viac či menej rozmanité.

Presun na modernosť - Windows 1251

Toto je ďalší rozšírený typ štandardu ASCII, ktorý je však spojený s modernými grafickými operačnými systémami. Čo to znamená? A skutočnosť, že pseudo-grafika už nebola potrebná.

Windows 1251 sa tiež nazýva „populárne“ podľa azbuky. Je to tak preto, lebo v tejto tabuľke miesto zbytočných znakov zaujali chýbajúce symboly ruského a iného slovanského jazyka, ako aj podobná typografia.

Uviedol som najpopulárnejšie typy rozšírení Asuka, ale bolo ich oveľa viac. V dôsledku toho sa začalo delenie moci a zmätok medzi použitými kódovaniami. To viedlo k skutočnosti, že niekedy na obrazovke môžete pozorovať vzhľad nepochopiteľných ikon, ktoré sa neskôr v širokých kruhoch nazývali krakozyabra.

Tieto príšery sa zobrazia, iba ak je typ kódovania nastavený nesprávne. Dlhodobo sa snažili tento problém vyriešiť rôznymi spôsobmi. Ale po jednej dileme sa objavila ďalšia - nedostatok 256 bajtov na uloženie všetkých existujúcich znakov (napríklad japonských).

Príchod novej vlády

Záchranný kruh sa ukázal byť novým štandardom pre kódovanie abecedy - Unicode. Všetky jeho kódovania majú v názve UTF a za pomlčkou počet bitov pre 1. znak.

Takže pokročilé mysle tej doby spolupracovali a vytvorili UTF-32. To samozrejme vyriešilo problém nedostatku miesta pre rovnaké objemné hieroglyfy, ale spôsobilo to ďalšie - veľkosť súboru sa zvýšila 4-krát.

Potom sa pridelená pamäť znížila na 16 bitov. A nakoniec som sa dostal na 8.

UTF-8 je štandard, ktorý nepoužíva pevnú veľkosť bitu pre jeden znak, a to je jeho obrovská výhoda: použitie variabilnej dĺžky.

Vďaka tomu sú latinka a ďalšie jednoduché znaky kódované do 1 bajtu, ako v ASCII. Ale „ťažké“ znaky môžu byť reprezentované od jedného do šiestich bajtov postupne. Stojí za zmienku, že okrem abecedy nájdete v tabuľkách Unicode aj všetky druhy klipov, úsmevov, gréckych písmen, kvetov a iných neštandardných prvkov.

Takže sme prišli na to, prečo sa UTF-8 stal lídrom.

Programy na preklad textu z jedného kódovania do druhého

V skutočnosti je veľmi ľahké zmeniť formát kódovania súborov a je k dispozícii vo väčšine programov: Notepad, Notepad ++, PSPad a ďalšie analógy poskytujú túto príležitosť, rovnako ako profesionálne produkty ako Visual Studio, IntelliJ IDEA atď.

Pre začiatočníkov je vhodná aj práca v Poznámkovom bloku. Stačí otvoriť požadovaný súbor, zvoliť „Uložiť ako ...“ a zmeniť typ kódovania v dolnej časti dialógového okna.

Pre tých pokročilejších je Notepad ++ skvelým nástrojom. Ponúka širokú škálu rôznych kódovaní, vrátane UTF-8 s kusovníkom a bez kusovníka. Aj keď je lepšie zvoliť druhú možnosť.

Rád by som povedal pár slov o kusovníku. Celým menom je Byte Order Mark, ktorý je v rusky hovoriacich kruhoch známejší ako „značka sekvencie bajtov (poradia)“. Takáto značka je umiestnená na samom začiatku textového dokumentu a zvyčajne sa používa na výmenu súborov. Trvá to 3 bajty, čo vyzerá takto: ef bb bf.

Aby ste sa však vyhli problémom s rozpoznávaním kódovania súborov, stojí za to použiť UTF-8 bez štítku.

Sada nástrojov pre vývojárov

Na nastavenie určitého typu kódovania textového obsahu v kóde môžete použiť niekoľko metód.

Prvou možnosťou je zadať v dokumente .htaccess „AddDefaultCharset UTF-8“.

Druhým je deklarovanie hodnoty pre charset v metaznačke. Tento atribút sa objavil pri vydaní. Ako príklad som pripojil implementáciu softvéru.

Príklad so znakovou sadou

Známy vzhľad textu! Všetky 4 slová a 2 čísla sa zobrazili správne.



Experimentujte a nahraďte iné názvy kódovania.

Ak bol materiál pre vás užitočný a páčil sa vám, potom sa prihláste na odber aktualizácií blogu a zdieľajte odkaz na články so svojimi priateľmi. Veľa štastia. Čau čau!

S pozdravom Roman Chueshov

Čítať: 120 krát

Kódovanie systému Windows 1251 bolo vytvorené začiatkom 90. rokov pre rusifikáciu softvérových produktov vyrábaných spoločnosťou Microsoft:

Kódovanie je 8-bitové a obsahuje znaky slovanskej skupiny jazykov, ktorá obsahuje ruštinu, bielorusčinu, ukrajinčinu, bulharčinu, macedónčinu, srbčinu - to je výhoda oproti iným cyrilským kódovaniam (ISO 8859-5, KOI8-R, CP866). Kódovanie 1251 má však aj značné nevýhody:

  • 0xFF (25510) je kód vyhradený pre znak „i“. Programy, ktoré nepodporujú čistý 8. bit, majú často nepredvídateľné problémy;
  • V KOI8, CP866 nie je prítomná žiadna pseudo-grafika.

Ďalej sú uvedené skratky z kódovej stránky 1251 alebo CP1251 ( čísla pod znakmi sú hexadecimálny kód rovnakého znaku Unicode):


Windows 1251 kódovanie v html

Weboví vývojári a blogeri s rôznymi kvalifikáciami majú často problém s kódovaním stránky: namiesto pripraveného textu sa objavia neznáme a nečitateľné znaky. Aby ste pochopili tento problém, musíte pochopiť podstatu pojmu „ kódovanie stránky».

Text v pamäti počítača sa ukladá ako určitý počet bajtov, nie v podobe, v akej sa zobrazuje v textovom editore. Každý bajt je kód, ktorý zodpovedá jednému znaku. Aby sa text na stránke mohol správne zobraziť, musíte prehľadávaču povedať, ktorú tabuľku kódov má použiť na dešifrovanie a zobrazenie.

Tabuľka kódovania nie je univerzálna, to znamená, že na dešifrovanie textu musíte použiť tú, ktorá zodpovedá kódovaniu znakov:


Aby sa html dokument v prehliadači zobrazil správne, musíte určiť použité kódovanie. Toto sa deje nasledovne:

- medzi štítkom a zakrýva to treba sa zaregistrovať - na základe tohto reťazca použije prehliadač na zobrazenie textu na stránke znaky ruskej abecedy.

Windows 1251 kódovanie v PHP

Pre nikoho nie je žiadnym tajomstvom, že generovanie stránok sa deje vzorkovaním a použitím niektorých informácií, ktoré sú uložené v databáze. Pri písaní webovej stránky v PHP je to najčastejšie mysql:


Pri zmene hostingu často nastáva problém: odlišné kódovanie informácií v databáze a v šablónach stránok. Z tohto dôvodu môže jedna vygenerovaná stránka obsahovať niekoľko kódovaní súčasne. Ak sú informácie na webe uvedené v kódovaní Windows 1251, potom by sa malo čítanie z databázy vykonať pomocou tabuľky, v ktorej je uvedené kódovanie win 1251.

Aby ste sa dohodli na dešifrovaní, musíte túto funkciu vykonať mysql_query ("SET NAMES cp1251") - to znamená, že prevod zo strojového kódu sa uskutoční podľa tabuľky cp1251.

Windows 1251 kódovanie v htaccess

Pri vytváraní webových stránok, ktoré už predtým nakonfigurovali kódovanie v šablónach a databázach, môže stále vzniknúť problém s nesprávnym zobrazením informácií v prehľadávači.

Ak chcete nastaviť kódovanie Windows-1251 pre webový zdroj, musíte nájsť (alebo vytvoriť) súbor .htaccess. Toto je súbor, ktorý ukladá ďalšie nastavenia a popisy konfigurácií webového servera.

Aby ste nastavili kódovanie, mali by byť do neho napísané nasledujúce riadky:

  • DefaultLanguage ru;
  • AddDefaultCharset windows-1251;
  • php_value default_charset "cp1251".

Pre správne zobrazenie textu sa teda musí zhodovať jeho kódovanie a tabuľka kódov, pomocou ktorej bude prehliadač dešifrovať znaky. Pre texty napísané v slovanských jazykoch je potrebné kódovanie win 1251. Je dôležité mať na pamäti, že prvky stránky a databázy musia byť opísané pomocou rovnakej kódovej tabuľky.

Dobrý zlý




Počítačová stránka pomoci

© Copyright 2020,
rzdoro.ru - Stránka pomoci pre počítač

  • Kategórie
  • Notebooky
  • Windows 8
  • Audio video
  • Gadgety
  • rôzne
  • Linux
  • internet
  • Microsoft Office