Súbory a štruktúra súborov. Štruktúra súborov na disku

  • 19.09.2019

Súbory a štruktúra súborov

Vo výpočtovej technike je jednotkou ukladania dát objekt s premenlivou dĺžkou tzv súbor... Súbor je sekvencia ľubovoľného počtu bajtov s jedinečným názvom. Súborové systémy vytvoriť pre používateľov virtuálnu reprezentáciu externých počítačových úložných zariadení, čo im umožní pracovať s nimi nie na nízkej úrovni príkazov na ovládanie fyzických zariadení, ale na vysokej úrovni dátových súborov a štruktúr. Súborový systém je teda systémom správy údajov.

Názov súboru má osobitný význam - - v skutočnosti nesie adresné funkcie v hierarchických štruktúrach. Okrem toho môže mať názov rozšírenie, ktorý ukladá informácie o type údajov. Ak používateľ môže určiť názvy vytvorených súborov ľubovoľne, potom by sa mala pri používaní rozšírení dodržiavať určitá tradícia. Napríklad v operačnom systéme MS DOS sú spustiteľné súbory s príponami :: .com, .exe, .bat; .bat, .txt, .doc - - text; .pas, .bas, .c, .for - - texty programov v známych programovacích jazykoch: (Pascal, BASIC, C, Fortran, resp.); .dbf -- databázový súbor. Rôzne operačné systémy majú obmedzenia týkajúce sa dĺžky názvu a prípony názvu súboru. Takže v MS DOS by dĺžka názvu súboru nemala presiahnuť osem znakov a používa sa prípona - tri, to znamená štandard 8.3. V operačnom systéme Windows sú obmedzenia oveľa menej prísne.

Pre užívateľa je súbor hlavným a nedeliteľným prvkom dátového úložiska, ktorý je možné nájsť, upraviť, vymazať, uložiť alebo odoslať do zariadenia alebo iného počítača, avšak len celý.

Súborový systém je súčasťou operačného systému počítača a preto vždy nesie odtlačok vlastností konkrétneho operačného systému. Súborový systém skrýva pred používateľom obraz skutočného umiestnenia informácií v externej pamäti, zabezpečuje nezávislosť programov od funkcií konkrétnej konfigurácie počítača, to znamená logickú úroveň práce so súbormi. Pri práci so súbormi má používateľ k dispozícii nástroje na vytváranie nových súborov, operácie na čítanie a zápis informácií atď., ktoré neovplyvňujú špecifické otázky programovania kanála na odosielanie údajov, na ovládanie externých zariadení.

Najbežnejším typom súborov, ktorých vnútornú štruktúru zabezpečujú súborové systémy rôznych operačných systémov, sú súbory so sekvenčnou štruktúrou. Súbory sú v tomto prípade reprezentované ako množina základných prvkov nazývaných logické záznamy ľubovoľnej dĺžky a sekvenčného prístupu. Niektoré operačné systémy umožňujú použitie zložitejších logických štruktúr súborov, ako je napríklad stromová štruktúra. Na fyzickej úrovni môžu byť bloky súboru v pamäti súvislé alebo môžu byť uložené nesúvisle. Všetky účtovné informácie o umiestnení súborov na magnetickom disku sú zhromaždené na jednom mieste -- katalóg alebo adresár disk. Adresár je zoznam prvkov, z ktorých každý popisuje vlastnosti konkrétneho súboru používaného na organizáciu prístupu k nemu - - názov súboru, jeho typ, umiestnenie na disku, veľkosť. Adresárov môže byť veľké množstvo a sú prepojené do informačných štruktúr, napríklad v hierarchickom (stromovom) adresárovom systéme. S každým adresárom sa zaobchádza ako so súborom a má svoj vlastný názov. Úplný názov adresára alebo súboru v takejto štruktúre definuje cestu prechodov medzi adresármi a súbormi v logickej adresárovej štruktúre (pozri obr. 1.5).

Ryža. 1.5. Hierarchický adresárový systém

Štruktúra samotných súborov môže byť triviálna. Napríklad text môže byť uložený ako postupnosť bajtov zodpovedajúcich kódovaniu tabuľky ASCII. Vo väčšine prípadov však musíte spolu s údajmi uložiť aj ďalšie


technická informácia. Spôsob, akým sú dáta organizované v súbore, teda štruktúra súboru, sa nazýva formát... Formát súboru určuje, ako sa uložené údaje správne interpretujú. Existuje pomerne veľa rôznych formátov súborov. Niektoré z nich sú štandardizované a podporované akýmkoľvek operačným systémom, niektoré sú špecifické len pre tieto operačné systémy. Hlavička súboru často obsahuje identifikátor formátu súboru. Moderné softvérové ​​systémy umožňujú súčasne zahrnúť do súboru údaje rôznych typov, to znamená, že súbor môže mať veľmi zložitý formát. Napríklad dokument MS Word môže obsahovať text, obrázky, tabuľky, vzorce a ďalšie.

Vo väčšine prípadov používateľ nemusí vedieť nič o vnútornej štruktúre súborov. Toto je abstraktná vrstva rozhrania operačných systémov.

Všetky programy a dáta sú uložené v energeticky nezávislej pamäti počítača vo forme súborov.

Definícia 1

Súbor- pomenovaný súbor údajov zaznamenaných na médiu. Každý súbor má názov pozostávajúci z dvoch častí oddelených bodkou – samotný názov a prípona. Pri zadávaní názvu súboru je žiaduce, aby označoval buď obsah súboru alebo autora.

Prípona označuje druh informácií uložených v súbore. Názov súboru zadá používateľ a typ súboru zvyčajne nastaví program automaticky pri jeho vytvorení.

Obrázok 1.

Názov súboru môže mať až 255 $ znakov vrátane prípony. Názov súboru môže pozostávať z anglických a ruských písmen, číslic a iných symbolov.

V názvoch súborov je zakázané používať znaky:

\ / * ? : “ | .

Rozšírenie niektorých typov súborov:

Obrázok 2

Parametrami súboru sú okrem názvu a typu aj: veľkosť súboru, dátum a čas vytvorenia, ikona (elementárny grafický objekt, pomocou nej zistíte, v akom prostredí bol súbor vytvorený alebo o aký typ ide) .

Obrázok 3.

Klasifikácia ikon súboru

Obrázok 4.

Definícia 2

Štruktúra súboru- súbor súborov a vzťah medzi nimi.

Jednoúrovňová štruktúra súborov používa sa pre jednotky s malým počtom súborov a ide o lineárnu postupnosť názvov súborov.

Viacúrovňová štruktúra súborov používa sa, keď sú na disku uložené tisíce súborov zoskupených do priečinkov. Vrstvenie znamená systém vnorených priečinkov so súbormi.

Každý disk má logický názov označený latinským písmenom, za ktorým nasleduje dvojbodka:

  • C:, D:, E: atď. - pevné a optické disky,
  • A :, B: - diskety.

Priečinok najvyššej úrovne pre jednotku je koreňový priečinok, ktorý sa v operačnom systéme Windows označuje pridaním „\“ k názvu jednotky, napríklad D: \ je označenie koreňového priečinka.

Príklad štruktúry súboru:

Obrázok 5.

Katalóg je priečinok alebo adresár, kde sú umiestnené súbory a iné adresáre.

Zavolá sa adresár, ktorý nie je podadresárom žiadneho iného adresára koreň... Takýto adresár je na najvyššej úrovni hierarchie všetkých adresárov. V systéme Windows má každá jednotka svoj vlastný koreňový adresár (D: \, C: \, E :).

Adresáre v OS Windows sú rozdelené na systémové a užívateľské. Príklad systémových katalógov: "Desktop", "Network Neighborhood", "Kôš", "Ovládací panel".

Obrázok 6. Systémové adresáre OS Windows

Zľava doprava: systémový priečinok

Kôš, priečinok Moje dokumenty, odkaz na priečinok Moje dokumenty

Adresár a priečinok sú fyzicky rovnaké.

Cesta k súboru je jeho adresa.

Cesta k súboru vždy začína názvom logickej jednotky (D: \, C: \, E :), potom sa zapíše postupnosť názvov priečinkov vnorených do seba, posledný priečinok obsahuje požadovaný súbor. Cesta k súboru spolu s názvom súboru sa nazýva úplný názov súboru, napríklad: D: \ Moje dokumenty \ Literatúra \ Kompozícia.doc úplný názov súboru Kompozícia.doc.

Obrázok 7. Strom adresárov a súborov

Súborová štruktúra disku je schematicky znázornená ako strom.

Obrázok 8. Štruktúra súboru disku Z:

  • Z: \ box \ box1 - celý názov priečinka (adresára) box1
  • Z: \ box \ box.txt - celý názov súboru box.txt
  • Z: \ box \ box2 \ box3 \ box1 - celý názov priečinka (adresára) box1
  • Z: \ box \ box2 \ box3 \ box.txt - celý názov súboru box.txt

Aby sme pochopili, ako fungujú počítačové systémy, nestačí len vizuálna interakcia s operačným systémom. Na úplné pochopenie všetkých procesov vyskytujúcich sa v systéme je potrebné pochopiť, čo je súbor a štruktúra súborov. Pri zvažovaní tejto témy bude uvedené, na čo slúži.


Čo je súbor a štruktúra súboru?

Najprv sa musíte rozhodnúť o základných pojmoch a pojmoch. Kľúčom je tu koncept súboru. Definuje mechanizmus systému z hľadiska softvéru. Súbor je objekt, ktorý obsahuje určité informácie. Aby ste pochopili, čo sú dátové súbory a štruktúra súborov, je najlepšie použiť skutočný príklad. Tieto pojmy môžete porovnať s obyčajnou knihou. Každý určite vie, že kniha má obálku, strany, obsah, sekcie a kapitoly.

Pre ľahšie pochopenie problematiky si povedzme, že obal predstavuje súhrnne celý súborový systém, stránky sú priečinky alebo adresáre, v ktorých sú uložené jednotlivé súbory, obsah tvorí správca súborov, sekcie a kapitoly sú súbory, ktoré obsahujú konkrétne informácie. Označenie objektu nazývaného súbor sa zvyčajne skladá z dvoch častí — názvu a prípony. Názov súboru môže byť zadaný v rôznych jazykoch a môže byť ľubovoľný. Rozšírenie je špeciálne označenie, ktoré označuje typ údajov.

Prípona sa zvyčajne skladá z troch alebo viacerých latinských písmen. Podľa prípony môžete pochopiť, ku ktorému programu je súbor priradený a či ide o systémový. V predvolenom nastavení sa v akomkoľvek operačnom systéme súbor otvorí dvojitým kliknutím myši. Týmto spôsobom však nemusíte mať možnosť otvoriť žiadny súbor. Tu je jednoduchý príklad: týmto spôsobom môžete spúšťať spustiteľné súbory s príponou .exe v operačnom systéme Windows, ale súbory s príponou .dll nie je možné týmto spôsobom otvárať.

Je to preto, že k obsahu sa pristupuje prostredníctvom iných softvérových komponentov. Okrem toho kód môžu volať špecializované komponenty operačného systému. Toto je však najjednoduchší príklad. Objekty, ktoré nezodpovedajú operačnému systému ani žiadnemu programu, sa nedajú ľahko otvoriť. Operačný systém nerozumie, ktorý nástroj spustiť na otvorenie súboru. V najlepšom prípade vás systém vyzve na výber vhodného programu z prezentovaného zoznamu riešení.

Informatika na začiatku rozvoja výpočtovej techniky

Pozrime sa teraz, aká bola informačná technológia v čase objavenia sa prvých počítačov. Hlavným systémom, ktorý sa v tých časoch používal, bol v tom čase primitívny systém DOS. V tomto systéme bolo potrebné zadať špeciálne príkazy na prístup k funkciám. Po objavení sa jedinečného produktu Norton Commander táto potreba zmizla, hoci niektoré príkazy je stále potrebné napísať. Tento správca súborov sa dá nazvať obsahom, pretože v ňom boli jasne štruktúrované všetky informácie, ktoré sú uložené na externom médiu alebo pevnom disku.

Priečinky a súbory

Ako už bolo jasné, v každom operačnom systéme existuje niekoľko základných objektov. Pojmy ako súbor a súborový systém sú neoddeliteľné od priečinkov. Tento koncept sa niekedy označuje aj ako adresár alebo adresár. Ide o špeciálnu sekciu, v ktorej sú uložené jednotlivé komponenty. Na vysvetlenie tohto pojmu môžete uviesť ako príklad komodu, v ktorej je veľa zásuviek, z ktorých každá niečo obsahuje.

Príklady vyhľadávania súborov

Na základe vyššie uvedeného môžeme vyvodiť záver o rýchlom vyhľadávaní informácií. V každom modernom operačnom systéme sú na tento účel k dispozícii špeciálne nástroje. Napríklad v tom istom správcovi súborov v špeciálnom poli musíte zadať názov alebo časť názvu súboru, po ktorom systém zobrazí všetky objekty, ktoré obsahujú tento reťazec. Pre presnejšie vyhľadávanie musíte presne vedieť, kde sa súbor, ktorý potrebujete, nachádza. Inými slovami, v komode je potrebné vybrať určitú zásuvku, v ktorej sa nachádza požadovaný predmet. Vyhľadávanie sa vykonáva pomocou štandardného nástroja správcu súborov. Môžete tiež použiť klávesové skratky ako Ctrl + F, ktoré vyvolajú vyhľadávací panel.

Čo je súborový systém?

Súborové štruktúry a súbory si nemožno predstaviť bez pochopenia, ako súborový systém funguje. Treba poznamenať, že štruktúra súborov a súborový systém sú odlišné pojmy. Štruktúra je hlavným typom usporiadania súborov, pokiaľ ide o organizáciu údajov. Súborový systém je metóda, ktorá určuje, ako štruktúra funguje. Zjednodušene povedané ide o princíp spracovania dát v zmysle ich umiestnenia na dátový nosič. V súčasnosti existuje veľa súborových systémov. Pre operačný systém Windows sú najbežnejšími možnosťami systémy FAT s architektúrami 6, 16, 32 a 64 bitov, ReFS a NTFS.

Pojmy súborový systém a štruktúra súborov spolu úzko súvisia. Teraz však treba povedať pár slov o samotných systémoch. Okrem technických detailov treba poznamenať, že hlavným rozdielom je, že súborový systém FAT má väčšiu veľkosť klastra pre rýchlejší prístup a ukladanie malých súborov, súborové systémy NTFS a ReFS sú optimalizované pre veľké dátové polia a rýchly prístup k nemu pri maximálna rýchlosť čítania informácií z pevného disku.

Vykonávanie operácií so súbormi

Pozrime sa na túto problematiku z druhej strany. Operácie so súbormi poskytované v akomkoľvek operačnom systéme sa zvyčajne v zásade nelíšia. Základné operácie zahŕňajú vytváranie, prezeranie, otváranie, ukladanie, upravovanie, kopírovanie, premenovanie, mazanie a presúvanie. Pre všetky existujúce operačné systémy sú takéto akcie štandardom. Existuje však aj množstvo špecifických funkcií.

Archivácia informácií

V prvom rade medzi špecifické funkcie patrí kompresia priečinkov a súborov, ktorá sa nazýva archivácia, a spätný proces – extrahovanie informácií z archívu. Pri práci na operačnom systéme DOS sa tvorba archívnych dátových typov zredukovala najmä na použitie štandardu ARJ, avšak s príchodom technológie archivácie ZIP sa tieto procesy viac rozvinuli. V dôsledku toho bol vytvorený univerzálny archivátor RAR. Tieto technológie sú dnes prítomné v akomkoľvek operačnom systéme, a to aj bez potreby inštalácie dodatočného softvéru. Operácie so súbormi v tomto zobrazení sa považujú za virtuálnu kompresiu. Kompresné techniky jednoducho inštruujú systém, aby určil menšiu namiesto požadovanej veľkosti. Objem informácií priečinka alebo súboru zostáva počas procesu archivácie nezmenený.

Ovládanie zobrazenia súborov

Takýto koncept, ako je štruktúra súboru, sa musí posudzovať z hľadiska možnosti vidieť samotné objekty. Takmer všetci používatelia moderných počítačových systémov dnes čelia takému konceptu, ako sú skryté súbory a priečinky. Čo sú zač? Prítomnosť takýchto objektov naznačuje, že v systéme je nastavené určité obmedzenie zobrazenia. Takéto obmedzenia sú napríklad nastavené na systémové súbory a priečinky, aby ich používateľ omylom nezmazal. Fyzicky teda z pevného disku nezmiznú, správca súborov ich jednoducho nepozná. Ak chcete zobraziť všetky skryté objekty v rovnakom "Prieskumníkovi", môžete použiť ponuku "Zobraziť".

Na príslušnej karte musíte začiarknuť políčko v riadku na zobrazenie skrytých súborov a priečinkov. Po zapnutí displeja budú mať objekty tohto typu priesvitné ikony. Môže byť ťažké nájsť skryté predmety. Systém nemusí vrátiť výsledky vyhľadávania, aj keď je zadaný názov a typ súboru, ako aj konkrétne umiestnenie. Ak chcete nájsť skryté objekty, musíte umiestniť symbol % na začiatok a na koniec názvu koreňového adresára. Iba v tomto prípade súbor a štruktúra súboru dostanú kľúč k interakcii.

L 5.1. OS STAVEBNÁ ARCHITEKTÚRA

Kľúčové slová: súbor, prípona názvu súboru, atribúty súboru, štruktúra súboru, adresár (priečinok), cesta k súboru, formátovanie, sektor, stopa, valec, tabuľka prideľovania súborov (FAT), klaster, systém súborov, FAT 16, FAT 32, NTFS, MTF, CDFS, príkazy OS, pracovná plocha, panel úloh, ikona objektu a skratka, hlavné menu Windows, okno Windows, záhlavie, panel s nástrojmi, pretiahnutie, pretiahnutie,“ Dirigent", schránka," veliteľ Norton", Šablóny na výber a vyhľadávanie súborov.

Operačný systém je komplex systémových a servisných softvérových nástrojov. Na jednej strane sa spolieha na základný počítačový softvér, ktorý je súčasťou jeho systému. BIOS (základný vstupný/výstupný systém); na druhej strane je sama o sebe chrbtovou kosťou softvéru vyššej úrovne — aplikácie a väčšiny servisných aplikácií. Aplikácie operačného systému je zvykom volať programy určené na prácu pod kontrolou tohto systému.

Hlavnou funkciou všetkých operačných systémov je sprostredkovateľská funkcia. Spočíva v poskytovaní niekoľkých typov rozhraní:

Rozhranie medzi používateľom a softvérom a hardvérom počítača (používateľské rozhranie);

Rozhranie medzi softvérom a hardvérom (hardvérovo-softvérové ​​rozhranie);

Rozhranie medzi rôznymi typmi softvéru (softvérové ​​rozhranie).

Aj pre jednu hardvérovú platformu ako napr
IBM PC, existuje niekoľko operačných systémov (OS). Zvážte napríklad štruktúru súborov, základné objekty a techniky správy pre najbežnejšie operačné systémy: MS DOS a Windows XP.

Štruktúra súborov osobného počítača. Pri ukladaní údajov sa riešia dva problémy: ako uložiť údaje v čo najkompaktnejšej forme a ako k nim poskytnúť pohodlný a rýchly prístup (ak nie je zabezpečený prístup, nejde o ukladanie). Na poskytnutie prístupu musia mať údaje usporiadanú štruktúru. Tým sa vygenerujú údaje o adrese. Bez nich nie je možné získať prístup k požadovaným dátovým prvkom zahrnutým v štruktúre.

Objekt s premenlivou dĺžkou tzv súbor.

Súbor je pomenovaná postupnosť bajtov ľubovoľnej dĺžky... Keďže súbor môže mať nulovú dĺžku, vytvorenie súboru spočíva v priradení názvu k nemu a jeho registrácii v súborovom systéme – to je jedna z funkcií OS.

Údaje patriace do rovnakého typu sú zvyčajne uložené v samostatnom súbore. V tomto prípade rozhoduje typ údajov typ súboru.

Keďže v definícii súboru nie je žiadne obmedzenie veľkosti, môžete si predstaviť, že súbor má 0 bajtov (prázdny súbor), a súbor s ľubovoľným počtom bajtov.



Pri definícii súboru sa osobitná pozornosť venuje názvu. V skutočnosti nesie adresné údaje, bez ktorých sa údaje uložené v súbore nestanú informáciou, pretože k nim chýba spôsob prístupu. Okrem funkcií súvisiacich s adresovaním môže názov súboru uchovávať aj informácie o type údajov v ňom obsiahnutých. Pre automatické nástroje na prácu s údajmi je to dôležité, pretože podľa názvu súboru (alebo skôr podľa jeho prípony) môžu automaticky určiť vhodnú metódu na extrahovanie informácií zo súboru.

Podľa spôsobu pomenovania súborov je možné rozlíšiť „ skratka"(8 znakov je vyčlenených pre názov súboru a 3 znaky pre jeho príponu) a" dlhý»Názov (až 256 znakov). Názov súboru je oddelený od prípony bodkou. Prípona súboru je voliteľná a môže chýbať.

V OS MS DOS názov (nie viac ako 8 znakov) a prípona (nie viac ako 3 znaky) môžu pozostávať z veľkých a malých latinských písmen, číslic a symbolov:

- _ $ # & @ ! % () { } " ~ ^

Malo by sa pamätať na to, že pre rad OS MS DOS:

Medzi názov a príponu je vložená bodka, ktorá nie je zahrnutá ani v názve, ani v rozšírení;

Názov súboru je možné zadať v každom prípade, pretože pre systém sú všetky písmená malé;

V názve súboru nie sú použité znaky

* = + \ ; : , . < > / ?

Názvy zariadení nemožno použiť ako názvy súborov:

AUX - názov prídavného vstupno-výstupného zariadenia;

CON - názov klávesnice pre vstup alebo zobrazenie pre výstup;

LPT1… LPT3 - názvy paralelných portov;

COM1… COM3 - názvy sériových portov;

PRN je názov tlačového zariadenia;

NUL je názov fiktívneho zariadenia, ktoré emuluje výstupné operácie bez skutočného výstupu.

S príchodom OS Windows 95 predstavil koncept" dlhý"Názov. Tento názov môže mať dĺžku až 256 znakov, čo stačí na vytvorenie zmysluplných názvov súborov. " Dlhé»Názov môže obsahovať ľubovoľné znaky okrem deviatich špeciálnych znakov:

\ / : * ? " < > |

V názve sú povolené medzery a viaceré bodky. Všetky znaky po poslednej bodke sa považujú za rozšírenie mena.

Rovnako ako aj " dlhý»Názov operačného systému Windows 95/98 / Me / 2000 / XP vytvoriť tiež skratka názov súboru - s týmto súborom je potrebné vedieť pracovať na pracovných staniciach so zastaranými operačnými systémami.

Použitie " dlhý»Názvy súborov v najnovších OS Windows má číslo Vlastnosti.

1. Ak „ dlhý»Názov súboru obsahuje medzery, v servisných operáciách musí byť uzavretý v úvodzovkách. Odporúča sa nepoužívať medzery, ale nahradiť ich podčiarkovníkom.

2. Súbory s dlhými názvami je nežiaduce ukladať do koreňového priečinka disku (na najvyššej úrovni hierarchickej štruktúry súborov) – na rozdiel od iných priečinkov má obmedzený počet úložných jednotiek (čím dlhšie názvy, tým menej súbory je možné umiestniť do koreňového priečinka).

3. Okrem obmedzenia dĺžky názvu súboru (256 znakov) existuje oveľa prísnejšie obmedzenie dĺžky celý názov súboru(zahŕňa cestu k súboru, začínajúcu od vrchu hierarchickej štruktúry). Celé meno nemôže byť dlhšie ako 260 znakov.

4. Je povolené používať symboly ľubovoľných abecied, vrátane ruštiny, ale ak sa dokument pripravuje na prenos, je potrebné dohodnúť so zákazníkom možnosť prehrávania súborov s takýmito názvami na jeho zariadení.

5. Veľké a malé písmená sú rovnaké OS. mená Letter.txt a list. TXT zodpovedajú rovnakému súboru.

6. Programátori sa už dávno naučili používať príponu názvu súboru na sprostredkovanie informácií OS, vykonávanému programu alebo používateľovi o type údajov obsiahnutých v súbore a formáte, v ktorom sú napísané. Systémové aplikácie ponúkajú výber iba hlavnej časti názvu a uvedenie typu súboru a príslušná prípona názvu sa priradí automaticky.

Všetky súbory sú rozdelené do dvoch veľkých skupín v závislosti od prípony: spustiteľný a nespustiteľné .

Spustiteľné súbory- ide o súbory, ktoré je možné spúšťať samostatne, t.j. na ich spustenie nie sú potrebné žiadne špeciálne programy. Majú nasledujúce rozšírenia:

· exe- súbor pripravený na vykonanie ( winrar.exe; winword.exe);

· plást - súbor operačného systému ( command.com);

· sys- súbor operačného systému ( io.sys) - zvyčajne ovládač pre externé zariadenie;

· netopier- dávkový súbor operačného systému MS DOS (autoexec.bat).

Nespustiteľné súbory vyžadujú na spustenie inštaláciu špeciálnych programov. Napríklad na zobrazenie textového dokumentu potrebujete textový editor. Príponu nespustiteľného súboru možno použiť na posúdenie typu údajov uložených v tomto súbore. Tu je niekoľko štandardných rozšírení a názvov programov navrhnutých na prácu so súbormi týchto rozšírení:

ASM- text programu v jazyku assembler;

AVI, MPEG, MPG, WMV atď. - rôzne formáty video súborov, na prezeranie môžete použiť napr. Windows Media Player- typ údajov: obrázok;

BAK- stará verzia súboru;

BAS- text programu v jazyku ZÁKLADNÉ;

BMP- dokument vytvorený v grafickom editore, napr. Maľovať- typ údajov: obrázok;

C- text programu v jazyku Si;

CDR CorelDraw- typ údajov: obrázok;

CPP- text programu v jazyku C++;

dbf- databázový súbor vytvorený napríklad v DBMS FoxPro;

Docentom sa stal doc- dokument vytvorený v textovom procesore Microsoft Word- typ údajov: text;

DWG, DXF- grafické súbory vytvorené v AutoCAD;

Html- dokument určený na zverejnenie na internete;

Lib- knižnica (zvyčajne objektové moduly);

MDB- databázový súbor vytvorený v DBMS Microsoft Access;

MP3, MID, WMA, WAV- rôzne formáty zvukových súborov - typ údajov: zvuk;

OBJ- objektový modul;

PAS- text programu v jazyku Pascal;

PDF - PDF-dokument vytvorený a určený na prezeranie v programe Adobe Reader;

PPT- súbor prezentácie vytvorený v Microsoft PowerPoint;

Psd- grafický súbor vytvorený v GPU Adobe Photoshop;

RAR WinRar;

RTF- dokument vytvorený v textovom editore WordPad;

TIF, GIF, JPG- rôzne formáty grafických súborov;

Tmp- dočasný súbor;

TXT- textový súbor vytvorený napríklad v programe Zápisník;

XLS- elektronická kniha vytvorená v tabuľkovom procesore Microsoft Excel- typ údajov: symboly (text alebo čísla);

PSČ- archívny súbor vytvorený programom archivátora WinZip.

Operačný systém ukladá pre každý súbor okrem názvu a prípony názvu súboru aj dátum jeho vytvorenia (úpravy) a niekoľko hodnôt príznakov, tzv. atribúty súboru. Atribúty sú ďalšie parametre, ktoré definujú vlastnosti súborov... Operačný systém umožňuje ich sledovanie a úpravu. Stav atribútov sa berie do úvahy pri vykonávaní automatických operácií so súbormi.

Existujú štyri hlavné atribúty:

· Len na čítanie(Iba na čítanie);

· Skryté(Skryté);

· Systémové(Systém);

· Archívne(Archív).

atribút " Len na čítanie" obmedzuje možnosť práce so súborom. Jeho inštalácia znamená, že súbor nie je určený na úpravu.

atribút " skrytý" signalizuje operačnému systému, že tento súbor nie je by sa mal zobraziť na obrazovke pri vykonávaní operácií so súbormi. Je to miera ochrany proti náhodnému (úmyselnému alebo neúmyselnému) poškodeniu súboru.

atribút " systémový" označené sú súbory, ktoré majú dôležité funkcie pre samotný chod operačného systému. Jeho charakteristickou črtou je, že ho nemožno zmeniť pomocou operačného systému. Väčšina súborov s príponou " systémový", majú tiež nastavený atribút „ skrytý".

atribút " archív" používané na spustenie zálohovacích programov v minulosti. Predpokladalo sa, že každý program, ktorý upravuje súbor, by mal tento atribút automaticky nastaviť a nástroj na zálohovanie by ho mal resetovať. Nasledujúcemu zálohovaniu teda podliehali iba tie súbory, pre ktoré bol tento atribút nastavený. Moderné zálohovacie programy používajú iné prostriedky na zistenie, či sa súbor zmenil, a tento atribút sa neberie do úvahy a jeho ručná zmena pomocou operačného systému nie je praktická.

Ukladanie súborov je organizované v hierarchickej štruktúre, ktorá je v tomto prípade tzv štruktúra súboru(obr. 1) .

Ryža. 1. Hierarchická štruktúra disku

Štruktúra súboru - hierarchická štruktúra, v ktorej operačný systém zobrazuje súbory a adresáre (priečinky).

Horná časť konštrukcie je názov prepravcu kde sú uložené súbory. Súbory sú potom zoskupené do adresáre (priečinky), v rámci ktorých možno vytvoriť podadresáre(obr. 1) .

Názvy externých pamäťových médií. Disky, na ktorých sú uložené informácie v počítači, majú svoje vlastné názvy - každý disk je pomenovaný písmenom latinskej abecedy a potom je vložená dvojbodka. Takže pre diskety sú písmená vždy priradené A: a V:... Logické jednotky pevného disku sú pomenované začínajúce písmenom S:... Za všetkými názvami logických jednotiek nasledujú názvy jednotiek CD-ROM. Napríklad nainštalované: disketová jednotka, pevný disk rozdelený na 3 logické jednotky a jednotka CD-ROM. Určite písmená všetkých médií. A:- disketová mechanika; S:, D:, E:- logické jednotky pevného disku; F:- CD-ROM mechanika.

Katalóg (priečinok) - miesto na disku (špeciálny systémový súbor), v ktorom sú uložené servisné informácie o súboroch (názov, prípona, dátum vytvorenia, veľkosť atď.)... Nízkoúrovňové katalógy sú vložené do katalógov vyšších úrovní a sú pre nich vnorené. Adresár najvyššej úrovne (nadadresár) vo vzťahu k adresárom nižšej úrovne sa nazýva rodič. Najvyššia úroveň vnorenia hierarchickej štruktúry je koreňový adresár disk (obr. 1). Zavolá sa adresár, s ktorým používateľ práve pracuje prúd.

Pravidlá pre pomenovanie adresára sú rovnaké ako pre pomenovanie súboru, aj keď nie je zvykom uvádzať prípony názvov adresárov. Pri zápise prístupovej cesty k súboru prechádzajúceho systémom podadresárov sú všetky medziadresáre oddelené určitým symbolom. Mnoho operačných systémov používa ako tento znak "\" (obrátené lomítko).

Požiadavka na jedinečnosť názvu súboru je zrejmá - bez toho nie je možné zaručiť jednoznačný prístup k údajom. Vo výpočtovej technike je požiadavka na jedinečnosť názvu zabezpečená automaticky – používateľ ani automatika nedokážu vytvoriť súbor s názvom zhodným s existujúcim.

Pri použití súboru mimo aktuálneho adresára musí program pristupujúci k súboru presne špecifikovať, kde sa súbor nachádza. To sa vykonáva zadaním cesty k súboru.

Cesta k súboru je názov média (disku) a postupnosť názvov adresárov oddelených znakom „\“ v OS Windows (v operačných systémoch UNIX sa používa znak „/“). Táto cesta určuje cestu do adresára, v ktorom sa nachádza požadovaný súbor.

Na určenie cesty k súboru sa používajú dve rôzne metódy. V prvom prípade je daný každý súbor absolútny názov cesty (úplný názov súboru), pozostávajúce z názvov všetkých adresárov od koreňového po ten, ktorý obsahuje súbor, a názvu samotného súboru. Napríklad cesta C: \ Abby \ Doc \ otchet.doc znamená, že koreňový adresár jednotky S: obsahuje adresár Abby ktorý zase obsahuje podadresár Docentom sa stal doc kde je súbor otchet.doc... Názvy absolútnych ciest vždy začínajú názvom média a koreňa a sú jedinečné. Platí a relatívna cesta. Používa sa spolu s konceptom aktuálny adresár. Užívateľ môže určiť jeden z adresárov ako aktuálny pracovný adresár. V tomto prípade sa všetky názvy ciest, ktoré nezačínajú znakom oddeľovača, považujú za relatívne a sú relatívne k aktuálnemu adresáru. Napríklad, ak je aktuálny adresár C: \ Abby potom do súboru s absolútnou cestou C: \ Abby \ možno riešiť ako Doc \ otchet.doc.

Súborové systémy... Každý súbor na disku má svoju vlastnú adresu. Aby ste pochopili princíp prístupu k informáciám uloženým v súbore, musíte vedieť zapisovať dáta na pamäťové médium.

Všetky moderné diskové operačné systémy poskytujú súborový systém na ukladanie a prístup k údajom na diskoch. Princíp organizácie súborového systému - tabuľkový... Na povrch pevného disku sa pozerá ako na trojrozmernú maticu, ktorej rozmery sú čísla povrch, valec a sektore.

Pred použitím je disk rozdelený na stopy a sektory ( naformátovaný). Z hľadiska vybavenia je označovanie proces zaznamenávania servisných informácií na nosič, označovanie konca a začiatku každého sektora.

Sektory sú bloky, v ktorých sú umiestnené dáta.Číslované od jednotky. Okrem informácií o používateľovi sektory obsahujú informácie o službách, napríklad ich vlastné číslo.

Dráha - sústredný kruh, po ktorom sa pohybujú čítacie a zapisovacie hlavy pri pohybe alebo vyhľadávaní údajov... Skladby sú očíslované od začiatku. Číslo nula je najvzdialenejšia stopa na disku.

Typická veľkosť sektora je 512 bajtov. Na jednej strane je 80 tratí. Každá stopa obsahuje 18 sektorov.

Pod valec sa chápe ako súhrn všetkých dráh patriacich rôznym povrchom a umiestnených v rovnakej vzdialenosti od osi otáčania... Fyzická štruktúra dátového úložiska je znázornená na obrázku 2.

Ryža. 2. Fyzická štruktúra ukladania informácií

Údaje o tom, kde je na disku zapísaný konkrétny súbor, sú špeciálne uložené v systémovej oblasti disku alokačné tabuľky súborov(TUK- tabuľky). Od porušenia TUK- tabuľka znemožňuje použitie údajov zaznamenaných na disku, sú na ňu kladené špeciálne požiadavky na spoľahlivosť a existuje v dvoch kópiách, ktorých identitu pravidelne kontrolujú nástroje operačného systému.

Najmenšou fyzickou jednotkou ukladania informácií je sektor. Od veľkosti TUK- tabuľka je obmedzená, potom pre disky väčšie ako 32 MB nie je možné poskytnúť adresovanie do každého jednotlivého sektora. V tomto ohľade sa skupiny sektorov konvenčne spájajú do zhlukov. Klaster je najmenšia jednotka adresovania informácií. Veľkosť klastra na rozdiel od veľkosti sektora nie je pevná a závisí od kapacity disku.

Ako už bolo spomenuté, informácie na diskoch sa zaznamenávajú v sektoroch pevnej dĺžky a každý sektor a umiestnenie každého fyzického záznamu (sektora) na disku je jednoznačne identifikované tromi číslami: čísla povrchu disku, valec a sektory na trati... A radič disku pracuje s diskom v týchto podmienkach. A používateľ chce používať nie sektory, valce a povrchy, ale súbory a adresáre. Preto je nejakým spôsobom potrebné pri práci so súbormi a adresármi na diskoch to previesť na činnosti, ktoré sú pre kontrolór zrozumiteľné: čítanie a zápis určitých sektorov disku. A na tento účel je potrebné stanoviť pravidlá, podľa ktorých sa tento preklad vykonáva, to znamená predovšetkým určiť, ako by sa mali informácie ukladať a organizovať na diskoch. Súbor týchto pravidiel je tzv systém súborov.

Systém súborov- ide o súbor konvencií, ktoré upravujú organizáciu údajov na pamäťových médiách... Prítomnosť týchto zmlúv umožňuje operačnému systému, iným programom a používateľom pracovať so súbormi a adresármi, a to nielen so sekciami (sektormi) diskov. Súborový systém definuje:

· Ako sú súbory a adresáre uložené na disku;

Aké informácie o súboroch a adresároch sú uložené;

· Ako zistíte, ktoré časti disku sú voľné a ktoré nie;

· Formát katalógov a iných servisných informácií na disku.

Ak chcete používať disky zapísané (rozdelené na oddiely) pomocou určitého súborového systému, operačný systém alebo špeciálny program musí podporovať tento súborový systém.

Najbežnejší súborový systém na IBM PC-kompatibilné počítače, bol predstavený už začiatkom 80. rokov v operačných systémoch MS DOS 1.0 a 2.0. Tento súborový systém je dosť primitívny, keďže bol vytvorený na ukladanie dát na diskety. Tento súborový systém sa zvyčajne nazýva TUK, keďže najdôležitejšou dátovou štruktúrou v nej je alokačná tabuľka súborov na disku, v angličtine - tabuľka prideľovania súborov, skrátené - TUK... Táto tabuľka obsahuje informácie o tom, ktoré parcely (zhluky) disk sú zadarmo a o reťazcoch klastrov, ktoré tvoria súbory a adresáre.

V súborovom systéme TUK názvy súborov a adresárov nesmú mať viac ako 8 znakov plus tri znaky v prípone názvu. Vedie k výrazným stratám (až 20 %) miesta na disku v dôsledku veľkých veľkostí klastrov na vysokokapacitných diskoch. Je to spôsobené tým, že na konci posledného klastra súboru je voľné miesto, v priemere rovnajúce sa polovici klastra. A na veľkých diskoch veľkosť klastra TUK môže mať až 32 kB . Teda na disku s kapacitou
2 GB s 20 000 súbormi by stratili 320 MB, teda približne 16 %. Nakoniec súborový systém TUK málo výkonné, najmä pre veľké disky, neprispôsobené na multitasking (všetky operácie vyžadujú volanie tabuľky prideľovania súborov, a preto nemôžete spustiť ďalšiu pred dokončením jednej operácie).

Pri vývoji Windows 95 firma Microsoft rozhodol nezaviesť nový súborový systém, ale opraviť existujúci súborový systém TUK tým, že vám umožní priradiť súbory a adresáre dlhý mená. Tento súborový systém sa stal známym ako TUKY 32... Prijaté v r Windows 95 tento prístup je dobrý, pretože vám umožňuje používať staré disky so súborovým systémom TUK- len začnú písať dlhé mená. Ale napriek tomu je toto riešenie dosť umelé a veľa programov je na opravu súborového systému diskov, "komprimáciu" diskov, zálohovanie atď. - môže viesť k strate dlhých mien na disku. TUKY 32 Podporuje menšie veľkosti klastrov pre efektívnejšie využitie miesta na disku.

Pri vývoji operačného systému Windows NT bol vytvorený nový súborový systém - NTFS... Bol zameraný na veľké disky obsahujúce veľa súborov a podnikol významné kroky na zabezpečenie efektívneho ukladania a kontroly prístupu. Tento súborový systém podporuje dlhé názvy súborov. Na logických jednotkách s kapacitou 1-2 GB je systém súborov NTFS umožňuje uložiť v priemere o 10-15% viac informácií ako TUK... A prístup k súborom v ňom je citeľne rýchlejší, najmä v prostredí multitaskingu.

Pri vytváraní súborového systému NTFS formátovač vytvorí súbor Hlavná tabuľka súborov(MTF) a ďalšie oblasti na ukladanie metadát. Použité metadáta NTFS implementovať štruktúru súborov. Prvých 16 záznamov v MTF rezervovaný sám NTFS... Umiestnenie súborov metadát je zaznamenané v zavádzacom sektore disku. Ak prvý záznam v MTF poškodený, NTFS prečíta druhý záznam, aby našiel kópiu prvého. Úplná kópia zavádzacieho sektora sa nachádza na konci zväzku. V MTF ukladajú sa metadáta, ako napríklad kópia prvých štyroch záznamov (zaručuje prístup k MTF v prípade poškodenia prvého sektora). MTF obsahuje informácie o zväzku - štítok a číslo verzie. V MTF obsahuje tabuľku názvov a popisov atribútov, koreňový adresár atď. Ďalšie riadky MTF obsahuje položky pre každý súbor a adresár nachádzajúci sa na danom zväzku. Vývojári NTFS pričom sme nezabudli na efektivitu, snažili sme sa zabezpečiť aj spoľahlivosť súborového systému a obnovu dát v prípade výpadkov. Na to najmä NTFS duplikuje všetky kritické informácie a zabezpečuje registráciu všetkých zmien na diskoch do špeciálneho log súboru, pričom pri každej zmene je zapamätaný aj spôsob jej zrušenia. V dôsledku toho takmer pri akomkoľvek zlyhaní NTFS automaticky obnoví. NTFS tiež (na rozdiel od TUK) dokáže pracovať s logickými jednotkami a súbormi väčšími ako 2 GB - maximálna veľkosť logických jednotiek a súborov je 4x10 18 bajtov.

Porovnávacie charakteristiky súborových systémov sú uvedené v tabuľke. 1. Ak súborový systém na disku nie je podporovaný týmto operačným systémom, potom budú všetky informácie na tomto disku nedostupné (samozrejme pri práci v tomto operačnom systéme). Pri takýchto logických diskoch buď nie je písmeno priradené vôbec (to znamená, že sa na disk nedá pristupovať), alebo sa pri akomkoľvek prístupe na disk zobrazí chybové hlásenie.

Špeciálny súborový systém určený pre disky CD ( CD-ROM). Ukázalo sa to nevyhnutné, pretože samotná fyzická štruktúra diskov CD nie je rovnaká ako štruktúra pevných diskov alebo diskiet: nezaznamenávajú informácie v kruhových stopách, ale v jednej špirálovej stope (ako zvukové disky CD). Tento súborový systém sa nazýva CDFS.

stôl 1

Porovnávacie charakteristiky súborových systémov

NTFS TUKY 32 TUK
Podporované operačné systémy Windows NT Service Pack 4, Windows 2000, Windows XP MS-DOS, Windows 95 OSR2, Windows 98, Windows Millennium Edition, Windows NT, Windows 2000, Windows XP
Možné veľkosti logických jednotiek Odporúčaná minimálna veľkosť logického disku (zväzku) je približne 10 MB. Veľkosti zväzkov nad 2 TB sú povolené. Nemožno použiť pre diskety Logický disk (objem) od 512 MB do 2 TB. Môže byť použitý pre diskety Logický disk (objem) do 4 GB. Môže byť použitý pre diskety
Možné veľkosti uložených súborov Maximálna veľkosť súboru je obmedzená iba veľkosťou zväzku Maximálna veľkosť súboru je 4 GB Maximálna veľkosť súboru je 2 GB
Súbory a štruktúry súborov

Logické časy externých pamäťových zariadení
Ku každému počítaču je možné pripojiť niekoľko externých pamäťových zariadení. Hlavným externým pamäťovým zariadením počítača je pevný disk. Zvyčajne je rozdelená do niekoľkých logické oddiely.

Viac logických oddielov na jednom pevnom disku poskytuje používateľovi nasledujúce výhody:


  • Operačný systém môžete uložiť do jedného logického oddielu a údaje do druhého, čo vám umožní preinštalovať operačný systém bez ovplyvnenia údajov;

  • Na rovnaký pevný disk v rôznych logických oddieloch možno nainštalovať rôzne operačné systémy;

  • Údržba jedného logického oddielu neovplyvňuje ostatné oddiely.

Externé úložné zariadenia a logické diskové oddiely majú logické meno.

V systéme Windows akceptované sú logické názvy pozostávajúce z latinského písmena a dvojbodky:


  • pre disketové jednotky (diskety) - A: a B:

  • pre pevné disky a logické oddiely –C :, D :, E: atď.

  • pre optické mechaniky názvy po pevných diskoch (napríklad F :)

  • Pre flash pamäť pripojenú k počítaču nasledujúci názov (napríklad G :)
Na OS Linuxďalšie pravidlá pre pomenovanie diskov sú akceptované:

  • Logické oddiely patriace prvému pevnému disku - názvy hda1, hda2 atď .;

  • Logické oddiely patriace druhému pevnému disku sa nazývajú hdb1, hdb2 atď.
Všetky programy a údaje sú uložené v externej pamäti počítača ako súbory.
^ Súbor Je pomenovaná oblasť externej pamäte.
Systém súborov Je súčasťou operačného systému, ktorá určuje spôsob organizácie, ukladania a pomenovania súborov na pamäťových médiách.
Súbor je charakterizovaný súborom parametrov (názov, veľkosť, dátum vytvorenia, dátum poslednej úpravy) a atribútmi, ktoré operačný systém používa na jeho spracovanie (archívny, systémový, skrytý, len na čítanie). Veľkosť súboru je vyjadrená v bajtoch.

Názov súboru zvyčajne pozostáva z dvoch častí oddelených bodkou: príslušný názov súbor a rozšírenie .

Názov súboru je daný používateľom. Príponu názvu zvyčajne nastaví program automaticky pri ukladaní súboru. Rozšírenie umožňuje používateľovi ho zadať a operačnému systému otvoriť súbor pomocou požadovanej aplikácie.
V operačnom systéme Windows sú v názve súboru zakázané nasledujúce znaky: \, /,:, *,?, , |. V systéme Linux sú tieto znaky okrem / platné.

Operačný systém Linux, na rozdiel od Windowsu, rozlišuje v názve súboru malé a veľké písmená: napríklad FILE.txt, file.txt a FiLe.txt sú v Linuxe tri rôzne súbory.

Najbežnejšie typy súborov a prípony sú:


Typ súboru

Príklady rozšírenia

Systémový súbor

drv, sys

Textový súbor

txt, rtf, doc, docx, odt

Grafický súbor

bmp, gif, jpg, tif, png, psd

webstránka

htm, html

Zvukový súbor

wav, mp3, midi, kar, ogg

Video súbor

avi, mpeg

archív

zips, rar

Tabuľkový hárok

xls, ods

Programový kód (text) v programovacích jazykoch

bas, pas

V OS Linux sa rozlišujú nasledujúce typy súborov:


  • bežné súbory - súbory s programami a údajmi

  • adresáre - súbory obsahujúce informácie o adresároch

  • odkazy - súbory obsahujúce odkazy na iné súbory

  • špeciálne súbory zariadení – súbory, ktoré predstavujú fyzické zariadenia počítača (pevné disky, optické jednotky, tlačiarne, reproduktory atď.)

Katalógy
Každý počítač alebo pamäťové médium môže obsahovať veľké množstvo súborov. Pre pohodlie pri vyhľadávaní informácií sú súbory zoskupené podľa určitých kritérií, tzv katalógov alebo priečinky .
Adresáre tiež dostanú svoj vlastný názov. Samotný adresár môže byť súčasťou iného externého adresára. Každý adresár môže obsahovať veľa súborov a podadresárov.

Katalóg Je pomenovaná kolekcia súborov a podadresárov (podadresárov).
Nazýva sa adresár najvyššej úrovne koreňový adresár .

Vo Windowse má každé informačné médium koreňový adresár, ktorý je vytvorený operačným systémom bez zásahu používateľa. Koreňové adresáre sa označujú pridaním znaku „\“ (obrátená lomka) k logickému názvu príslušného externého pamäťového zariadenia: A: \, C: \, B: \ atď.

V Linuxe adresáre pevných diskov alebo ich logické oddiely nepatria do najvyššej úrovne súborového systému (nie sú to koreňové adresáre). Sú "namontované" v adresári mnl. Ostatné externé úložné zariadenia (disketové, optické a flash disky) sú „namontované“ v adresári médií. Adresáre mnt a media sú zase „pripojené“ do jedného koreňového adresára, ktorý je označený znakom „/“ (lomka).

Štruktúra súboru disk je súbor súborov na disku a vzťahy medzi nimi.

Štruktúry súborov sú jednoduché a viacúrovňový(hierarchický).

Jednoduché štruktúry súborov možno použiť pre disky s malým (až niekoľko desiatok) počtom súborov. V tomto prípade je TOC disku lineárna postupnosť názvov súborov.
Hierarchické štruktúry súborov slúžia na ukladanie veľkého (stovky a tisícky) súborov. Hierarchia je usporiadanie častí (prvkov) celku v poradí od najvyššej po najnižšiu.

Nazýva sa grafické znázornenie hierarchickej štruktúry súborov strom .

Ak chcete odkazovať na požadovaný súbor uložený na nejakom disku, môžete zadať cestu k súboru - názvy všetkých adresárov od koreňového po ten, v ktorom sa súbor priamo nachádza.

Cesta k súboru a názov súboru sa zapisujú postupne celý názov súboru .
Príklad úplného názvu súboru v systéme Windows:

E: \ obrázky \ fotografie \ výlet.jpeg