Yau n umenie vizualizácie v podnikaní. Nathan Yau: Umenie vizualizácie v podnikaní. Ako prezentovať zložité informácie jednoduchým spôsobom

  • 27.06.2020

Own pomáha každému človeku odhaliť jeho potenciál, núti ho veriť vo svoje silné stránky, schopnosti, zvyšuje zodpovednosť za každé prijaté rozhodnutie. Biznis ale dlho nevydrží, nepoužívajte v ňom metódu vizualizácie, ktorej výsledky ho motivujú nazývať sa umením.

Vizualizácia v podnikaní: prvé kroky

  1. Ak chcete získať skúsenosti s vytváraním vlastného ziskového podnikania, osvojte si podnikateľské zručnosti, ktoré budú vašou záchranou pri rozbiehaní vlastného podnikania. Zároveň, keď sa učíte niečo nové, verte tomu, čo je na vašej strane, a nedovoľte, aby pochybnosti ostatných vo vás zničili vieru v seba.
  2. Pamätajte, že myšlienka plodí činy. Preto je pri vizualizácii obchodných procesov také dôležité na chvíľu prijať stelesnenie myšlienky, ktorá sa pred chvíľou objavila vo vašej mysli.
  3. Nepočítajte s tým, že si zoberiete úver. Neprogramujte svoju myseľ tak, aby žila na dlh. Ak bude mať projekt dobrý výsledok pre vašu peňaženku, nebudete si musieť lámať hlavu nad zdrojmi počiatočného kapitálu. Vesmír vám vždy ponúka príležitosť. Ostáva už len kúpiť si lístok.
  4. Keď si idete za svojím snom o vlastnom podnikaní, analyzujte prekážky, ktoré vám prídu do cesty. Koniec koncov, z akéhokoľvek zlyhania si môžete vziať pozitívnu stránku pre seba.
  5. Pred prepnutím do biznis módu sa poistite finančným zabezpečením. Môže to byť vo forme bankového účtu vo výške vašej mzdy za posledných šesť mesiacov.
  6. Vždy hľadajte nové nápady alebo vylepšujte tie existujúce, pričom si pamätajte, že všetko, čo chcete, nedostanete cez noc. Takúto mannu z neba si musíte zaslúžiť vlastnou vytrvalosťou, sebavedomím a pozitívnym myslením.

Prvýkrát som sa s potrebou zostavovať grafy a tabuľky nie ručne, ale pomocou Excelu alebo Accessu, stretol v treťom ročníku na univerzite, keď začínala štatistika a makroekonómia. Odvtedy sa práca s dátami za 9 rokov posunula vpred, no už neexistujú kvalitné krásne diagramy, informačné schémy a „výplatné tabuľky“. Ani domáce médiá nie vždy využívajú vizuálne zobrazenie čísel a faktov v televízii a na internete. Hoci ide o vizuálne informácie, ktoré ľudia vnímajú najlepšie a najrýchlejšie. Kniha, ktorá mi dnes leží na stole, nie je len konštatovaním tejto skutočnosti, ale odbornou učebnicou pre tých, ktorí si „stĺpy“ a „rebríky“ každý deň kreslia a zarábajú si tým na živobytie.

Nathan Yau

Venuje sa písaní článkov a tvorbe rôznych grafík pre tematický obsahový projekt FlowingData (venuje sa vizualizácii dát, štatistickým poliam a dizajnu). Získal magisterský titul, obhájil dizertačnú prácu na tému vizualizácia osobných údajov. Napísal aj knihu Dátové body: Vizualizácia, ktorá niečo znamená. S jeho experimentmi v oblasti vizuálnej prezentácie informácií sa môžete zoznámiť na stránkach flowingdata.com

Prvý dojem z knihy

Vezmete ho do rúk a pochopíte, že pred vami nie je len darčekový album krásnych infografík, ale solídna učebnica. V skutočnosti by študentom technických aj humanitných univerzít takáto kniha prospela viac ako nudné prednášky o diagramovaní. Názorné príklady, algoritmy a podrobné pokyny sú rozdelené do sekcií v závislosti od toho, aké údaje a v akej forme chcete publiku zobraziť.

Najužitočnejšie

V skutočnosti si nemôžete prečítať celú knihu od začiatku do konca, ale iba kapitolu alebo podkapitolu, ktorú aktuálne potrebujete na prípravu podkladov pre vašu prezentáciu, prejav na konferencii alebo jednoducho na prediskutovanie nápadov s kolegami.

A potom je nepravdepodobné, že by ste opäť ohradili prezentácie pomocou „textových listov“.

Pri čítaní tejto knihy chápete, že neexistuje veľa informácií: existuje ich nesprávna interpretácia. Dôležité je predsa nielen načrtnúť kopec čísel. Dôležité je ukázať, o čom presne všetky tabuľky a grafy, ktoré vytvoríte, hovoria.

Nathan Yau vysvetľuje, kde nájsť potrebné údaje, ako ich naformátovať, spracovať a pripraviť na správnu vizualizáciu, ako aj aký softvér použiť na tento účel.

Nechýbajú ani praktické ukážky vizualizácie dát pomocou R a Adobe Illustrator, HTML, CSS a JavaScript. Pre tých najnáročnejších obchodníkov a analytikov sú tu dokonca aj návody na vytváranie interaktívnych máp založených na Pythone, SVG, ActionScript a Flash.

Komu čítať

Obchodníci – aby ste pochopili, ako správne grafy a diagramy ovplyvňujú vašich zákazníkov a používateľov. A tiež robiť krásne prezentácie.

Pre startupy – robiť krásne prezentácie nielen kvôli prezentácii, ale aj kvôli prezentovaniu zmyslu (finančného a manažérskeho) v stráviteľnej forme. A tiež získať investorov.

Novinári – ak pracujete v oblasti investigatívnej žurnalistiky a dátovej žurnalistiky, potom je prečítanie tejto knihy nevyhnutnosťou.

Dizajnéri – myslím si, že je prehnané vysvetľovať, prečo dizajnéri potrebujú knihu o vizualizácii údajov, a to aj so súborom lekcií.

O čom je táto kniha

Autor vysvetľuje, kde môžete dáta nájsť, ako ich naformátovať, spracovať a pripraviť na vizualizáciu, čo hľadať v dostupných obrázkoch a grafoch, aké programy použiť. Popisuje vizualizačné techniky, spôsoby štruktúrovania informácií podľa typu údajov a podľa typu...

Prečítajte si úplne

O čom je táto kniha
Ako stručne a zrozumiteľne opíšete svoje predstavy pri príprave na stretnutie, stretnutie alebo prezentáciu? Ako vtesnať 10 tabuliek, 20 grafov a 2 ďalšie prehľady do 15 prezentačných snímok? Odpoveď: tieto údaje musíte spracovať a dať im inú vizuálnu podobu.

V šikovných rukách množstvo informácií nie je problém, ale skutočný sklad. Veď zaujímavé nie sú samotné čísla, ale informácie, ktoré sa z nich dajú vytiahnuť. Ľudia chcú presne vedieť, o čom všetky tieto tabuľky a grafy hovoria. Ak im to pomôžete zistiť, budete ako špecialista veľmi žiadaní.

Osvojte si techniky vizualizácie - a naučíte sa pracovať s informáciami, začnite jasne a sebavedomo vyjadrovať svoje myšlienky.

Autor vysvetľuje, kde môžete dáta nájsť, ako ich naformátovať, spracovať a pripraviť na vizualizáciu, čo hľadať v dostupných obrázkoch a grafoch, aké programy použiť. Popisuje techniky vizualizácie, spôsoby štruktúrovania informácií podľa typu údajov a typu príbehu.

V každom z prípadov zistíte, pomocou akého softvéru je pohodlnejšie spracovávať informácie. Preskúmajte príklady vykresľovania v R a Adobe Illustrator, HTML, CSS a JavaScript. Taktiež sa v knihe zoznámite s využitím Flash grafiky pre potreby vizualizácie, naučíte sa vytvárať mapy pomocou Pythonu a SVG a animované mapy v ActionScripte a Flashi.

Pre koho je táto kniha určená?
Pre projektových manažérov, analytikov, konzultantov, marketérov. Jedným slovom pre tých, ktorí pracujú s veľkým množstvom informácií, pre ktorých je dôležité ich efektívne spracovať, kvalitne vizualizovať a samozrejme pomocou svojich tabuliek, grafov a pod. grafov.

Prečo sme sa rozhodli vydať túto knihu
Pretože obsahuje desiatky nápadov a spôsobov, ako kreatívne a vizuálne vyrozprávať svoj príbeh pomocou údajov. Takúto pomoc by mal mať vo výzbroji každý, kto považuje informácie za svoj každodenný chlieb.

Knižný čip
Kniha je postavená na praktických príkladoch: ako sa používajú rôzne programy na riešenie konkrétnych problémov. Môže sa čítať postupne alebo selektívne, na samostatné témy. Je obzvlášť efektívne robiť to pred otvoreným počítačom, aby ste si okamžite osvojili opísané techniky.

Skryť

„Nathan Yau Umenie vizualizácie v podnikaní Ako prezentovať zložité informácie v jednoduchých obrázkoch Nathan Yau Preložené z...“

-- [ Strana 1 ] --

Sprievodca dizajnom FlowingData,

Vizualizácia a štatistika

Umenie vizualizácie v podnikaní

Ako prezentovať zložité informácie v jednoduchých obrázkoch

Nathan Yau

Preklad z angličtiny Svetlana Kirova

Vydavateľstvo "Mann, Ivanov a Ferber"

BBK 65 291,34

Publikované so súhlasom spoločnosti John Wiley & Sons International Rights Inc.

a agentúry Alexandra Korženěvského.

Prvýkrát publikované v ruštine

Я88 Umenie vizualizácie v podnikaní. Ako prezentovať zložité informácie v jednoduchých obrázkoch / Nathan Yau; za. z angličtiny. Svetlana Kirová. - M. : Mann, Ivanov a Ferber, 2013. - 352 s.

Vizualizácia v podnikaní je schopnosť prezentovať dáta tak, aby ste ich mohli rýchlo analyzovať, efektívne prezentovať a samozrejme aplikovať v živote. Po prečítaní tejto knihy sa naučíte zbierať a formátovať informácie, vytvárať z nich kvalitné tabuľky, grafy a mapy.

Pomocou Adobe Illustrator na účely vizualizácie, interaktívnej grafiky s HTML, CSS, JavaScript, Flash grafiky a máp vytvorených v R, Pythone a SVG môžete kreatívne prezentovať svoje dáta a rozprávať s nimi pútavé príbehy.

Pre tých, ktorí pracujú s množstvom informácií: projektoví manažéri, analytici, konzultanti, marketéri.



MDT 65.012.2 LBC 65.291.34 Všetky práva vyhradené. Žiadna časť tejto publikácie nesmie byť reprodukovaná za žiadnym účelom v akejkoľvek forme alebo akýmikoľvek prostriedkami, elektronickými alebo mechanickými, vrátane fotokopírovania a nahrávania na magnetické médiá, bez písomného súhlasu vydavateľa.

Právnu podporu vydavateľstvu poskytuje advokátska kancelária „Vegas-Lex“

© Nathan Yau, 2011 ISBN 978-5-91657-737-2 © vydanie. Preklad. Dizajn OOO Mann, Ivanov & Ferber, 2013 .... 7 Úvod .................................. ............................................................. ......... 9 1 Ako vyrozprávať príbeh s údajmi.............. ..

–  –  –

O technickom redaktorovi Kim Rees je spoluzakladateľom spoločnosti Periscopic, spoločensky zodpovednej firmy na vizualizáciu informácií. Samotná Kim je v kruhu profesionálov v oblasti vizualizácie známou osobnosťou. Má sedemnásťročné skúsenosti v oblasti interaktívnych médií. Publikovala v Journal of Information Mapping a InfoVIS 2010 Proceedings a vystúpila na mnohých konferenciách a fórach, vrátane konferencie O'Reilly Strata Conference, WebVisions, AIGA Shift a Portland Data Visualization. Bakalársky titul z informatiky

získala na New York University. Jej spoločnosť Periscopic bola uvedená v CommArts Insights a Success Stories na webovej stránke Adobe a jej práca vyhrala VAST Challenge, CommArts Web Picks a Communication Arts Interactive Annual Award. Dizajn Periscopic bol nedávno nominovaný na Národnú cenu za dizajn Cooper-Hewitt.

Poďakovanie Táto kniha by nebola možná bez práce dátových vedcov, ktorí pokračujú vo vytváraní užitočných open source nástrojov pre verejnosť. Tieto softvérové ​​produkty vývojárov mi veľmi uľahčujú život a som si istý, že nás budú aj naďalej udivovať – inováciám sa medze nekladú.

Chcem sa poďakovať aj čitateľom FlowingData, ktorí mi pomohli spojiť sa s viacerými ľuďmi, než som si vôbec dokázal predstaviť. Predovšetkým kvôli nim som si sadol k napísaniu tejto knihy.

Tiež by som sa chcel poďakovať vydavateľstvu Wiley, že mi umožnilo napísať knihu tak, ako som chcel, a Kim Rijs za pomoc, aby sa táto kniha oplatila prečítať.

Na záver by som sa chcel poďakovať svojej manželke a rodičom za podporu, ktorí ma vždy povzbudzovali, aby som našiel to, čo ma robí šťastným.

Mojej milujúcej žene Biy Úvod Nedá sa povedať, že dáta sú niečo nové. Ľudia merali a zapisovali do tabuliek po stáročia. Avšak v posledných rokoch – odkedy som začal písať pre FlowingData, moju stránku pre dizajn, vizualizáciu a štatistiku – som v tejto oblasti zaznamenal skutočný boom bez konca.

Vďaka technologickému pokroku je zhromažďovanie a ukladanie údajov mimoriadne jednoduché a sieť vám k nim umožňuje prístup kedykoľvek chcete. Toto množstvo údajov v dobrých rukách môže byť baňou informácií, ktoré vám pomôžu robiť inteligentnejšie rozhodnutia, presvedčivejšie prezentovať vaše nápady a vytvoriť objektívnejší pohľad na to, ako ľudia vnímajú svet a seba.

Významný posun vo zverejňovaní vládnych údajov nastal v polovici roku 2009, keď Spojené štáty americké spustili portál Data.gov. Ide o komplexný katalóg informácií poskytovaných federálnymi ministerstvami a agentúrami a demonštruje transparentnosť a zodpovednosť všetkých týchto organizácií a úradníkov. Stránka bola vytvorená s cieľom poskytnúť občanom krajiny možnosť zoznámiť sa s tým, na čo úrady míňajú daňové príjmy. Predtým však vláda pripomínala skôr čiernu skrinku. Významná časť údajov na Data.gov bola predtým vo verejnej doméne - bola na webových stránkach oddelení, ale tie boli roztrúsené po celom webe. Teraz sú všetky informácie zhromaždené na jednom mieste a naformátované tak, aby ich analýza a vizualizácia boli oveľa jednoduchšie. A podobný portál má aj Organizácia spojených národov – UNdata. Netrvalo dlho a Spojené kráľovstvo nasledovalo svoj príklad so svojím Data.gov.uk. Veľké mestá sveta ako New York, San Francisco a Londýn sú tiež poskytovateľmi množstva údajov.

K objaveniu komunitného webu veľkou mierou prispel aj vznik tisícok aplikačných programovacích rozhraní (API). Cieľom bolo rozveseliť vývojárov a nalákať ich, aby so všetkými týmito dátami niečo urobili. Aplikácie ako Twitter a Flickr majú bohaté rozhrania API, ktoré umožňujú vytvárať používateľské rozhrania, ktoré sú úplne odlišné od tých, ktoré vidíte na samotných stránkach. ProgrammableWeb, API katalogizačný zdroj, ich má viac ako 2000. Nedávno sa objavili nové aplikácie, ako napríklad Infochimps a Factual, navrhnuté špeciálne na poskytovanie štruktúrovaných údajov.

Ak sa nazbieralo toľko údajov – v obchodoch, skladoch a databázach – znamená to, že situácia je zrelá na to, aby sa objavili ľudia, ktorí sú schopní im porozumieť. Samotné údaje nie sú až také zaujímavé (aspoň nie pre väčšinu ľudstva). Zaujímavé sú informácie, ktoré možno z týchto údajov získať. Ľudia chcú vedieť, čo hovoria ich údaje, a ak im v tom môžete pomôcť, budete veľmi žiadaní. To je dôvod, prečo Hal Varian, hlavný ekonóm spoločnosti Google, hovorí, že štatistik je najsexi práca nadchádzajúceho desaťročia, a to nie preto, že by štatistici boli takí krásni. (Aj keď sa na nás pozriete cez optiku geeky* chic, sme v podstate nič.) Vizualizácia Jedným z najlepších spôsobov, ako preskúmať veľkú databázu a pokúsiť sa jej pochopiť zmysel, je vizualizácia. Vložte čísla do viditeľného priestoru a nechajte mozog – váš alebo vašich čitateľov – identifikovať vzory. V tomto biznise sme všetci majstri. Budete môcť vidieť príbehy, ktoré ste možno nikdy nevideli, len pomocou formálnych štatistických metód.

John Tukey, môj obľúbený štatistik a otec prieskumnej analýzy údajov, rozumel štatistickým metódam a vlastnostiam ako málokto a veril, že aj grafické metódy majú legitímne právo na existenciu. Bol hlboko presvedčený, že obrázky nám môžu odhaliť nečakané. Z údajov sa môžete veľa naučiť len ich vizualizáciou a v niektorých prípadoch je to všetko, čo musíte urobiť, aby ste urobili informované rozhodnutie alebo vyrozprávali príbeh.

Napríklad v roku 2009 zaznamenali Spojené štáty americké výrazné zvýšenie miery nezamestnanosti. V roku 2007 bola v priemere 4,6 percenta, v roku 2008 stúpla na 5,8 percenta a do septembra 2009 dosiahla 9,8 percenta. Tieto národné priemery však vypovedajú len časť príbehu. Toto je zhrnutie USA ako celku. Možno však existovali regióny, v ktorých bola miera nezamestnanosti vyššia ako na iných miestach? Možno existovali regióny, ktoré tento problém vo všeobecnosti obišiel?

Mapy zobrazené na obr. 0.1, povedzte plnú verziu tohto príbehu, stačí si ich pozrieť a môžete odpovedať na otázky z predchádzajúceho odseku.

Tmavšie sfarbené okresy sú oblasti, kde bola miera nezamestnanosti relatívne vysoká, zatiaľ čo svetlé okresy boli relatívne nízke. V roku 2009 už vidíte veľa regiónov na západe, kde miera nezamestnanosti stúpla nad 10 percent. Rovnaká situácia sa vyvinula vo väčšine regiónov na východe. Regióny Stredozápadu však boli postihnuté menej (pozri obrázok 0.2).

–  –  –

Ryža. 0,1. Mapy zobrazujúce mieru nezamestnanosti v USA od roku 2004 do roku 2009

Ryža. 0,2. Mapa zobrazujúca mieru nezamestnanosti v roku 2009

12 ÚVOD

–  –  –

to znamená, že v tabuľke nie je ľahké porozumieť údajom a všetko, čo z nich môžete získať, sú jednotlivé hodnoty. Ale v grafickej verzii si môžete ľahko všimnúť trendy a vzory a urobiť porovnanie na prvý pohľad.

Poskytovatelia správ ako New York Times a Washington Post odvádzajú skvelú prácu pri zvyšovaní dostupnosti a viditeľnosti údajov.

Pravdepodobne využívajú všetky tieto otvorené informácie lepšie ako mnohí iní a každý deň rozprávajú čitateľom viac a viac nových príbehov.

Niekedy sa dátové grafy používajú na obohatenie príbehu o iný uhol pohľadu a inokedy grafy v skutočnosti rozprávajú celý príbeh.

S rozvojom online médií sa tabuľky a grafy stali ešte bežnejšími. Dnes majú spravodajské spoločnosti špeciálne služby, ktoré sa zaoberajú iba interaktívnymi prvkami, alebo iba schémami alebo iba mapami. Napríklad New York Times má dokonca redakciu venovanú výlučne tomu, čo nazývajú „počítačové spravodajstvo“.

Tamojší novinári sa špecializujú na spravodajstvo s číslami. A grafickému oddeleniu v New York Times nie je cudzie narábanie s obrovským množstvom údajov.

Vizualizácia sa dostala aj do popkultúry. Vizualizačná firma Stamen Design, známa svojimi online interaktívnymi prvkami, pripravovala Figure na slávnostné odovzdávanie výročných cien v posledných rokoch. 0,4. Grafický pohľad na údaje z tweetov „Statistical Yearbook United MTV Video Music Awards“. štáty"

14 ÚVOD

–  –  –

čierna, biela a červená sa rovná vydávaniu komunistických novín alebo zabitiu pandy. Data Underload, séria vtipných príspevkov, ktoré uverejňujem na FlowingData, je môj vlastný pohľad na tento žáner. Každý deň robím pozorovania a uverejňujem ich vo forme diagramov. Na obr. 0,5 ilustruje citáty zo slávnych filmov zaradených do hodnotenia Amerického filmového inštitútu. Ukázalo sa niečo úplne smiešne, ale vtipné (aspoň pre mňa).

Čo je teda vizualizácia? Všetko závisí od toho, s kým sa rozprávate.

Niektorí ľudia tvrdia, že vizualizácia sú tradičné diagramy a grafy. Iní sú liberálnejší. Pre nich všetko, čo môže ilustrovať údaje, je vizualizácia a nezáleží na tom, čo to je: umelecké dielo alebo tabuľka v programe Microsoft Excel. Osobne sa prikláňam skôr k tomu druhému, aj keď občas sa ocitnem medzi členmi prvej skupiny. Nakoniec to nie je až také dôležité. Robte len to, čo funguje pre vaše účely.

Nech už sa rozhodnete pre akúkoľvek definíciu vizualizácie, keď začnete vytvárať diagramy pre svoju prezentáciu, analyzovať veľké množstvo digitálnych informácií od inej verejnosti alebo pripravovať spravodajskú správu obsahujúcu nejaké údaje, skončíte so sériou „Nehľadať pravdu . V určitom okamihu sa lži a štatistiky stali takmer synonymami, ale v skutočnosti došlo k dodatočnému načítaniu údajov “

neklamú čísla. Ľudia, ktorí používajú čísla, klamú. Niekedy to robia zámerne ("Data Underload"), implementujúc nejaký druh plánu, ale vo väčšine prípadov sa to stane neúmyselne. Keď na webovej stránke FlowingData zistíte, že neviete, ako správne zostaviť graf alebo ako nestranne prezentovať údaje, na adrese: http:// je vysoká pravdepodobnosť, že budete mať nejaký druh výpisu informácií, ktorý poskytuje datafl.ws /podceňujte úplne prekrútený pohľad na realitu . Ak sa však naučíte dobré vizualizačné techniky a naučíte sa pracovať s údajmi, budete môcť s istotou komunikovať svoje nápady a tešiť sa zo svojich objavov.

Ako sa naučiť pracovať s dátami Štatistiku som začal študovať v prvom ročníku vysokej školy. Bol to povinný predmet pre neštatistiku v odbore elektrotechnika. Počul som veľa hororových príbehov, ale na rozdiel od učiteľov opísaných v týchto príbehoch sa môj profesor ukázal ako veľký nadšenec pre svoju prácu a robil to so zjavným potešením.

Počas čítania svojich prednášok sa rýchlo pohyboval hore a dole po schodoch sály a rozvážne gestikuloval, čím udrel študentov, ktorých míňal. Do toho dňa si myslím, že som nemal inšpirovanejšieho učiteľa a určite ma to ovplyvnilo – začal som fascinovať svet dát. Vysokú školu som skončil o štyri roky neskôr ako štatistik.

Počas môjho bakalárskeho štúdia sa štatistiky pre mňa týkali analýzy údajov, distribúcie a testovania hypotéz, a to sa mi páčilo. Bolo zábavné pozerať sa na 16 ÚVOD

–  –  –

Ak ste za celý svoj život nenapísali ani riadok kódu, potom sa vám R* – výpočtové prostredie obľúbené mnohými štatistikami – môže zdať odstrašujúce. Ale po preštudovaní niekoľkých príkladov to rýchlo pochopíte. Táto kniha vám s tým pomôže.

Hovorím vám to, pretože som sa tak naučil. Pamätám si, keď som sa prvýkrát ponoril do dizajnových aspektov vizualizácie. Bolo to v lete po druhom ročníku na postgraduálnej škole, keď som dostal prekvapivú správu, že ma prijali na stáž ako grafický editor v New York Times. Dovtedy bola grafika pre mňa vždy len nástrojom analýzy (vrátane stĺpcových grafov na školskom vedeckom veľtrhu) a na estetike a dizajne veľmi nezáležalo, ak mi na nich vôbec záležalo. Nikdy by mi nenapadlo, aká dôležitá je úloha dát v žurnalistike.

Aby som sa pripravil na stáž, prečítal som si každú knihu o dizajne, ktorá sa mi dostala pod ruku, a prehrabal som sa používateľskou príručkou Adobe Illustrator, pretože som vedel, že je to program, ktorý používa New York Times. Ale až keď som skutočne začal robiť tabuľky a grafy, naučil som sa naozaj čokoľvek. Učením v zamestnaní budete nútení veľmi rýchlo získať vedomosti a zručnosti potrebné v podnikaní. A keď budete pracovať s čoraz väčším počtom súborov údajov a vytvárať stále viac a viac diagramov, vaše schopnosti sa budú rozvíjať aktívnejšie.

Ako čítať túto knihu Táto kniha je postavená na príkladoch a je napísaná tak, aby vám poskytla vedomosti, ktoré potrebujete na vytváranie rôznych informačných grafov od začiatku do konca. Môžete si to prečítať od začiatku do konca, alebo si môžete vziať iba nápady, ktoré potrebujete, ak už máte nejaké údaje alebo ak vlastníte nejaké metódy vizualizácie. Kapitoly sú usporiadané tak, aby príklady v nich boli samostatné a sebestačné. Ak ste v tejto oblasti nováčik, prvé kapitoly vám budú obzvlášť nápomocné. Povedia vám, ako pristupovať k údajom, ktoré máte, čo v nich hľadať a aké nástroje použiť. Dozviete sa, kde presne nájdete dáta a ako ich naformátovať a pripraviť na vizualizáciu. Nasledujú vizualizačné techniky, štruktúrované podľa typu údajov a podľa typu príbehu, ktorý s nimi môžete rozprávať. Ale pamätajte: vždy by mali hovoriť samotné údaje.

Bez ohľadu na to, aký prístup si zvolíte pri čítaní tejto knihy, dôrazne vám odporúčam, aby ste si ju prečítali pri sedení pri pracovnom počítači, aby ste si príklady prešli krok za krokom a prezreli si všetky zdroje uvedené v poznámkach a odkazoch. Môžete si tiež stiahnuť kódy a dátové súbory a vyskúšať funkčné ukážky na http://www.wiley.com/go/visualizethis a http://book.flowingdata.com.

Aby bolo vyššie uvedené veľmi jasné, na obr. 0.6 Predkladám vám schému, ktorá vám pomôže pochopiť, čo presne potrebujete. Príjemnú zábavu!

* R - programovací jazyk pre štatistické spracovanie údajov a grafiku; bezplatné a open source softvérové ​​prostredie. Poznámka. za.

18 ÚVOD Obr. 0,6. Kde začať čítať túto knihu Ako vyrozprávať príbeh s údajmi Zamyslite sa nad všetkými populárnymi knihami o vizualizácii, o ktorých počujete na prednáškach alebo v blogových príspevkoch, a o tých, ktoré vám napadli práve teraz pri behu tvoje oči nad týmito riadkami. Čo majú všetky spoločné? Všetky rozprávajú zaujímavé príbehy. Možno vás tieto príbehy mali o niečom presvedčiť. Alebo vás možno donúti niečo urobiť, predstaví vám nové informácie alebo vás prinúti prehodnotiť svoje zaužívané predstavy o realite.

Nech je to už akokoľvek, skutočne dobrá vizualizácia údajov – bez ohľadu na to, aká veľká alebo malá, vytvorená z lásky k umeniu alebo na prezentáciu – vám pomôže presne pochopiť, čo môžu údaje povedať.

20 KAPITOLA 1: ROZPRÁVANIE PRÍBEHU S ÚDAJMI

–  –  –

Raz som venoval jeden deň úlohe overiť tri čísla z celého radu údajov, a to všetko preto, že keď grafické oddelenie New York Times vytvára graf, musí sa uistiť, že informácie sú presné. Až po uistení sa o spoľahlivosti prijatých informácií sme pristúpili k vytvoreniu prezentácie. Práve táto pozornosť venovaná detailom robí grafiku v týchto novinách tak dobrou.

Pozrite sa na akúkoľvek tabuľku alebo diagram v New York Times. Údaje v ňom sú vždy podané stručne, jasne a mimoriadne krásne. Čo to však znamená? Keď sa pozriete na infografiku, získate prehľad o údajoch. Dôležité body alebo oblasti sú doplnené komentármi; symboly a farby sú prehľadne vysvetlené v legende alebo v poznámkach; The Times tiež zabezpečuje, aby bol príbeh obsiahnutý v údajoch pre publikum ľahko čitateľný. Už to nie je len diagram alebo diagram. Toto je grafika.

Grafika znázornená na obr. 1.1 je podobný tomu, ktorý nájdete v New York Times. Ukazuje, ako sa zvyšuje pravdepodobnosť, že v budúcom roku zomriete, v závislosti od vášho veku.

Ryža. 1.1. Pravdepodobnosť úmrtia na základe vášho veku

22 KAPITOLA 1: ROZPRÁVANIE PRÍBEHU S ÚDAJMI

–  –  –

Pozrite si blog OkTrends, kde nájdete ďalšie zaujímavé informácie o online zoznamovaní, ako napríklad to, čo sa bielym ľuďom naozaj páči a ako sa nemýliť: http://blog.

–  –  –

Ryža. 1.4. Gapminder Fund Trendalizer Z hľadiska vizualizácie je tu všetko celkom elementárne. Je to len dynamický graf. Bubliny predstavujú rôzne krajiny a pohybujú sa podľa dynamiky chudoby v konkrétnej krajine počas daného roka.

Aké je teda tajomstvo popularity Roslingovho vystúpenia? Že hovorí s presvedčením a vzrušením. Rozpráva príbeh. Koľkokrát ste už videli prezentácie s diagramami a diagramami, pri ktorých každý zíva?! Ale Rosling je iný. Vytiahol význam údajov a odhalil ich naplno. A ak k tomu pripočítame prehltnutie meča na konci prednášky, všetko do seba zapadne – nikto nezostáva v sále ľahostajný. Po zhliadnutí Roslingovej prednášky som chcel tieto údaje vziať do rúk a sám ich preskúmať. Nevedela som sa dočkať, kedy sa do tohto príbehu ponorím hlbšie.

Neskôr som si pozrel ďalšiu prezentáciu Gapminder Foundation na rovnakú tému, s rovnakou formou vizualizácie dát, ale s iným rečníkom. Ukázalo sa, že to nie je také vzrušujúce.

Úprimne povedané, skoro som zaspal. Emócie boli nulové. Údaje sa mi nezobrazili.

26 KAPITOLA 1: ROZPRÁVANIE PRÍBEHU S ÚDAJMI

–  –  –

koľko bodov sa zmení za deň? A o týždeň? A o mesiac? Existujú obdobia, v ktorých sa sadzba zvýšila viac ako zvyčajne? A ak áno, prečo sa to stalo? Vyskytli sa nejaké udalosti, ktoré mohli vyvolať takéto zmeny?



Ako sami uvidíte, stojí za to začať jedinou otázkou, ktorá sa berie ako východiskový bod, a nasledujúce budú hneď nasledovať. A to nie je len prípad časových radov, ale všetkých typov údajov. Skúste k svojmu súboru údajov pristupovať viac ako výskumník a potom pravdepodobne dostanete zaujímavejšie odpovede.

" Údaje časových radov možno rozdeliť mnohými spôsobmi. Niekedy má zmysel uvádzať hodnoty podľa dňa alebo hodiny. V iných prípadoch môže byť užitočnejšie pozrieť sa na údaje podľa mesiacov alebo rokov. V prvom prípade V tomto prípade môže mať graf väčší šum a v druhom prípade získate všeobecnejší vzhľad.

Tí z vás, ktorí majú webovú stránku a používajú jeden alebo iný počítačový program na analýzu jej návštevnosti, to rýchlo uvidia. Ak sa pozriete na dennú návštevnosť svojich stránok, ako je znázornené na obrázku 1. 1.6, uvidíte, že je dosť hrboľatá. Výkyvy v ňom sú dosť veľké.

Ryža. 1.6. Počet jedinečných návštevníkov stránky FlowingData za deň

28 KAPITOLA 1: ROZPRÁVANIE PRÍBEHU S ÚDAJMI

–  –  –

ktorým evidentne niečo chýba - ako keby grafik nemal čas premýšľať nad údajmi a narýchlo tomu dal nejakú formu, len aby stihol termín. To, čo v takýchto prípadoch veľmi často chýba, je závislosť.

V štatistike sa závislosť zvyčajne chápe ako korelácia a kauzalita.

Viaceré premenné môžu byť prepletené zložitými vzťahmi.

Šiesta kapitola „Vizualizácia závislosti“ sa zameriava presne na tieto koncepty a ako ich vizualizovať.

Avšak v abstraktnejšej rovine, kde nepremýšľate o rovniciach a kritériách testovania hypotéz, môžete vytvoriť tabuľky a grafy na vizuálne porovnanie a kontrast magnitúd a distribúcií. Ako jednoduchý príklad si môžeme vziať schému prenikania technológií do života, prevzatú zo správy World Progress Report.

a znázornené na obr. 1.8.

–  –  –

Ryža. 1.8. Prenikanie technológií do celého sveta Stĺpcové grafy zobrazujú počet používateľov internetu, ako aj počet vytáčaných a širokopásmových predplatiteľov na 100 obyvateľov. Upozorňujeme, že rozsah používateľov internetu (od 0 do 95 na 100 obyvateľov) je oveľa širší ako v prípade ostatných dvoch skupín.

Najjednoduchším a najrýchlejším spôsobom je nechať počítačový program, ktorý ste si nainštalovali, sám rozhodnúť, ktorý rozsah použije pre každý stĺpcový graf. Avšak, všetky

30 KAPITOLA 1: ROZPRÁVANIE PRÍBEHU S ÚDAJMI

–  –  –

dodržiavať niekoľko základných zásad. Každý z nich vám dáva priestor na manévrovanie, takže by ste ich mali brať skôr ako návod, než súbor pevných a rýchlych pravidiel, ale ak ste v grafickom dizajne nováčik, potom by ste mali začať práve týmito.

–  –  –

* „Opica vidí – opica áno“ je jamajské príslovie, ktoré opisuje proces kopírovania správania niekoho iného bez pochopenia jeho významu. Poznámka. za.

Ryža. 1.13. Niektoré z výsledkov súťaže o pomenovanie na FlowingData

36 KAPITOLA 1: ROZPRÁVANIE PRÍBEHU S ÚDAJMI

–  –  –

Ryža. 1.15. Správny prístup pri určovaní veľkosti kruhov v diagramoch 1.16 je znázornená dvojica kruhov, ktorých rozmery boli určené priemerom. Prvý kruh má polovicu priemeru druhého, ale jeho plocha je štyrikrát menšia.

Ryža. 1.16. Nesprávny prístup pri určovaní veľkosti kruhov v diagramoch To isté sa deje s obdĺžnikmi, napríklad v stromových mapách. Ako indikátor veľkosti používa plochu, nie výšku alebo šírku.

Špecifikovať zdroje Môže sa zdať zbytočné hovoriť o potrebe špecifikovať zdroje údajov – ale príliš veľa ľudí na to zabúda. Odkiaľ sa vzali všetky tieto údaje? Ak sa pozriete na diagramy v novinách, uvidíte, že zdroj je v nich vždy uvedený - zvyčajne malý

38 KAPITOLA 1: ROZPRÁVANIE PRÍBEHU S ÚDAJMI

–  –  –

Skôr než sa dostanete k samotnej vizuálnej časti práce s dátami, musíte ju získať.Dáta sú to, čo robí vizualizáciu zaujímavou. Ak nemáte zaujímavé informácie, skončíte s nezabudnuteľným diagramom alebo pekným, ale zbytočným obrázkom. Kde môžete nájsť dobré údaje? Ako sa k nim dostať? Tu sú otázky, ktorým v tejto fáze čelíte.

Keď sú údaje vo vašich rukách, budete ich musieť naformátovať, aby ste ich mohli načítať do počítačového programu. Možno ste dostali údaje ako textový súbor oddelený čiarkami alebo ako tabuľku programu Excel a potrebujete ich previesť na niečo ako XML. Alebo naopak. Alebo možno údaje, ktoré potrebujete, sú dostupné iba vo fragmentovanej forme prostredníctvom internetovej aplikácie a chcete získať celú tabuľku.

Musíte sa naučiť extrahovať a spracovávať dáta a potom sa vaše schopnosti v oblasti vizualizácie výrazne zvýšia.

40 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

UNIVERZITY

Keď som sa stal postgraduálnym študentom, často som využíval akademické zdroje, ktoré som mal k dispozícii, konkrétne knižnicu. Mnohé knižnice výrazne pokročili vo svojom technologickom vybavení a dnes disponujú obrovskými archívmi dát. Rôzne fakulty a katedry tiež uchovávajú množstvo dátových súborov, z ktorých väčšina je verejne dostupná. Je pravda, že mnohé z týchto dostupných súborov údajov sú určené predovšetkým na použitie pri písaní semestrálnych prác a domácich úloh. Odporúčam vám ísť a pozrieť si nasledujúce zdroje.

Data and Story Library (DASL) (http://lib.stat.cmu.edu/DASL) – online knižnica údajov a súborov príbehov ilustrujúca aplikáciu základných štatistických metód; odkazuje na Carnegie Mellon University.

Berkeley Data Lab (http://sunsite3.berkeley.edu/wikis/datalab) je súčasťou knižničného systému UC Berkeley.

42 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

Geografia Máte program na lokalizáciu objektov, ale nemáte geografické údaje? Aké skóre. K dispozícii máte veľké množstvo geografických súborov vrátane vektorového formátu (súbory tvaru).

TIGER (http://www.census.gov/geo/www/tiger) – Webová stránka US Census Bureau poskytuje možno najdrahšie, ale aj najpodrobnejšie databázy diaľnic, železníc, riek a PSČ, ktoré môžu byť nájdené.

OpenStreetMap (http://www.openstreetmap.org) je jedným z najlepších príkladov komunitných databáz.

Geocommons (http://www.geocommons.com) je databáza aj mapovacia aplikácia.

Flickr Shapefiles (http://www.flickr.com/services/api) – geografické hranice prezentované používateľmi Flickr.

Šport

Ľudia milujú športové štatistiky a máte prístup k tomuto typu údajov za posledných niekoľko desaťročí. Nájdete ich na stránke Sports Illustrated a na stránkach príslušných športových tímov a organizácií, ako aj na stránkach venovaných čisto športovým štatistikám.

Basketball Reference (http://www.basketball-reference.com) je komplexný zdroj údajov a informácií vrátane živého prenosu zápasov NBA.

Baseball DataBank (http://baseball-databank.org) je super komplexná stránka, z ktorej si môžete stiahnuť komplexné baseballové datasety.

DatabaseFootball (http://www.databasefootball.com) – Zobrazte údaje o zápasoch americkej národnej futbalovej ligy podľa tímu, hráča a sezóny.

Svet ako celok

Niekoľko významných medzinárodných organizácií tiež vedie databázy o svete ako celku, najmä pokiaľ ide o ukazovatele, ako je zdravie a rozvoj. A predsa pri práci s nimi budete musieť niečo odfiltrovať, keďže mnohé množiny údajov nie sú veľmi dobre štruktúrované. Nie je ľahké získať štandardizované údaje zberom údajov z rôznych krajín rôznymi spôsobmi.

Global Health Facts (http://www.globalhealthfacts.org) – údaje o zdraví z celého sveta.

UNdata (http://data.un.org) je agregátor údajov z rôznych zdrojov z celého sveta.

44 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

Ak z tejto adresy odstránite všetko za .html, stránka sa bude stále načítavať, takže sa zbavte tých nadbytočných znakov. Momentálne vás nezaujímajú.

Malo by sa ukázať:

www.wunderground.com/history/airport/KBUF/2010/10/1/DailyHistory.html

48 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

# Open wunderground.com url timestamp = "2009" + str(m) + str(d) print "Získavame údaje pre " + časová pečiatka url = "http://www.wunderground.com/history/airport/KBUF/2009/ " + str(m) + "/" + str(d) + "/DailyHistory.html" page = urllib2.urlopen(url) # Získať teplotu zo stránky soup = BeautifulSoup(page) # dayTemp = soup.body.nobr. b.string dayTemp = soup.findAll(attrs=("class":"nobr")).span.string

–  –  –

# Časová pečiatka zostavy = "2009" + mStamp + dStamp # Zapíšte časovú pečiatku a teplotu do súboru f.write(timestamp + "," + dayTemp + "\n") # Hotovo so získavaním údajov! zavrieť súbor.

f.close() Pravdepodobne ste rozpoznali prvé dva riadky kódu, ktoré ste použili na import požadovaných knižníc – urllib2 a BeautifulSoup.

import urllib2 z BeautifulSoup import BeautifulSoup Ďalej sa pomocou metódy open() vytvorí textový súbor s názvom wunder-data-txt s oprávneniami na zápis. Všetky údaje, ktoré extrahujete, budú uložené v tomto textovom súbore, ktorý sa nachádza v rovnakom adresári, kde ste uložili svoj skript.

# Vytvorte/otvorte súbor s názvom wunder.txt (čo bude súbor oddelený čiarkami) f = open("wunder-data.txt", "w")

52 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

Predposledný kus kódu je zodpovedný za zostavenie časovej pečiatky na základe roku, mesiaca a dňa. Časová pečiatka je uvedená vo formáte „rrrrmmdd“. Tu môžete nastaviť ľubovoľný formát, ale v tejto fáze platí, že čím jednoduchšie, tým lepšie.

# Formátovať deň pre časovú pečiatku

if len(str(d)) 2:

dStamp = "0" + str(d)

–  –  –

Nakoniec súbor „wunder-data.txt“ pridá „teplotu“ a časovú značku pomocou metódy write().

# Zapíšte časovú značku a teplotu do súboru f.write(timestamp + "," + dayTemp + "\n") Close() sa použije, keď sú všetky mesiace a dni hotové.

# Hotovo so získavaním údajov! zavrieť súbor.

f.close() Zostáva už len spustiť kód, ktorý vykonáte vo svojom termináli pomocou nasledujúceho príkazu:

$ python get-weather-data.py

–  –  –

programovanie a budete môcť zobraziť údaje v akomkoľvek formáte, ktorý chcete, aby vyhovoval vašim potrebám v konkrétnom okamihu.

Najjednoduchšie je nájsť programátora, ktorý dokáže naformátovať všetky vaše dáta a analyzovať ich, no potom už budete vždy závislí na niekom inom. Táto závislosť sa prejavuje najmä v počiatočných fázach akéhokoľvek projektu, keď sú iterácie a prieskum údajov kľúčom k vytvoreniu zmysluplných vizualizácií. Aby som bol úprimný, keby som bol v náborovom biznise, radšej by som si najal niekoho, kto vie pracovať s dátami, ako niekoho, kto potrebuje pomoc zvonku pri každom spustení projektu.

ČO SOM SA NAUČIL O FORMÁTOVANÍ

Keď som prvýkrát začal študovať štatistiku na strednej škole, údaje nám boli vždy prezentované v prehľadnom tabuľkovom formáte. Všetko, čo som musel urobiť, bolo vložiť niekoľko čísel do tabuľky programu Excel alebo do mojej úžasnej grafickej kalkulačky (čo bolo lepšie, pretože mi to umožnilo hrať Tetris a predstierať, že robím triednu úlohu). Počas rokov vysokoškolského štúdia sa situácia prakticky nezmenila. Keďže som študoval metódy a teorémy analýzy, moji učitelia netrávili príliš veľa času prácou so surovými, nepripravenými údajmi. Zdalo sa, že údaje vždy existovali vo forme vhodnej na prácu.

Je to pochopiteľné, vzhľadom na časovú tieseň a podobne. Ale na vysokej škole som si uvedomil, že v reálnom svete sa dáta takmer nikdy nenachádzajú vo formáte, ktorý potrebujete. Niektoré významy chýbajú úplne, iné sa objavujú bez akéhokoľvek kontextu alebo sú sprevádzané nelogickými, protichodnými titulkami a preklepmi. Potrebné údaje sú veľmi často roztrúsené v rôznych tabuľkách a vy chcete, aby boli všetky v jednej jedinej a zoradené podľa jedného indikátora, ako je názov alebo jedinečný identifikátor.

Keď som začal s vizualizáciou, čelil som rovnakému problému. A problém sa zhoršoval, čím viac som chcel robiť viac s údajmi, ktoré som mal. Dnes už pre mňa nie je nezvyčajné, že trávim toľko času získavaním údajov vo formáte, ktorý potrebujem, toľko času, koľko času skutočne robím ich vizualizáciou. Vyčistenie dát mi niekedy trvá aj dlhšie. Na prvý pohľad sa to môže zdať zvláštne, ale zistíte, že tvorba grafiky bude oveľa jednoduchšia, keď budete mať dáta usporiadané tak prehľadne, ako to bolo počas úvodného kurzu štatistiky na strednej škole.

Ďalej sa zoznámite s rôznymi formátmi údajov, dostupnými nástrojmi, ktoré vám pomôžu s týmito formátmi pracovať, a nakoniec získate určité znalosti programovania pomocou rovnakých princípov ako pri extrakcii údajov v predchádzajúcom príklade.

56 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

ROZŠÍRITEĽNÝ ZNAČKOVÝ JAZYK (XML)

Ďalším bežným webovým formátom je XML. Často sa používa na prenos údajov cez rôzne API. Existuje mnoho rôznych typov XML a špecifikácií, ale na svojej najzákladnejšej úrovni ho možno opísať ako formát textového dokumentu s hodnotami uzavretými v značkách. Napríklad informačný kanál Really Simple Syndication (RSS), ktorý ľudia používajú na odber blogov ako FlowingData, je v podstate súbor XML (obrázok 2.7).

Ryža. 2.7. Fragment kanála RSS FlowingData

Analýza XML je relatívne jednoduchá pomocou knižníc, ako je napríklad Beautiful Soup for Python. Po prečítaní nasledujúcich častí knihy budete lepšie rozumieť XML, ako aj CSV a JSON.

58 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

Pán. DÁTOVÝ KONVERTOR

Často sa stáva, že máte možnosť získať všetky údaje v Exceli, no potom ich potrebujete previesť do iného formátu, ktorý lepšie vyhovuje vašim potrebám.

To sa stáva takmer vždy v prípade tvorby grafiky pre web. Už viete, ako exportovať excelové tabuľky vo formáte CSV, ale čo ak potrebujete urobiť niečo iné? Pomôže vám p. prevodník údajov.

Pán. Data Converter je jednoduchý a bezplatný nástroj. Vytvoril ho Shan Carter, grafický editor v New York Times. Carter trávi väčšinu svojho pracovného času vytváraním interaktívnej grafiky pre online verziu novín. Funguje to, takže nie je prekvapujúce, že vytvoril nástroj na uľahčenie procesu .

Užite si Mr. Data Converter je jednoduchý. Ako môžete vidieť pri pohľade na obr. 2.9, Obr. 2.9. Pán. Data Converter výrazne zjednodušuje prenos dát z jedného úplne jednoduchého rozhrania. Celý ten formát v inom

60 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

Ryža. 2.11. Mená v tabuľkovom formáte po spracovaní v Mr. Ľudia ako Mr. Data Converter Mr. People je tiež open source a dá sa stiahnuť z GitHub.

TABUĽKOVÉ VÝPOČTOVÉ PROGRAMY

Samozrejme, ak potrebujete len zoradiť nejaké údaje alebo urobiť malé zmeny v jednotlivých položkách, vždy môžete použiť svoj obľúbený tabuľkový procesor. Ak sa chystajú malé úpravy, prejdite na osvedčenú cestu. Ak nie, skúste najskôr vyššie uvedené (najmä ak máte obrovské množstvo údajov) alebo zvážte napísanie kódu, ktorý je prispôsobený konkrétnemu úlohy.

62 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

20090101,26 20090102,34 20090103,27 20090104,34 20090105,34 20090106,31 20090107,35 20090108,30 20090109,25 …

–  –  –

max_temperature26/max_temperature /dátum pozorovania20090102/dátum max_teplota34/maximálna_teplota /dátum pozorovania20090103/dátum max_teplota27/maximálna_teplota /dátum pozorovania vrátane dátumu pozorovania20090104/dátum max_teplota_teplota /obdobie_teplota /observation tag pre každý deň max_temperature /observation34/max značky.

Ak chcete previesť CSV do formátu XML, ako je uvedené vyššie, môžete použiť nasledujúci útržok kódu:

import csv reader = csv.reader(open("wunder-data.txt", "r"), delimiter=",") print "weather_data"

pre riadok v čítačke:

tlač "pozorovanie" tlač "dátum" + riadok + "/dátum" tlač "max_teplota" + riadok + "/max_teplota" tlač "/pozorovanie" tlač "/údaje o počasí" Požadované moduly importujete ako predtým. V tomto prípade na čítanie wunder-data.txt, potrebujete iba CSV modul.

import csv Druhý riadok kódu otvorí súbor wunder-data.txt na čítanie pomocou open() a potom ho načíta pomocou metódy csv.reader().

čitateľ = csv.reader(open("wunder-data.txt", "r"), delimiter=",")

64 KAPITOLA 2. AKO NArábať s údajmi

–  –  –

prevod CSV na XML, prechádzajte každým pozorovaním a zobrazujte hodnoty v požadovanom formáte.

Týmto sa vrátite tam, kde ste začali:

20090101.26 20090102.34 20090103.27 20090104.34 ... Pre úplnosť uvádzame kód na konverziu CSV do formátu JSON.

import csv reader = csv.reader(open("wunder-data.txt", "r"), delimiter=",") print "( pozorovania: [" rows_so_far = 0

pre riadok v čítačke:

–  –  –

tlačiť "] )" Preskenujte čiary očami, aby ste videli, čo sa tu deje. Opäť máme do činenia s rovnakou logikou, len s iným výsledkom. Ak spustíte vyššie uvedený kód, získate svoje údaje vo formáte JSON.

Takto budú vyzerať:

–  –  –

Príklad je, samozrejme, jednoduchý, ale ukazuje, ako môžete tieto princípy vyvinúť na formátovanie alebo obohatenie údajov podľa vlastného uváženia.

Zapamätajte si tieto tri kroky:

Zaokrúhlenie V tejto kapitole sa hovorí o tom, ako nájsť potrebné údaje a čo s nimi po ich nájdení robiť. V procese vizualizácie je to veľmi dôležitá fáza, nehovoriac o najdôležitejšej. Infografika je len taká zaujímavá ako podkladové dáta. Svoju tabuľku alebo graf môžete ozdobiť, ako chcete, ale základom zostanú údaje (alebo výsledky vašej analýzy týchto údajov). A teraz, keď viete, kde a ako získať údaje, ste pripravení ísť ďalej.

Prvýkrát ste si vyskúšali aj programovanie. Extrahovali ste údaje z lokality a potom ste ich naformátovali a preusporiadali. Tento trik vám dobre poslúži v ďalších kapitolách. Najdôležitejšia vec v kóde je však logika. Použili ste Python, ale mohli ste sa obrátiť aj na Ruby, Perl alebo PHP. Bez ohľadu na jazyk, ktorý používate, princíp činnosti zostáva rovnaký. Keď ovládate jeden z programovacích jazykov – a ak ste už skúsený programátor, potvrdíte moje slová – bude pre vás neskôr oveľa jednoduchšie ovládať ďalší.

Nie vždy je potrebné uchýliť sa ku kódom. V niektorých prípadoch vám môžu aplikácie presunutím myšou výrazne uľahčiť prácu a v takýchto prípadoch by ste ich mali používať. V konečnom dôsledku, čím viac nástrojov máte vo svojej súprave nástrojov, tým menšie nebezpečenstvo, že v tomto procese uviaznete.

Takže údaje už máte. Teraz je čas začať vizualizovať.

Výber nástrojov na vizualizáciu údajov V predchádzajúcej kapitole ste sa naučili, ako nájsť údaje a ako ich previesť do formátu, ktorý potrebujete. Teraz ste pripravení začať s vykresľovaním. Jedna z otázok, ktoré sa ma ľudia v tejto fáze najčastejšie pýtajú, je: „Aký softvér by som mal použiť na vizualizáciu údajov?“

Našťastie máte veľa možností. Niektoré z programov sú už predinštalované vo vašom počítači a fungujú na princípe drag and drop. Ak chcete použiť iné nástroje, budete potrebovať určité znalosti programovania. A existujú niektoré nástroje, ktoré neboli navrhnuté špeciálne na grafické znázornenie údajov, no napriek tomu môžu byť pre vás užitočné. Táto kapitola sa zameriava na tému výberu softvéru na vizualizáciu dát.

„Čím viac nástrojov ovládate, tým lepšie pochopíte ich výhody, tým menej je pravdepodobné, že budete zmätení, nebudete vedieť, čo ďalej so súborom údajov, ktorý máte, a tým je pravdepodobnejšie, že vytvoríte graf alebo“ graf, hodný vašej vízie.

70 KAPITOLA 3. VÝBER NÁSTROJOV NA VIZUALIZÁCIU ÚDAJOV

–  –  –

Ryža. 3.2. Možnosti grafov v programe Microsoft Excel Niektorí ľudia neberú Excel vážne, ale nie je to zlý program, ak ho používate na správne účely. Napríklad nepoužívam Excel, ak potrebujem urobiť hĺbkovú analýzu alebo navrhnúť grafiku na publikovanie. Ak však získam malú množinu údajov v súbore programu Excel, ako sa to často stáva, a chcem rýchlo získať všeobecnú predstavu o tom, čo je predo mnou, radšej si zostavím graf s pár kliknutí myšou priamo v tomto tabuľkovom programe, ktorý každý miluje.

GRAFY MÔŽU BYŤ NAOZAJ ZÁBAVNÉ

Prvý graf, ktorý som vytvoril na počítači, bol v programe Microsoft Excel a vytvoril som ho v piatom ročníku na školskom veľtrhu vedeckých projektov. S parťákom sme sa snažili zistiť, na ktorom povrchu sa slimáky pohybujú najrýchlejšie. Môžem vás ubezpečiť, že to bol prelomový výskum.

Dokonca aj v tých časoch, ako si teraz pamätám, ma veľmi bavilo vytvárať diagram. Trvalo mi večnosť, kým som sa s programom zorientoval (počítač bol vtedy pre mňa novinkou), ale keď som konečne prišiel na to, čo je čo, tento proces bol pre mňa skutočným potešením. Zadal som čísla do tabuľky a hneď som dostal tabuľku, ktorú ste si mohli vyfarbiť akoukoľvek farbou.

Vybral som si krikľavú žltú, z ktorej mi oslepnú oči, - zdalo sa mi, že to je práve to.

72 KAPITOLA 3. VÝBER NÁSTROJOV NA VIZUALIZÁCIU ÚDAJOV

–  –  –

Ryža. 3.8. Rozptylový graf na mnohých očiach Obr. 3.9. Strom slova „správne“ v ústave USA na mnohých očiach Pomocou toho môžete jednoducho prepínať z jedného nástroja na druhý pomocou rovnakých údajov. Na obr. 3.10 Ústava je vykreslená pomocou štylizovaného slovného mraku známeho ako Wordle. Čím je slovo bežnejšie, tým je väčšie.

76 KAPITOLA 3. VÝBER NÁSTROJOV NA VIZUALIZÁCIU ÚDAJOV

–  –  –

ako iní nie sú v tomto biznise takí spoľahliví, no umožňujú vám vytvárať oveľa atraktívnejšie vizuálne objekty alebo im dať interaktivitu. Pri ktorom jazyku je lepšie prestať, závisí od toho, aké ciele si stanovíte pre konkrétny diagram a pri práci s ktorým jazykom sa cítite istejšie.

Niektorí ľudia sa držia jedného konkrétneho jazyka a časom sa v ňom veľmi zdokonalia. Je to tiež skvelé, ak ste v programovaní nováčik. Dôrazne vám odporúčam držať sa tejto stratégie. Najprv sa oboznámte so základnými a dôležitými princípmi kódu.

Použite jazyk, ktorý najlepšie vyhovuje vašim potrebám. Učenie sa nových jazykov a učenie sa nových trikov pri hraní s údajmi je však mimoriadne potešením.

Takže predtým, ako sa rozhodnete, čo sa vám najviac páči, by ste mali získať slušné skúsenosti s programovaním.

V predchádzajúcej kapitole sme hovorili o tom, ako spravovať dáta pomocou jazyka Python.

Vďaka tomu je skutočný jazyk obzvlášť užitočný na analýzu a výkonné výpočty.

Okrem iného má Python úhľadnú a čitateľnú syntax, ktorú programátori milujú.

Pomocou nej môžete pracovať s mnohými modulmi a vytvoriť informačnú grafiku, ako je tá na obr. 3.11.

Z hľadiska estetiky nie je tento objekt ničím výnimočným. Pravdepodobne nebudete chcieť vytlačiť graf, ktorý ste práve získali pomocou Pythonu. Výsledok zvyčajne vyzerá nedbale. Napriek tomu je to dobrý začiatok na vašej ceste za prieskumom údajov. Môžete tiež exportovať obrázok a potom ho spracovať alebo k nemu pridať informácie pomocou grafického editora. Ryža. 3.11. Graf vytvorený v Pythone

80 KAPITOLA 3. VÝBER NÁSTROJOV NA VIZUALIZÁCIU ÚDAJOV

–  –  –

V ČINNOSTI UNIVERZITNEJ KNIŽNICE Monografia Kemerovo 2010 MDT 78.305.8 LBC 022.9 B72 Recenzenti: doktor pedagogických vied profesor E. L. Kudrina; doktor pedagogiky, profesor N. I. Gendina; doktor kultúrnych štúdií, profesor G. B. Parshukova Bobrová, E. I. B72 Informačné a komunikačné technológie v činnosti knižnice univerzity ... “

"jeden. Ciele zvládnutia disciplíny .2. Miesto disciplíny v štruktúre OOP Disciplína „Základy starého ruského umenia“ sa vzťahuje na ... “

«TAJOMNÉ KANONY A SÉRIOVÁ METÓDA SKLADANIA V HUDBE XX. STOROČIA: K PROBLÉMU INTERAKCIE Ivanova Ekaterina Vladimirovna Cand. Dejiny umenia, docent Katedry teórie hudby Moskovského štátneho konzervatória. P.I. Čajkovskij, 125009, Rusko, Moskva, ul. B. Nikitskaja, 13 E-mail: [e-mail chránený] sk HÁDANKOVÉ KANONY A SÉRIOVÝ METÓDA KOMPOZÍCIÍ V HUDBE XX. STOROČIA: K PROBLÉMU SPOLUPRÁCE Jekaterina Ivanova kandidátka umení (PhD), docentka...»

„Veda a vzdelanie. MSTU im. N.E. Bauman. Electron. časopis 2015. Číslo 02. S. 169–179. DOI: 10.7463/0215.0758801 Predložené redakcii: 27. januára 2015 Upravené: 4. marca 2015 N.E. Bauman UDC 536.2 Rovnovážna hodnota teploty družice na nízkej obežnej dráhe Zeme Khegab Т. М.1,* MSTU im. N.E. Bauman, Moskva, Rusko Bola vykonaná analýza tepelného toku pôsobiaceho na podmienenú umelú družicu Zeme guľového tvaru a bola stanovená rovnovážna hodnota jej teploty. Hlavná pozornosť...“

«Č. 3 | 2014 18+ viktoriánske šperky | Éra secesie | Umelci konca XX storočia | šéfredaktor reklamnej redakcie Vladimir Pilyushin 1. zástupca šéfredaktora Svetlana Pilyushina - [e-mail chránený] Zástupkyňa šéfredaktora Tatyana Samoilova - [e-mail chránený] odborný gemológ Michail Chizhov dizajn a rozloženie Ekaterina Kalinina kresby Ekaterina Kalinina korektorka Lyudmila Lebedeva reklamné oddelenie Na obálke: reklamné oddelenie Súťaž International...»

„Pätnáste medzinárodné fórum „Nové nápady nového storočia \ Nové nápady nového storočia“ 15. medzinárodné fórum „Nové nápady nového storočia“ PR OD OK OL The report -2015“ (Medzinárodná výstava publikácií pracovníkov fakúlt vysokých škôl účastníci fóra „NIoNC-2015“) zo dňa 27. februára 2015, 27. februára 2015 ZLOŽENIE POROTY: Spolupredsedovia poroty: Predsedovia Karpová IN –...“

«ISSN 1997-4558 PEDAGOGIKA UMENIA http://www.art-education.ru/AE-magazine № 1, 2015 O VÝZNAME UMELO VYROBENÝCH HRAČIEK PRE TVORENIE RODOVÉHO VEDOMIA STARŠÍCH PREDŠKOLSKÝCH DETÍ (O PROBLÉME SOCIÁLNO-KULTÚRNA IDENTIFIKÁCIA) RUČNE VYROBENÝCH HRAČIEK PRE DETI PREDŠKOLSKÉHO VEKU ROZVOJ RODOVÉHO VEDOMIA (K PROBLÉMU SOCIÁLNEJ A KULTÚRNEJ IDENTIFIKÁCIE) LYKOVA IRINA ALEKSANDROVNA LYKOVA IRINA doktorka Pedagogickej katedry ALEXANDROVNA

“HROMADNÉ PREHĽADÁVANIE za september 2013 Bielorusko zníži výrub prirodzených lesov využívaním umelo vytvorených lesných plantáží 2. septembra Minsk /Maria Dmitrieva BELTA/. Bielorusko zníži výrub prirodzených lesov využívaním umelo vytvorených lesných plantáží, povedal šéf lesníckeho odboru Ministerstva lesného hospodárstva Bieloruska Valentin Shatravko korešpondentovi BelTA. Vytváranie a využívanie plantáží zabezpečuje návrh nového vydania ... “

« MOTÍVY VO FOLKLÓRE, LITERATÚRE A UMENÍ Nalčik 2014 MDT - 821.352.30:398 LBC - 83,3(0)6 Х - 16 Katedra adyghskej filológie KBIGI, doktor filológie H.T. Timizhev Reviewers: hlavný výskumník v sektore...»

«***** Izvestia ***** č. 3 (35), 2014 O KOMPLEXNEJ AGRONÓMII A LESNÍCTVO MDT: 674.032:634.0.232(470.44) VEDECKÉ ZÁKLADY VÝBERU DRUHOVÝCH A FOREMOVÝCH ROZMANITOSTÍ ULMUS L. PRE OCHRANNÉ LESNÉ RASTLINY REGIÓNU dolného Povolžia I.Yu. Podkovyrov, kandidát poľnohospodárskych vied, docent Volgogradská štátna agrárna univerzita Článok prezentuje metodiku a materiály pre selekciu komplexných odolných druhov, hybridov a...»




Stránky pomocníka pre počítače

© Copyright 2022,
rzdoro.ru – stránka počítačovej pomoci

  • Kategórie
  • železo
  • Windows 10
  • Skenovanie
  • Windows 7
  • železo
  • Windows 10
  • Skenovanie
  • Windows 7