Yau n iş dünyasında görselleştirme sanatı. Nathan Yau: İşletmede Görselleştirme Sanatı. Karmaşık bilgiler basit yollarla nasıl sunulur?

  • 27.06.2020

Own, her bir kişinin potansiyelini ortaya çıkarmasına yardımcı olur, onları güçlü yönlerine, yeteneklerine inanmaya zorlar, alınan her karar için artan sorumluluk. Ancak iş uzun sürmeyecek, sonuçları onu sanat olarak adlandırmaya motive eden görselleştirme yöntemini kullanmayın.

İş dünyasında görselleştirme: ilk adımlar

  1. Kendi karlı işinizi kurma konusunda deneyim kazanmak istiyorsanız, kendi işinizi kurarken kurtuluşunuz olacak girişimcilik becerilerini öğrenin. Aynı zamanda, yeni bir şey öğrenirken, kendi tarafınızda olana inanın, başkalarının sizin içinizdeki şüphelerinin kendinize olan inancınızı yok etmesine izin vermeyin.
  2. Düşüncenin eylemi doğurduğunu unutmayın. Bu nedenle, iş süreci görselleştirmesinde, bir an önce zihninizde beliren bir fikrin somutlaşmasını anlık olarak ele almak çok önemlidir.
  3. Kredi alacağınız gerçeğine güvenmeyin. Zihninizi borç içinde yaşamak için programlamayın. Proje cüzdanınız için iyi bir sonuç alacaksa, başlangıç ​​sermayesi kaynakları üzerinde kafa yormaya gerek kalmayacaktır. Evren size her zaman bir fırsat sunuyor. Geriye sadece bilet almak kalıyor.
  4. Kendi işinizin sahibi olma hayalinizi sürdürürken, yolunuza çıkan engelleri analiz edin. Sonuçta, herhangi bir başarısızlıktan kendiniz için olumlu bir taraf çıkarabilirsiniz.
  5. İş moduna geçmeden önce kendinizi finansal güvenlikle güvence altına alın. Son altı aylık maaşınızın büyüklüğü bir banka hesabı şeklinde olabilir.
  6. Her zaman yeni fikirlerin peşinde olun veya mevcut fikirleri iyileştirin, ancak bir gecede istediğiniz her şeyi elde edemeyeceğinizi unutmayın. Cennetten gelen böyle bir man, kendi azim, kendine güven ve olumlu düşünme ile kazanılmalıdır.

İstatistik ve makroekonominin başladığı üniversitedeki üçüncü yılımda ilk kez elle değil Excel veya Access yardımıyla grafik ve çizelgeler oluşturma ihtiyacıyla karşılaştım. O zamandan beri, verilerle çalışma 9 yılda öne çıktı, ancak artık yüksek kaliteli güzel diyagramlar, bilgi şemaları ve “ödeme çizelgeleri” yok. Yerli medya bile her zaman rakamların ve gerçeklerin televizyonda ve internette görsel temsilini kullanmaz. İnsanların en iyi ve en hızlı algıladıkları görsel bilgi olmasına rağmen. Bugün masamın üzerinde duran kitap, bu gerçeğin sadece bir ifadesi değil, her gün “sütun” ve “merdiven” çizen ve bununla hayatını kazananlar için profesyonel bir ders kitabıdır.

Nathan Yau

FlowingData (veri görselleştirme, istatistiksel diziler ve tasarıma adanmış) tematik içerik projesi için makaleler yazıyor ve çeşitli grafikler oluşturuyor. Yüksek lisans derecesi aldı, kişisel verilerin görselleştirilmesi üzerine doktora tezini savundu. Ayrıca Veri Noktaları: Bir Şey Anlamına Gelen Görselleştirme kitabını da yazdı. Akışkandata.com sayfalarında bilgilerin görsel sunumu alanındaki deneyleriyle tanışabilirsiniz.

Kitabın ilk izlenimi

Elinize alıyorsunuz ve önünüzde sadece güzel infografiklerden oluşan bir hediye albümü değil, aynı zamanda sağlam bir ders kitabı olduğunu anlıyorsunuz. Aslında, hem teknik hem de insani üniversitelerin öğrencileri, böyle bir kitaptan diyagram oluşturma üzerine sıkıcı derslerden daha fazla yararlanacaktır. Açıklayıcı örnekler, algoritmalar ve adım adım talimatlar, hedef kitlenize hangi verileri ve hangi biçimde göstermek istediğinize bağlı olarak bölümlere ayrılmıştır.

En Faydalı

Aslında, kitabın tamamını baştan sona okuyamazsınız, sadece şu anda sunumunuz, bir konferanstaki konuşmanız veya sadece meslektaşlarınızla fikirleri tartışmak için materyal hazırlamanız gereken bölüm veya alt bölümü okuyabilirsiniz.

Ve sonra sunumları "metin sayfaları" ile tekrar korumanız pek olası değildir.

Bu kitabı okurken, çok fazla bilgi diye bir şey olmadığını anlıyorsunuz: yanlış bir yorum var. Sonuçta, sadece bir sayı dağını çizmek değil önemlidir. Oluşturduğunuz tüm tablo ve grafiklerin tam olarak ne hakkında konuştuğunu göstermek önemlidir.

Nathan Yau, ihtiyacınız olan verileri nerede bulacağınızı, uygun görselleştirme için nasıl biçimlendireceğinizi, işleyeceğinizi ve hazırlayacağınızı ve bu amaç için hangi yazılımı kullanacağınızı açıklıyor.

R ve Adobe Illustrator, HTML, CSS ve JavaScript kullanarak veri görselleştirmenin pratik örnekleri de vardır. En sıkı pazarlamacılar ve analistler için Python, SVG, ActionScript ve Flash tabanlı etkileşimli haritalar oluşturmaya yönelik eğitimler bile var.

Kime okumalı

Pazarlamacılar - doğru çizelgelerin ve diyagramların müşterilerinizi ve kullanıcılarınızı nasıl etkilediğini anlamak için. Ayrıca güzel sunumlar yapmak için.

Yeni başlayanlar için - sadece sunum uğruna değil, aynı zamanda anlamı (finansal ve yönetimsel) sindirilebilir bir biçimde sunmak adına güzel sunumlar yapmak. Ayrıca yatırımcıları kazanmak için.

Gazeteciler - araştırmacı gazetecilik ve veri gazeteciliği alanında çalışıyorsanız, bu kitabı okumak bir zorunluluktur.

Tasarımcılar - Tasarımcıların neden veri görselleştirme üzerine bir kitaba ve hatta bir dizi derse ihtiyaç duyduklarını açıklamanın abartılı olduğunu düşünüyorum.

Bu kitap ne hakkında

Yazar, verileri nerede bulabileceğinizi, nasıl biçimlendireceğinizi, işleyeceğinizi ve görselleştirme için nasıl hazırlayacağınızı, mevcut sayılar ve grafiklerde neleri arayacağınızı, hangi programları kullanacağınızı açıklar. Görselleştirme tekniklerini, bilgiyi veri türüne ve türüne göre yapılandırma yollarını açıklar...

tamamen oku

Bu kitap ne hakkında
Bir toplantıya, toplantıya veya sunuma hazırlanırken fikirlerinizi özlü ve anlaşılır bir şekilde nasıl tanımlarsınız? 10 tablo, 20 çizelge ve 2 rapor daha 15 sunum slaydına nasıl sığdırılır? Cevap: Bu verileri işlemeniz ve ona farklı bir görsel form vermeniz gerekiyor.

Becerikli ellerde bilgi bolluğu sorun değil, gerçek bir depodur. Sonuçta, ilginç olan sayıların kendisi değil, onlardan çıkarılabilecek bilgilerdir. İnsanlar tüm bu tabloların ve grafiklerin tam olarak ne hakkında konuştuğunu bilmek istiyor. Öğrenmelerine yardımcı olursanız, bir uzman olarak yüksek talep görürsünüz.

Görselleştirme tekniklerinde ustalaşın - bilgilerle nasıl çalışacağınızı öğrenecek, fikirlerinizi net ve kendinden emin bir şekilde ifade etmeye başlayacaksınız.

Yazar, verileri nerede bulabileceğinizi, nasıl biçimlendireceğinizi, işleyeceğinizi ve görselleştirme için nasıl hazırlayacağınızı, mevcut sayılar ve grafiklerde neleri arayacağınızı, hangi programları kullanacağınızı açıklar. Görselleştirme tekniklerini, bilgiyi veri tipine ve hikaye tipine göre yapılandırma yollarını açıklar.

Her durumda bilgileri işlemenin hangi yazılımın yardımıyla daha uygun olduğunu öğreneceksiniz. R ve Adobe Illustrator, HTML, CSS ve JavaScript'te oluşturma örneklerini keşfedin. Ayrıca kitapta, görselleştirme ihtiyaçları için Flash grafiklerinin kullanımı hakkında bilgi edinecek, Python ve SVG kullanarak haritaların nasıl oluşturulacağını ve ActionScript ve Flash'ta animasyonlu haritaların nasıl oluşturulacağını öğreneceksiniz.

Bu kitap kimin için?
Proje yöneticileri, analistler, danışmanlar, pazarlamacılar için. Tek kelimeyle, büyük miktarda bilgi ile çalışanlar, onu verimli bir şekilde işlemenin önemli olduğu, yüksek kaliteli bir şekilde görselleştirdiği ve elbette tabloları, çizelgeleri ve hikayeleri yardımıyla hikayeler anlatanlar için. grafikler.

Neden bu kitabı yayınlamaya karar verdik?
Çünkü veriyi kullanarak hikayenizi yaratıcı ve görsel olarak anlatmak için onlarca fikir ve yöntem içeriyor. Bu tür bir yardım, bilgiyi günlük ekmeği olarak gören herkesin cephaneliğinde olmalıdır.

Kitap çipi
Kitap, pratik örnekler üzerine inşa edilmiştir: belirli sorunları çözmek için farklı programların nasıl kullanıldığı. Ayrı konularda sıralı veya seçici olarak okunabilir. Açıklanan tekniklere hemen hakim olmak için bunu açık bir bilgisayarın önünde yapmak özellikle etkilidir.

Saklamak

"Nathan Yau İş Hayatında Görselleştirme Sanatı Karmaşık Bilgiyi Basit Görüntülerde Nasıl Sunarız Nathan Yau Translated from..."

-- [ Sayfa 1 ] --

FlowingData Tasarım Kılavuzu,

Görselleştirme ve İstatistik

İş dünyasında görselleştirme sanatı

Basit görüntülerde karmaşık bilgiler nasıl sunulur?

Nathan Yau

Svetlana Kirova tarafından İngilizce'den çeviri

"Mann, Ivanov ve Ferber" yayınevi

BBK 65.291.34

John Wiley & Sons International Rights Inc.'in izniyle yayınlanmıştır.

ve Alexander Korzhenevsky'nin ajansları.

İlk kez Rusça olarak yayınlandı

ß88 İş hayatında görselleştirme sanatı. Basit görüntülerde karmaşık bilgiler nasıl sunulur / Nathan Yau; başına. İngilizceden. Svetlana Kirova. - M. : Mann, Ivanov ve Ferber, 2013. - 352 s.

İş dünyasında görselleştirme, verileri hızlı bir şekilde analiz etmenize, etkili bir şekilde sunmanıza ve elbette hayata uygulamanıza izin verecek şekilde sunma yeteneğidir. Bu kitabı okuduktan sonra, bilgi toplamayı ve biçimlendirmeyi, ondan yüksek kaliteli çizelgeler, grafikler ve haritalar oluşturmayı öğreneceksiniz.

Adobe Illustrator'ı görselleştirme amacıyla, HTML, CSS, JavaScript, Flash grafiklerle etkileşimli grafikler ve R, Python ve SVG'de oluşturulmuş haritalar için kullanarak, verilerinizi yaratıcı bir şekilde sunabilir ve onunla ilgi çekici hikayeler anlatabilirsiniz.

Çok fazla bilgiyle çalışanlar için: proje yöneticileri, analistler, danışmanlar, pazarlamacılar.



UDC 65.012.2 LBC 65.291.34 Tüm hakları saklıdır. Bu yayının hiçbir bölümü, yayıncının yazılı izni olmaksızın, fotokopi ve manyetik ortama kayıt da dahil olmak üzere, elektronik veya mekanik herhangi bir biçimde veya herhangi bir amaçla herhangi bir amaçla çoğaltılamaz.

Yayınevinin hukuki desteği "Vegas-Lex" hukuk firması tarafından sağlanmaktadır.

© Nathan Yau, 2011 ISBN 978-5-91657-737-2 © Baskı. Tercüme. Tasarım OOO Mann, Ivanov & Ferber, 2013 .... 7 Giriş ................................................. ................................................................................ ......... 9 1 Verilerle bir hikaye nasıl anlatılır ................ ..

–  –  –

Teknik Editör Hakkında Kim Rees, sosyal sorumluluk sahibi bir bilgi görselleştirme firması olan Periscopic'in kurucu ortağıdır. Kim, görselleştirme uzmanları çevresinde tanınmış bir kişiliktir. İnteraktif medyada on yedi yıllık deneyime sahiptir. Journal of Information Mapping ve InfoVIS 2010 Proceedings dergilerinde yayınları bulunmaktadır ve O'Reilly Strata Konferansı, WebVisions, AIGA Shift ve Portland Data Visualization dahil olmak üzere çok sayıda konferans ve forumda konuşmalar yapmıştır. Bilgisayar Bilimleri Lisans Derecesi

New York Üniversitesi'nde aldı. Periskopik şirketi Adobe web sitesinde hem CommArts Insights hem de Success Stories'de yer aldı ve çalışmaları VAST Challenge, CommArts Web Picks ve Communication Arts Interactive Yıllık Ödülü'nü kazandı. Periskopik tasarım yakın zamanda Cooper-Hewitt Ulusal Tasarım Ödülü'ne aday gösterildi.

Teşekkür Bu kitap, halkın kullanması için yararlı açık kaynak araçları yaratmaya devam eden veri bilimcilerin çalışmaları olmasaydı mümkün olmazdı. Bu geliştiricilerin yazılım ürünleri hayatımı çok kolaylaştırıyor ve eminim bizi şaşırtmaya devam edecekler - inovasyonun sınırı yok.

Hayal bile edemeyeceğim kadar çok insanla bağlantı kurmama yardımcı olan FlowingData okuyucularına da teşekkür etmek istiyorum. Bu kitabı yazmak için oturdum, esas olarak onlar için.

Ayrıca kitabı istediğim gibi yazmama izin verdiği için Wiley Publishing'e ve bu kitabı okunmaya değer kılan Kim Rijs'e teşekkür etmek istiyorum.

Son olarak, beni her zaman beni mutlu eden şeyi bulmam konusunda cesaretlendiren destekleri için eşime ve aileme teşekkür etmek istiyorum.

Sevgili eşime Biy Giriş Verilerin yeni olduğu söylenemez. İnsanlar yüzyıllardır ölçüyor ve çiziyor. Ancak, son yıllarda - tasarım, görselleştirme ve istatistik sitem FlowingData için yazmaya başladığımdan beri - bu alanda, görünürde sonu olmayan gerçek bir patlama gördüm.

Teknolojideki ilerlemeler, veri toplamayı ve saklamayı son derece kolaylaştırdı ve ağ, istediğiniz zaman erişmenize izin veriyor. Emin ellerde bu veri zenginliği, daha akıllı kararlar almanıza, fikirlerinizi daha ikna edici bir şekilde sunmanıza ve insanların dünyayı ve kendilerini nasıl gördüklerine dair daha objektif bir görüş oluşturmanıza yardımcı olacak bir bilgi madeni olabilir.

ABD'nin Data.gov portalını başlatmasıyla 2009 yılının ortalarında hükümet verilerinin yayınlanmasında önemli bir değişiklik meydana geldi. Federal departmanlar ve ajanslar tarafından sağlanan kapsamlı bir bilgi kataloğudur ve tüm bu organizasyonların ve yetkililerin şeffaflığını ve hesap verebilirliğini gösterir. Site, ülke vatandaşlarına, yetkililerin vergi gelirlerini neye harcadıkları hakkında bilgi edinme fırsatı sağlamak için tasarlandı. Ama ondan önce hükümet daha çok bir kara kutu gibiydi. Data.gov'daki verilerin önemli bir kısmı daha önce kamuya açıktı - departmanların web sitelerindeydi, ancak bunlar Web'e dağılmıştı. Artık tüm bilgiler tek bir yerde toplanmış ve biçimlendirilmiş, böylece analizleri ve görselleştirmeleri çok daha kolay hale gelmiştir. Birleşmiş Milletler'in de benzer bir portalı var - UNdata. Birleşik Krallık'ın Data.gov.uk ile aynı şeyi yapması çok uzun sürmedi. New York, San Francisco ve Londra gibi dünyanın belli başlı şehirleri de birçok verinin sağlayıcısıdır.

Binlerce uygulama programlama arabiriminin (API) ortaya çıkması da topluluk ağının keşfedilmesine büyük katkıda bulundu. Amaç, geliştiricileri neşelendirmek ve tüm bu verilerle bir şeyler yapmaya ikna etmekti. Twitter ve Flickr gibi uygulamalar, sitelerde görülenlerden tamamen farklı kullanıcı arayüzleri oluşturmayı mümkün kılan zengin API'lere sahiptir. Bir API kataloglama kaynağı olan ProgrammableWeb, bunlardan 2.000'den fazlasına sahiptir. Daha yakın zamanlarda, Infochimps ve Factual gibi özel olarak yapılandırılmış veri sağlamak için tasarlanmış yeni uygulamalar ortaya çıktı.

Eğer etrafta - mağazalarda, depolarda ve veri tabanlarında - bu kadar çok veri toplanmışsa, onları anlayabilecek kişilerin ortaya çıkması için durum olgunlaşmış demektir. Verilerin kendisi o kadar da ilginç değil (en azından insanlığın çoğu için değil). Bu verilerden çıkarılabilecek bilgiler ilginçtir. İnsanlar verilerinin ne söylediğini bilmek ister ve bunu yapmalarına yardımcı olabilirseniz, yüksek talep görürsünüz. Google'ın baş ekonomisti Hal Varian'ın istatistikçiliğin önümüzdeki on yılın en seksi işi olduğunu ve istatistikçiler çok yakışıklı olduğu için değil, bu yüzden söylüyor. (Gerçi bize geeky* chic merceğinden bakarsanız, hemen hemen hiçbir şeyiz.) Görselleştirme Büyük bir veri tabanını keşfetmenin ve onu anlamlandırmaya çalışmanın en iyi yollarından biri görselleştirmedir. Rakamları görünür alana koyun ve beynin - sizin veya okuyucularınızın - kalıpları tanımlamasına izin verin. Bu işte hepimiz ustayız. Sadece resmi istatistiksel yöntemlerle daha önce görmemiş olabileceğiniz hikayeleri görebileceksiniz.

En sevdiğim istatistikçi ve keşifsel veri analizinin babası olan John Tukey, istatistiksel yöntemleri ve diğer pek az kişi gibi özellikleri anladı ve grafik yöntemlerin de meşru bir var olma hakkına sahip olduğuna inanıyordu. Resimlerin bizim için beklenmedik şeyleri ortaya çıkarabileceğine derinden inanıyordu. Sadece görselleştirerek verilerden çok şey öğrenebilirsiniz ve bazı durumlarda bilinçli bir karar vermek veya bir hikaye anlatmak için yapmanız gereken tek şey budur.

Örneğin, 2009 yılında Amerika Birleşik Devletleri işsizlik oranında önemli bir artış yaşadı. 2007'de ortalama yüzde 4,6, 2008'de yüzde 5,8'e ve Eylül 2009'da yüzde 9,8'e ulaştı. Ancak, bu ulusal ortalamalar hikayenin sadece bir kısmını anlatıyor. Bu, bir bütün olarak ABD'nin bir özetidir. Ama belki de işsizlik oranının diğer yerlerden daha yüksek olduğu bazı bölgeler vardı? Belki de bu sıkıntının genel olarak atladığı bölgeler olmuştur?

Şekil 2'de gösterilen haritalar. 0.1, bu hikayenin daha geniş bir versiyonunu anlatın, onlara bakmanız yeterlidir ve önceki paragraftaki soruları cevaplayabilirsiniz.

Koyu renkli ilçeler, işsizlik oranının nispeten yüksek olduğu, açık renkli ilçelerin ise nispeten düşük olduğu bölgelerdir. 2009'da batıda işsizlik oranının yüzde 10'un üzerine çıktığı birçok bölgeyi zaten görüyorsunuz. Aynı durum doğudaki çoğu bölgede gelişmiştir. Ancak Ortabatı bölgeleri daha az etkilenmiştir (bkz. Şekil 0.2).

–  –  –

Pirinç. 0.1. 2004'ten 2009'a kadar ABD işsizlik oranını gösteren haritalar

Pirinç. 0.2. 2009'daki işsizlik oranını gösteren harita

12 GİRİŞ

–  –  –

yani, bir tabloda verileri anlamak kolay değildir ve onlardan çıkarabileceğiniz tek şey bireysel değerlerdir. Ancak grafik versiyonunda trendleri ve kalıpları kolayca fark edebilir ve bir bakışta karşılaştırmalar yapabilirsiniz.

New York Times ve Washington Post gibi haber sağlayıcıları, verileri daha erişilebilir ve görünür kılmak için harika bir iş çıkarıyor.

Muhtemelen tüm bu açık bilgileri diğerlerinden daha iyi kullanıyorlar ve okuyuculara her gün daha fazla yeni hikaye anlatıyorlar.

Bazen veri grafikleri hikayeyi farklı bir bakış açısıyla zenginleştirmek için kullanılır, bazen de grafikler aslında tüm hikayeyi anlatır.

Çevrimiçi medyanın gelişmesiyle birlikte çizelgeler ve grafikler daha da yaygın hale geldi. Bugün haber şirketlerinin yalnızca etkileşimlilerle veya yalnızca diyagramlarla veya yalnızca haritalarla ilgilenen özel hizmetleri var. Örneğin New York Times'ın "bilgisayarlı habercilik" olarak adlandırdıkları şeye özel olarak ayrılmış bir haber odası bile var.

Yerel gazeteciler sayılarla ilgili haberler konusunda uzmandır. Ve New York Times'daki grafik departmanı, büyük miktarda veriyle uğraşmaya yabancı değil.

Görselleştirme aynı zamanda pop kültürüne de girmiştir. Çevrimiçi etkileşimleriyle tanınan bir görselleştirme firması olan Stamen Design, son birkaç yıldır Figür'ü yıllık ödül töreni için hazırlıyor. 0.4. "Statistical Yearbook United MTV Video Müzik Ödülleri izleyici tweet'lerinden alınan verilerin grafiksel bir görünümü." devletler"

14 GİRİŞ

–  –  –

siyah, beyaz ve kırmızı, komünist bir gazete yayınlamak veya bir pandayı öldürmekle eş anlamlıdır. FlowingData'da yayınladığım bir dizi mizahi gönderi olan Data Underload, bu türe kendi bakış açım. Her gün gözlemler yapıyorum ve bunları diyagramlar halinde yayınlıyorum. Şek. 0,5, Amerikan Film Enstitüsü'nün derecelendirmelerinde yer alan ünlü filmlerden alıntıları gösterir. Kesinlikle saçma ama komik bir şey çıktı (en azından benim için).

Peki görselleştirme nedir? Pekala, hepsi kiminle konuştuğuna bağlı.

Bazı insanlar görselleştirmenin geleneksel diyagramlar ve grafikler olduğunu iddia ediyor. Diğerleri daha liberal. Onlar için verileri gösterebilen her şey görselleştirmedir ve ne olduğu önemli değildir: bir veri sanatı eseri veya Microsoft Excel'de bir tablo. Bazen kendimi birinci grubun üyeleri arasında bulsam da, kişisel olarak ikincisine daha çok meylediyorum. Sonunda, o kadar da önemli değil. Sadece amaçlarınıza uygun olanı yapın.

Hangi görselleştirme tanımına karar verirseniz verin, sunumunuz için diyagramlar oluşturmaya, diğer kitlelerden gelen büyük miktarda dijital bilgiyi analiz etmeye veya bazı veriler içeren bir haber raporu hazırlamaya başladığınızda, sonunda “Gerçeği aramamak” dizisiyle karşılaşacaksınız. . Bir noktada, yalanlar ve istatistikler neredeyse eş anlamlı hale geldi, ancak aslında ek veri yüklemesi "

yalan söyleyen rakamlar değil. Rakamları kullananlar yalan söyler. Bazen bunu kasıtlı olarak yaparlar ("Veri Az Yükü"), bir tür plan uygularlar, ancak çoğu durumda bu istemeden olur. FlowingData web sitesinde doğru bir şekilde nasıl çizileceğini veya verileri nasıl tarafsız bir şekilde sunacağınızı bilmediğinizi fark ettiğinizde, şu adrestesiniz: http:// datafl.ws veren bir tür bilgi dökümüne sahip olma olasılığınız yüksek /Tamamen çarpık bir gerçeklik görüşü. Ancak, iyi görselleştirme tekniklerini öğrenir ve verilerle nasıl çalışılacağını öğrenirseniz, fikirlerinizi güvenle iletebilir ve keşiflerinizin keyfini çıkarabilirsiniz.

Verilerle çalışmayı nasıl öğrenirim Üniversitedeki ilk yılımda istatistik okumaya başladım. Elektrik mühendisliğinde istatistik dışı bir derece için gerekli bir dersti. Pek çok korku hikayesi duydum, ancak bu hikayelerde anlatılan öğretmenlerin aksine, profesörüm işine büyük bir hevesle çıktı ve bunu bariz bir zevkle yaptı.

Derslerini okurken, koridorun basamaklarını hızla bir aşağı bir yukarı hareket ettirdi ve yanından geçtiği öğrencilere vurarak geniş bir el hareketi yaptı. O güne kadar, daha ilham verici bir öğretmenim olduğunu sanmıyorum ve bu beni kesinlikle etkiledi - veri dünyasına hayran kaldım. Dört yıl sonra üniversiteden istatistikçi olarak mezun oldum.

Lisans eğitimim boyunca benim için istatistikler veri analizine, dağıtımına ve hipotez testine dayanıyordu ve bunu sevdim. 16 GİRİŞ'e bakmak eğlenceliydi

–  –  –

Hayatınız boyunca tek bir kod satırı yazmadıysanız, R* - birçok istatistikçi tarafından tercih edilen bilgi işlem ortamı - size göz korkutucu görünebilir. Ancak birkaç örnek çalıştıktan sonra, çabucak asılacaksınız. Bu kitap size bu konuda yardımcı olacaktır.

Ben böyle öğrendiğim için söylüyorum. Görselleştirmenin tasarım yönlerini ilk kez incelediğimi hatırlıyorum. New York Times'da grafik editörü olarak staj yapmak üzere işe alındığıma dair ürkütücü haberi aldığımda, lisansüstü okuldaki ikinci sınıfımdan sonraki yazdı. O ana kadar, grafikler benim için her zaman sadece bir analiz aracı olmuştu (okul bilim fuarı için çubuk grafikler dahil) ve benim için önemliyse, estetik ve tasarımın pek bir önemi yoktu. Verilerin gazetecilikte ne kadar önemli olduğu hiç aklıma gelmedi.

Stajıma hazırlanmak için elime geçen her tasarım kitabını okudum ve Adobe Illustrator kullanım kılavuzunu inceledim çünkü bunun New York Times'ın kullandığı program olduğunu biliyordum. Ama gerçekten bir şey öğrendiğim çizelgeler ve grafikler oluşturmaya başlayana kadar değildi. İş başında öğrenerek, iş hayatında ihtiyaç duyulan bilgi ve becerileri çok hızlı bir şekilde kazanmak zorunda kalacaksınız. Ve gitgide daha fazla veri seti ile çalıştıkça ve daha fazla diyagram oluşturdukça, becerileriniz daha aktif bir şekilde gelişecektir.

Bu Kitap Nasıl Okunur Bu kitap örnekler üzerine kurulmuştur ve size baştan sona çeşitli bilgi grafikleri oluşturmak için ihtiyaç duyduğunuz bilgileri vermek için yazılmıştır. Baştan sona okuyabilir ya da zaten bazı verileriniz varsa veya bazı görselleştirme yöntemlerine sahipseniz yalnızca ihtiyacınız olan fikirleri alabilirsiniz. Bölümler, içindeki örnekler bağımsız ve kendi kendine yeterli olacak şekilde düzenlenmiştir. Bu alanda yeniyseniz, özellikle ilk bölümler size yardımcı olacaktır. Elinizdeki verilere nasıl yaklaşacağınızı, içinde neleri arayacağınızı ve hangi araçları kullanacağınızı söylerler. Verileri tam olarak nerede bulacağınızı ve nasıl biçimlendireceğinizi ve görselleştirme için nasıl hazırlayacağınızı öğreneceksiniz. Aşağıdakiler, veri türüne ve bunlarla anlatabileceğiniz hikaye türüne göre yapılandırılmış görselleştirme teknikleridir. Ancak unutmayın: verilerin kendisi her zaman konuşmalıdır.

Bu kitabı hangi yolu seçerseniz seçin, örneklerini adım adım çalışmak için çalışan bir bilgisayarın başında okumanızı, notlarda ve referanslarda belirtilen tüm kaynakları gözden geçirmenizi şiddetle tavsiye ederim. Ayrıca kodları ve veri dosyalarını indirebilir ve http://www.wiley.com/go/visualizethis ve http://book.flowingdata.com adresinden çalışan demoları deneyebilirsiniz.

Yukarıdakileri çok açık hale getirmek için, Şek. 0.6 Size tam olarak neye ihtiyacınız olduğunu anlamanıza yardımcı olacak bir diyagram sunuyorum. İyi eğlenceler!

* R - istatistiksel veri işleme ve grafikler için programlama dili; ücretsiz ve açık kaynaklı yazılım ortamı. Not. başına.

18 GİRİŞ Şek. 0.6. Bu kitabı okumaya nereden başlamalı Verilerle bir hikaye nasıl anlatılır Piyasadaki tüm popüler görselleştirme kitaplarını, derslerde veya blog yazılarında duyduklarınızı ve şu anda aklınıza gelenleri düşünün. gözünüz bu satırlarda Hepsinin ortak noktası ne? Hepsi ilginç hikayeler anlatıyor. Belki de bu hikayelerin sizi bir şeye ikna etmesi gerekiyordu. Ya da belki sizi bir şeyler yapmaya zorlar, sizi yeni bilgilerle tanıştırır veya sizi gerçeklikle ilgili önyargılı fikirlerinizi yeniden düşünmeye zorlar.

Ne olursa olsun, gerçekten iyi bir veri görselleştirme - ne kadar büyük veya küçük olursa olsun, sanat aşkı veya sunum için yaratılmış - verilerin tam olarak ne anlatabileceğini anlamanıza yardımcı olur.

20 BÖLÜM 1: VERİLERLE BİR HİKAYE ANLATMAK

–  –  –

Bir keresinde bir günümü bir dizi veriden üç sayıyı doğrulama görevine ayırdım, çünkü New York Times grafik departmanı bir grafik oluşturduğunda, bilgilerin doğru olduğundan emin olması gerekiyor. Ancak alınan bilgilerin güvenilirliğinden emin olduktan sonra bir sunum oluşturmaya başladık. Bu gazetedeki grafikleri bu kadar iyi yapan ayrıntılara gösterilen özendir.

New York Times'daki herhangi bir çizelgeye veya şemaya bakın. İçindeki veriler her zaman özlü, net ve son derece güzel bir şekilde sunulur. Ancak, bu ne anlama geliyor? Bir infografike baktığınızda, veriler hakkında fikir edinirsiniz. Önemli noktalar veya alanlara yorumlar eşlik eder; semboller ve renkler lejantta veya notlarda düzgün bir şekilde açıklanmıştır; The Times ayrıca verilerde yer alan hikayenin izleyiciler için kolay okunabilmesini sağlar. Artık sadece bir diyagram veya diyagram değil. Bu grafik.

Şekil l'de gösterilen grafikler. 1.1, New York Times'da bulabileceğinize benzer. Önümüzdeki yıl ölme ihtimalinizin yaşınıza bağlı olarak nasıl arttığını gösterir.

Pirinç. 1.1. Yaşınıza göre ölüm olasılığı

22 BÖLÜM 1: VERİLERLE BİR HİKAYE ANLATMAK

–  –  –

Beyazların gerçekten neyi sevdiği ve nasıl yanlış anlaşılmaması gerektiği gibi çevrimiçi flört hakkında daha ilginç şeyler için OkTrends bloguna göz atın: http://blog.

–  –  –

Pirinç. 1.4. Gapminder Fund Trendalizer Görselleştirme açısından, buradaki her şey oldukça basit. Bu sadece dinamik bir grafik. Baloncuklar farklı ülkeleri temsil eder ve belirli bir yılda belirli bir ülkedeki yoksulluk dinamiklerine göre hareket eder.

Peki Rosling'in performansının popülaritesinin ardındaki sır nedir? İnançla ve heyecanla konuşuyor. Bir hikaye anlatıyor. Herkesi esneten diyagramlar ve diyagramlar içeren sunumları kaç kez gördünüz?! Ama Rosling'in durumu farklıdır. Verilerin arkasındaki anlamı çıkardı ve sonuna kadar ortaya çıkardı. Ve buna dersin sonunda kılıcın yutulmasını eklersek, her şey yerine oturur - salonda kimse kayıtsız kalmaz. Rosling'in dersini izledikten sonra bu verileri elime alıp kendim incelemek istedim. Bu hikayenin derinliklerine dalmak için sabırsızlanıyordum.

Daha sonra, aynı konuda, aynı veri görselleştirme biçimiyle, ancak farklı bir konuşmacıyla başka bir Gapminder Foundation sunumunu izledim. Çok heyecan verici olmadığı ortaya çıktı.

Dürüst olmak gerekirse, neredeyse uyuyakaldım. Sıfır duygu vardı. Veriler bende görünmedi.

26 BÖLÜM 1: VERİLERLE BİR HİKAYE ANLATMAK

–  –  –

günde kaç puan değişiyor? Ve bir hafta içinde? Ve bir ay içinde? Oranın normalden fazla yükseldiği dönemler var mı? Ve eğer öyleyse, bu neden oldu? Bu tür değişikliklere neden olabilecek herhangi bir olay oldu mu?



Kendiniz de göreceğiniz gibi, başlangıç ​​noktası olarak alınan tek bir soru ile başlamaya değer ve hemen ardından aşağıdakiler gelecektir. Ve bu sadece zaman serilerinde değil, tüm veri türlerinde böyledir.Veri kümenize daha çok bir araştırmacı gibi yaklaşmaya çalışın, o zaman muhtemelen daha ilginç cevaplar alırsınız.

" Zaman serisi verileri birçok şekilde bölünebilir. Bazen değerleri güne veya saate göre sunmak mantıklı olur. Diğer durumlarda verilere ay veya yıl bazında bakmak daha faydalı olabilir. İlkinde durumda, grafik daha fazla gürültüye sahip olabilir ve ikinci durumda daha genel bir görünüm elde edersiniz.

Bir web sitesine sahip olan ve trafiğini analiz etmek için bir veya başka bir bilgisayar programını kullananlarınız bunu çabucak görebilir. Sitenizdeki trafiğe günlük olarak bakarsanız, Şekil 1'de gösterildiği gibi. 1.6 oldukça inişli çıkışlı olduğunu göreceksiniz. İçindeki dalgalanmalar oldukça büyük.

Pirinç. 1.6. Günlük FlowingData sitesine benzersiz ziyaretçi sayısı

28 BÖLÜM 1: VERİLERLE BİR HİKAYE ANLATMAK

–  –  –

Belli ki bir şey eksik - sanki grafik tasarımcının veriler hakkında düşünecek zamanı yokmuş gibi ve son teslim tarihine yetişmek için aceleyle ona bir form verdi. Çoğu zaman, bu gibi durumlarda açıkça eksik olan şey bağımlılıktır.

İstatistikte, bağımlılık genellikle korelasyon ve nedensellik olarak anlaşılır.

Birden fazla değişken karmaşık ilişkilerle iç içe olabilir.

Altıncı bölüm olan “Bağımlılık Görselleştirme”, tam olarak bu kavramlara ve bunların nasıl görselleştirileceğine odaklanmaktadır.

Ancak, denklemler ve hipotez test kriterleri hakkında düşünmediğiniz daha soyut bir düzlemde, büyüklükleri ve dağılımları görsel olarak karşılaştırmak ve kontrast oluşturmak için çizelgeler ve grafikler geliştirebilirsiniz. Basit bir örnek olarak, Dünya İlerleme Raporu'ndan alınan teknolojinin hayata nüfuz etmesinin bir diyagramını alabiliriz.

ve Şek. 1.8.

–  –  –

Pirinç. 1.8. Dünya çapında teknoloji penetrasyonu Çubuk grafikler, 100 kişi başına düşen çevirmeli ağ ve geniş bant abonelerinin yanı sıra İnternet kullanıcılarının sayısını da gösterir. İnternet kullanıcılarının aralığının (100 kişi başına 0 ile 95 arasında) diğer iki gruba göre çok daha geniş olduğunu unutmayın.

En kolay ve en hızlı yol, kurduğunuz bilgisayar programının her bir çubuk grafik için hangi aralığı kullanacağına kendisinin karar vermesine izin vermektir. Ancak, hepsi

30 BÖLÜM 1: VERİLERLE BİR HİKAYE ANLATMAK

–  –  –

birkaç temel ilkeyi takip edin. Her biri size manevra alanı sağlar, bu yüzden onları bir dizi zor ve hızlı kural yerine kılavuz olarak alsanız iyi olur, ancak grafik tasarım konusunda yeniyseniz, başlamanız gerekenler bunlardır.

–  –  –

* "Maymun görür - maymun yapar", bir başkasının davranışını, anlamını anlamadan kopyalama sürecini anlatan bir Jamaika deyişidir. Not. başına.

Pirinç. 1.13. FlowingData'daki adlandırma yarışmasının sonuçlarından bazıları

36 BÖLÜM 1: VERİLERLE BİR HİKAYE ANLATMAK

–  –  –

Pirinç. 1.15. Diyagramlarda Daireleri Boyutlandırırken Doğru Yaklaşım 1.16, boyutları çap tarafından belirlenen bir çift daireyi göstermektedir. İlk daire, ikincinin çapının yarısı kadardır, ancak alanı dört kat daha küçüktür.

Pirinç. 1.16. Diyagramlarda dairelerin boyutunu belirlerken yanlış yaklaşım Aynı şey, örneğin ağaç haritalarında dikdörtgenlerde de olur. Alanı, yükseklik veya genişlik değil, büyüklük göstergesi olarak kullanır.

Kaynakları Belirtin Veri kaynaklarını belirtme ihtiyacından bahsetmek gereksiz görünebilir - ancak çok fazla insan bunu yapmayı unutuyor. Bütün bu veriler nereden geldi? Gazetelerdeki diyagramlara bakarsanız, kaynağın her zaman onlarda belirtildiğini görürsünüz - genellikle küçük

38 BÖLÜM 1: VERİLERLE BİR HİKAYE ANLATMAK

–  –  –

Verilerle çalışmanın asıl görsel kısmına gelmeden önce, onu almanız gerekir.Görselleştirmeyi ilginç kılan veridir. Eğer ilginç bir bilgiye sahip değilseniz, akılda kalıcı olmayan bir diyagram veya hoş ama işe yaramaz bir resim ile karşılaşacaksınız. İyi verileri nerede bulabilirsiniz? Onlara nasıl gidilir? İşte bu aşamada karşılaştığınız sorular.

Veriler elinize geçtiğinde, bir bilgisayar programına yüklemek için biçimlendirmeniz gerekecektir. Belki de verileri virgülle ayrılmış bir metin dosyası veya bir Excel elektronik tablosu olarak aldınız ve bunu XML gibi bir şeye dönüştürmeniz gerekiyor. Ya da tam tersi. Ya da belki de ihtiyacınız olan veriler bir İnternet uygulaması aracılığıyla yalnızca parçalanmış bir biçimde mevcut ve tüm tabloyu almak istiyorsunuz.

Verileri nasıl çıkaracağınızı ve işleyeceğinizi öğrenmeniz gerekir ve ardından görselleştirme alanındaki yetenekleriniz önemli ölçüde artacaktır.

40 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

ÜNİVERSİTELER

Yüksek lisans öğrencisi olduğumda, elimdeki akademik kaynakları, yani kütüphaneyi sıklıkla kullandım. Birçok kütüphane teknolojik donanımlarında önemli ölçüde ilerlemiştir ve artık büyük veri arşivlerine sahiptir. Çeşitli fakülteler ve bölümler ayrıca, çoğu kamuya açık olan bir ton veri dosyası bulundurur. Doğru, bu mevcut veri kümelerinin çoğu, öncelikle dönem ödevleri yazmak ve ödev yapmak için kullanılmak üzere tasarlanmıştır. Gidip aşağıdaki kaynaklara bakmanızı öneririm.

Veri ve Öykü Kitaplığı (DASL) (http://lib.stat.cmu.edu/DASL) - temel istatistiksel yöntemlerin uygulanmasını gösteren çevrimiçi bir veri ve öykü dosyaları kitaplığı; Carnegie Mellon Üniversitesi'ni ifade eder.

Berkeley Veri Laboratuvarı (http://sunsite3.berkeley.edu/wikis/datalab), UC Berkeley kütüphane sisteminin bir parçasıdır.

42 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

Coğrafya Nesneleri yerelleştirmek için bir programınız var ama coğrafi veri yok mu? Şanslısın. Vektör formatı (şekil dosyaları) dahil olmak üzere çok sayıda coğrafi dosya emrinizde.

TIGER (http://www.census.gov/geo/www/tiger) - ABD Sayım Bürosu web sitesi belki de en pahalı ama aynı zamanda yalnızca bulunabilen otoyollar, demiryolları, nehirler ve posta kodlarına ilişkin en ayrıntılı veritabanlarını sağlar. .

OpenStreetMap (http://www.openstreetmap.org), topluluk veritabanlarının en iyi örneklerinden biridir.

Geocommons (http://www.geocommons.com) hem bir veri tabanı hem de bir haritalama uygulamasıdır.

Flickr Shapefiles (http://www.flickr.com/services/api) - Flickr kullanıcıları tarafından sunulan coğrafi sınırlar.

Spor

İnsanlar spor istatistiklerini sever ve son birkaç on yılda bu tür verilere erişebilirsiniz. Bunları Sports Illustrated web sitesinde ve ilgili spor takımlarının ve organizasyonlarının web sitelerinde ve ayrıca tamamen spor istatistiklerine ayrılmış web sitelerinde bulabilirsiniz.

Basketbol Referansı (http://www.basketball-reference.com), NBA oyunlarının canlı yayınları da dahil olmak üzere kapsamlı bir veri ve bilgi kaynağıdır.

Baseball DataBank (http://baseball-databank.org), kapsamlı beyzbol veri setlerinin indirilebileceği süper kapsamlı bir sitedir.

DatabaseFootball (http://www.databasefootball.com) - Takım, oyuncu ve sezona göre ABD Ulusal Futbol Ligi maç verilerini görüntüleyin.

genel olarak dünya

Dikkate değer birçok uluslararası kuruluş, bir bütün olarak dünya hakkında, özellikle sağlık ve kalkınma gibi göstergelere ilişkin veri tabanları da bulundurmaktadır. Yine de, onlarla çalışırken, birçok veri seti çok iyi yapılandırılmadığından, bir şeyi filtrelemeniz gerekecek. Farklı ülkelerden farklı yollarla veri toplayarak standartlaştırılmış veri elde etmek kolay değildir.

Küresel Sağlık Gerçekleri (http://www.globalhealthfacts.org) - Dünyanın dört bir yanından sağlık verileri.

UNdata (http://data.un.org), dünyadaki çeşitli kaynaklardan gelen verilerin bir toplayıcısıdır.

44 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

Bu adreste .html'den sonraki her şeyi kaldırırsanız, sayfa yine de yüklenir, bu nedenle fazladan karakterlerden kurtulun. Şu anda sizi ilgilendirmiyorlar.

Çıkmalı:

www.wunderground.com/history/airport/KBUF/2010/10/1/DailyHistory.html

48 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

# Açık wunderground.com url zaman damgası = "2009" + str(m) + str(d) print "" için veri alınıyor + zaman damgası url = "http://www.wunderground.com/history/airport/KBUF/2009/ " + str(m) + "/" + str(d) + "/DailyHistory.html" sayfa = urllib2.urlopen(url) # Sayfadan sıcaklığı alın çorba = GüzelSoup(sayfa) # dayTemp = çorba.body.nobr. b.string dayTemp = çorba.findAll(attrs=("class":"nobr")).span.string

–  –  –

# Zaman damgası zaman damgası oluştur = "2009" + mStamp + dStamp # Zaman damgasını ve sıcaklığı f.write(timestamp + "," + dayTemp + "\n") dosyasına yaz # Veri alma işlemi tamamlandı! dosyayı kapat.

f.close() Gerekli kitaplıkları içe aktarmak için kullandığınız ilk iki kod satırını muhtemelen tanımışsınızdır - urllib2 ve BeautifulSoup.

urllib2'yi BeautifulSoup'tan içe aktar GüzelSoup'u içe aktar Ardından, open() yöntemi kullanılarak yazma izinleriyle wunder-data-txt adlı bir metin dosyası oluşturulur. Çıkardığınız tüm veriler, komut dosyanızı kaydettiğiniz dizinde bulunan bu metin dosyasında saklanacaktır.

# wunder.txt (virgülle ayrılmış bir dosya olacaktır) adlı bir dosya oluşturun/açın f = open("wunder-data.txt", "w")

52 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

Sondan bir önceki kod parçası, yıl, ay ve güne göre zaman damgasını derlemekten sorumludur. Zaman damgası "yyyymmdd" biçiminde verilir. Burada herhangi bir formatı ayarlayabilirsiniz, ancak bu aşamada ne kadar basit olursa o kadar iyidir.

# Zaman damgası için günü biçimlendir

len(str(d)) ise 2:

dDamga = "0" + str(d)

–  –  –

Son olarak, "wunder-data.txt" dosyası, write() yöntemini kullanarak "sıcaklık" ve zaman damgasını ekler.

# Dosyaya zaman damgası ve sıcaklık yaz f.write(timestamp + "," + dayTemp + "\n") Kapat() tüm aylar ve günler yapıldığında uygulanır.

# Veri alma işlemi tamamlandı! dosyayı kapat.

f.close() Geriye kalan tek şey, aşağıdaki komutla terminalinizde yapacağınız kodu çalıştırmak:

$ python get-weather-data.py

–  –  –

programlama ve verileri belirli bir anda ihtiyaçlarınızı karşılayacak şekilde istediğiniz formatta görüntüleyebileceksiniz.

En kolay yol, tüm verilerinizi biçimlendirebilecek ve analiz edebilecek bir programcı bulmaktır, ancak o zaman her zaman başka birine bağımlı olursunuz. Bu bağımlılık, anlamlı görselleştirmeler oluşturmak için yineleme ve veri keşfinin anahtar olduğu herhangi bir projenin ilk aşamalarında özellikle belirgin hale gelir. Dürüst olmak gerekirse, işe alım işinde olsaydım, her proje başladığında dışarıdan yardıma ihtiyaç duyan biri yerine verilerle nasıl çalışacağını bilen birini işe almayı tercih ederdim.

BİÇİMLENDİRME HAKKINDA ÖĞRENDİM

Lisede istatistik okumaya ilk başladığımda, veriler bize her zaman düzgün bir tablo biçiminde sunuldu. Tek yapmam gereken birkaç sayıyı bir Excel elektronik tablosuna veya harika grafik hesaplayıcıma yapıştırmaktı (ki bu, bir sınıf ödevi yapıyormuşum gibi davranırken Tetris oynamama izin verdiği için tercih edilirdi). Lisans eğitimi yılları boyunca, durum neredeyse hiç değişmedi. Analiz yöntemlerini ve teoremlerini çalıştığım için öğretmenlerim ham, hazırlıksız verilerle çalışmak için çok fazla zaman harcamadılar. Veriler her zaman iş için uygun bir biçimde varmış gibi görünüyordu.

Bu, zaman kısıtlamaları ve benzerleri göz önüne alındığında anlaşılabilir, ancak lisansüstü okulda, gerçek dünyada, verilerin neredeyse hiçbir zaman ihtiyacınız olan formatta bulunmadığını fark ettim. Bazı anlamlar tamamen eksik, diğerleri herhangi bir bağlam olmadan ortaya çıkıyor veya mantıksız, çelişkili başlıklar ve yazım hataları eşlik ediyor. Çok sık olarak, gerekli veriler farklı tablolara dağılır ve bunların hepsinin tek bir yerde olmasını ve ad veya benzersiz tanımlayıcı gibi tek bir göstergeye göre sıralanmasını istersiniz.

Görselleştirme yapmaya başladığımda da aynı problemle karşılaştım. Ve sahip olduğum verilerle daha fazlasını yapmak istedikçe sorun daha da kötüleşti. Bugün, verileri görselleştirme işini gerçekten yapmak kadar zamana ihtiyacım olan formatta almak için çok zaman harcamam artık benim için alışılmadık bir durum değil. Bazen verileri temizlemem daha da uzun sürüyor. İlk başta garip görünebilir, ancak verileri lisedeki istatistik dersinde olduğu gibi açık bir şekilde organize ettiğinizde grafik oluşturmanın çok daha kolay hale geldiğini göreceksiniz.

Daha sonra, farklı veri formatlarını, bu formatlarla çalışmanıza yardımcı olacak mevcut araçları öğrenecek ve son olarak önceki örnekteki veri çıkarma ile aynı prensipleri kullanarak biraz programlama bilgisi kazanacaksınız.

56 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

GENİŞLETİLEBİLİR İŞARETLEME DİLİ (XML)

Diğer bir yaygın web formatı XML'dir. Genellikle çeşitli API'ler aracılığıyla veri aktarmak için kullanılır. XML'in birçok farklı türü ve spesifikasyonu vardır, ancak en temel seviyesinde, etiketlerin içine alınmış değerlere sahip bir metin belgesi formatı olarak tanımlanabilir. Örneğin, insanların FlowingData gibi bloglara abone olmak için kullandıkları Gerçekten Basit Dağıtım (RSS) beslemesi esasen bir XML dosyasıdır (Şekil 2.7).

Pirinç. 2.7. FlowingData RSS beslemesinin parçası

Güzel Çorba for Python gibi kitaplıkları kullanarak XML'i ayrıştırmak nispeten kolaydır. Kitabın aşağıdaki bölümlerini okuduktan sonra, XML'in yanı sıra CSV ve JSON'u daha iyi anlayacaksınız.

58 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

Bay. VERİ DÖNÜŞTÜRÜCÜ

Genellikle tüm verileri Excel'de alma fırsatınız olur, ancak daha sonra bunları ihtiyaçlarınıza daha uygun başka bir biçime dönüştürmeniz gerekir.

Bu, Web için grafik oluşturma durumunda hemen hemen her zaman olur. Excel elektronik tablolarını CSV formatında nasıl dışa aktaracağınızı zaten biliyorsunuz, ancak ya başka bir şey yapmanız gerekirse? Bay size yardımcı olacaktır. veri dönüştürücü

Bay. Data Converter basit ve ücretsiz bir araçtır. New York Times'ın grafik editörü Shan Carter tarafından oluşturuldu. Carter çalışma zamanının çoğunu gazetenin çevrimiçi versiyonu için etkileşimli grafikler oluşturmak için harcıyor. İşe yarıyor, bu yüzden süreci kolaylaştırmak için bir araç yaratması şaşırtıcı değil .

Bay keyfini çıkarın. Veri Dönüştürücü kolaydır. Şekile bakarak da görebileceğiniz gibi. 2.9, Şek. 2.9. Bay. Data Converter, tamamen basit bir arayüzden veri aktarımını büyük ölçüde basitleştirir. Tüm bu format başka

60 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

Pirinç. 2.11. Mr'da işlendikten sonra tablo formatındaki isimler Bay Gibi İnsanlar Veri Dönüştürücü Mr. People ayrıca açık kaynak kodludur ve GitHub'dan indirilebilir.

TABLO HESAPLAMA PROGRAMLARI

Tabii ki, yalnızca bazı verileri sıralamanız veya tek tek öğelerde küçük değişiklikler yapmanız gerekiyorsa, her zaman favori elektronik tablo programınızı kullanabilirsiniz. Yaklaşan küçük düzenlemeleriniz varsa, dövülmüş piste gidin. Değilse, önce yukarıdakileri deneyin (özellikle büyük miktarda veriniz varsa) veya belirli bir duruma göre uyarlanmış kod yazmayı düşünün. görevler.

62 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

20090101,26 20090102,34 20090103,27 20090104,34 20090105,34 20090106,31 20090107,35 20090108,30 20090109,25 …

–  –  –

max_temperature26/max_temperature /gözlem gözlem tarihi20090102/tarih max_temperature34/max_temperature /gözlem gözlem tarih20090103/date max_temperature27/max_temperature /gözlem gözlem tarihi20090104/date max_temperature34/max_temperature /gözlem ... /hava gözlemi_verileri o gün için maksimum sıcaklık etiketlerini içerir ve tarih gözlemi_verilerini içerir etiketler.

Yukarıda yapıldığı gibi CSV'yi XML formatına dönüştürmek için aşağıdaki kod parçasını kullanabilirsiniz:

import csv okuyucu = csv.reader(open("wunder-data.txt", "r"), delimiter=",") "weather_data" yazdır

okuyucudaki satır için:

yazdır "gözlem" yazdır "tarih" + satır + "/tarih" yazdır "max_temperature" + satır + "/max_temperature" yazdır "/gözlem' yazdır "/weather_data" Gerekli modülleri daha önce olduğu gibi içe aktarın. Bu durumda okumak için wunder-data.txt, yalnızca CSV modülüne ihtiyacınız var.

import csv İkinci kod satırı, wunder-data.txt dosyasını open() kullanarak okumak için açar ve ardından csv.reader() yöntemini kullanarak yükler.

okuyucu = csv.reader(open("wunder-data.txt", "r"), sınırlayıcı=",")

64 BÖLÜM 2. VERİLERİN İŞLENMESİ

–  –  –

CSV'yi XML'e dönüştürmek, her gözlem arasında döngü yapmak ve değerleri istediğiniz biçimde görüntülemek.

Bu sizi başladığınız yere geri götürecektir:

20090101.26 20090102.34 20090103.27 20090104.34 ... Eksiksiz olması için, CSV'yi JSON formatına dönüştürmek için kod burada.

import csv okuyucu = csv.reader(open("wunder-data.txt", "r"), delimiter=",") print "( gözlemler: [" rows_so_far = 0

okuyucudaki satır için:

–  –  –

print "] )" Burada neler olduğunu görmek için satırları gözlerinizle tarayın. Yine aynı mantıkla uğraşıyoruz, sadece farklı bir sonuçla. Yukarıdaki kodu çalıştırırsanız, verilerinizi JSON formatında alacaksınız.

İşte neye benzeyecekler:

–  –  –

Örnek elbette basittir, ancak kalbinizin içeriğine göre verileri biçimlendirmek veya zenginleştirmek için bu ilkeleri nasıl geliştirebileceğinizi gösterir.

Bu üç adımı unutmayın:

Özetleme Bu bölüm, ihtiyacınız olan verileri nasıl bulacağınızı ve bu verileri bulduktan sonra ne yapacağınızı tartıştı. Görselleştirme sürecinde bu, en önemlisi demesek de çok önemli bir aşamadır. Bilgi grafikleri, yalnızca temel alınan veriler kadar ilgi çekicidir. Grafiğinizi veya grafiğinizi istediğiniz gibi dekore edebilirsiniz, ancak temel olarak kalacak olan verilerdir (veya bu verilere ilişkin analizinizin sonuçlarıdır). Artık verileri nereden ve nasıl alacağınızı bildiğinize göre, devam etmeye hazırsınız.

Ayrıca ilk kez programlamada elinizi denediniz. Bir siteden veri çıkardınız ve ardından onu biçimlendirip yeniden düzenlediniz. Bu numara sonraki bölümlerde işinize yarayacaktır. Ancak, koddaki en önemli şey mantıktır. Python kullandınız, ancak Ruby, Perl veya PHP'ye de dönmüş olabilirsiniz. Hangi dili kullanırsanız kullanın, eylem ilkesi aynı kalır. Programlama dillerinden birine hakim olduğunuzda - ve zaten başarılı bir programcıysanız, sözlerimi onaylayacaksınız - daha sonra bir diğerine hakim olmanız çok daha kolay olacaktır.

Kodlara başvurmak her zaman gerekli değildir. Bazı durumlarda, sürükle ve bırak uygulamaları işinizi çok daha kolaylaştırabilir ve bu durumlarda onları kullanmalısınız. Sonuç olarak, araç setinizde ne kadar çok araç varsa, süreçte çıkmaza girme tehlikesi o kadar az olur.

Yani, zaten verileriniz var. Şimdi görselleştirmeye başlama zamanı.

Veri Görselleştirme Araçlarını Seçme Önceki bölümde, verileri nasıl bulacağınızı ve ihtiyacınız olan biçime nasıl dönüştüreceğinizi öğrendiniz. Artık işlemeye başlamaya hazırsınız. Bu aşamada insanların bana en sık sorduğu sorulardan biri şudur: “Verileri görselleştirmek için hangi yazılımı kullanmalıyım?”

Neyse ki, birçok seçeneğiniz var. Bazı programlar bilgisayarınıza önceden yüklenmiştir ve sürükle bırak ilkesiyle çalışır. Diğer araçları kullanmak için bazı programlama becerilerine ihtiyacınız olacak. Ayrıca, özellikle verilerin grafiksel gösterimi için tasarlanmayan, ancak yine de sizin için yararlı olabilecek bazı araçlar vardır. Bu bölüm, veri görselleştirme için yazılım seçme konusuna odaklanmaktadır.

"Ne kadar çok araçta ustalaşırsanız, onların faydalarını o kadar iyi anlarsınız, sahip olduğunuz veri setiyle bir sonraki adımda ne yapacağınızı bilemediğiniz için kafanızın karışması o kadar az olasıdır ve bir grafik ya da grafik oluşturma olasılığınız o kadar artar" grafik, vizyonunuza layık.

70 BÖLÜM 3. VERİ GÖRSELLEŞTİRME ARAÇLARININ SEÇİMİ

–  –  –

Pirinç. 3.2. Microsoft Excel'deki grafik seçenekleri Bazı insanlar Excel'i ciddiye almaz, ancak doğru amaçlar için kullanırsanız kötü bir program değildir. Örneğin, derin analiz yapmam veya yayın için bir grafik tasarlamam gerekirse Excel kullanmıyorum. Ancak, çoğu zaman olduğu gibi bir Excel dosyasında küçük bir veri kümesi alırsam ve önümde ne olduğu hakkında hızlı bir şekilde genel bir fikir edinmek istersem, o zaman bir grafik hazırlamayı tercih ederim. Herkesin sevdiği bu elektronik tablo programında birkaç fare tıklaması.

ŞARTLAR GERÇEKTEN EĞLENCELİ OLABİLİR

Bilgisayarda yaptığım ilk çizelge Microsoft Excel'deydi ve onu bir okul bilim proje fuarı için beşinci sınıfta oluşturdum. Ortağım ve ben hangi yüzeyde salyangozların daha hızlı hareket ettiğini bulmaya çalışıyorduk. Sizi temin ederim, bu çığır açan bir araştırmaydı.

O günlerde bile, şimdi hatırladığım kadarıyla, bir diyagram oluştururken çok eğlendim. Programa alışmam sonsuza dek sürdü (o zamanlar bilgisayar benim için yeniydi), ama sonunda neyin ne olduğunu anladığımda süreç benim için gerçek bir zevkti. Rakamları tabloya girdim ve hemen istediğiniz renge boyayabileceğiniz bir tablo aldım.

Gözlerimin kör olduğu parlak bir sarıyı seçtim - bana bu çok şeymiş gibi geldi.

72 BÖLÜM 3. VERİ GÖRSELLEŞTİRME ARAÇLARININ SEÇİLMESİ

–  –  –

Pirinç. 3.8. Birçok Gözde Dağılım Grafiği 3.9. ABD Anayasası'ndaki "doğru" kelimesinin Ağacı Birçok Gözde Bununla, aynı verileri kullanarak bir araçtan diğerine kolayca geçiş yapabilirsiniz. Şek. 3.10 Yapı, Wordle olarak bilinen stilize edilmiş bir kelime bulutu kullanılarak oluşturulur. Bir kelime ne kadar yaygınsa, o kadar büyüktür.

76 BÖLÜM 3. VERİ GÖRSELLEŞTİRME ARAÇLARININ SEÇİLMESİ

–  –  –

diğerleri gibi bu işte güvenilir değiller, ancak çok daha çekici görsel nesneler oluşturmanıza veya onlara etkileşim vermenize izin veriyor. Hangi dilde durmak daha iyidir, belirli bir diyagram için belirlediğiniz hedeflere ve hangi dille çalışırken kendinizi daha güvende hissettiğinize bağlıdır.

Bazı insanlar belirli bir dile bağlı kalırlar ve zamanla o dilde çok iyi olurlar. Programlamada yeniyseniz de harika. Bu stratejiye bağlı kalmanızı şiddetle tavsiye ederim. İlk olarak, kodun temel ve önemli ilkelerini öğrenin.

İhtiyaçlarınıza en uygun dili kullanın. Ancak yeni diller öğrenmenin ve verilerle oynamanın yeni püf noktalarını öğrenmenin ayrı bir zevki vardır.

Bu yüzden en çok neyi sevdiğinize karar vermeden önce iyi bir programlama deneyimi kazanmalısınız.

Bir önceki bölümde, Python dilini kullanarak verilerin nasıl yönetileceğinden bahsetmiştik.

Bu, gerçek dili özellikle analiz ve güçlü hesaplamalar için kullanışlı hale getirir.

Diğer şeylerin yanı sıra Python, programcıların sevdiği düzgün ve okunabilir bir sözdizimine sahiptir.

Bununla, Şekil l'de gösterilene benzer bir bilgi grafiği oluşturmak için birçok modül üzerinde çalışabilirsiniz. 3.11.

Estetik açısından, bu nesne olağanüstü bir şey değil. Muhtemelen Python ile yeni elde ettiğiniz bir grafiği yazdırmak istemezsiniz. Sonuç genellikle özensiz görünüyor. Yine de, veri keşfi yolculuğunuz için iyi bir başlangıç. Ayrıca bir görüntüyü dışa aktarabilir ve ardından işleyebilir veya bir grafik düzenleyici kullanarak ona bilgi ekleyebilirsiniz. Pirinç. 3.11. Python'da oluşturulan grafik

80 BÖLÜM 3. VERİ GÖRSELLEŞTİRME ARAÇLARININ SEÇİMİ

–  –  –

ÜNİVERSİTE KÜTÜPHANESİ FAALİYETİNDE Monograph Kemerovo 2010 UDC 78.305.8 LBC 022.9 B72 Hakemler: Pedagojik Bilimler Doktoru, Profesör E. L. Kudrina; Pedagoji Doktoru, Profesör N. I. Gendina; kültürel çalışmalar doktoru, profesör G. B. Parshukova Bobrova, E. I. B72 Üniversite kütüphanesinin faaliyetlerinde bilgi ve iletişim teknolojileri ... "

"bir. Disipline hakim olmanın amaçları .2. FKÖ'nün yapısında disiplinin yeri "Eski Rus Sanatının Temelleri" disiplini ... "

«XX. YÜZYIL MÜZİĞİNDE GİZEMLİ KANONLAR VE SERİ KOMPOZİSYON YÖNTEMİ: ETKİLEŞİM SORUNUNA İvanova Ekaterina Vladimirovna Cand. Sanat Tarihi, Moskova Devlet Konservatuarı Müzik Teorisi Anabilim Dalı Doçenti. P.I. Çaykovski, 125009, Rusya, Moskova, B. Nikitskaya st., 13 E-posta: [e-posta korumalı] tr XX. YÜZYIL MÜZİĞİNDE RIDDLE CANONS VE SERİ KOMPOZİSYON YÖNTEMİ: İŞBİRLİĞİ SORUNUNA Ekaterina Ivanova Sanat Adayı (Doktora), Doçent...»

"Bilim ve eğitim. MSTU im. N.E. Bauman. Elektron. dergi 2015. No. 02. S. 169–179. DOI: 10.7463/0215.075801 Editöre Gönderilme: 27 Ocak 2015 Revize: 4 Mart 2015 N.E. Bauman UDC 536.2 Alçak dünya yörüngesindeki uydu sıcaklığının denge değeri Khegab Т.M.1,* MSTU im. N.E. Bauman, Moskova, Rusya Dünyanın koşullu yapay uydusuna etki eden küresel bir şekle sahip ısı akışının bir analizi gerçekleştirilir ve sıcaklığının denge değeri belirlenir. Bir ana dikkat..."

«3 numara | 2014 18+ Viktorya Dönemi Takı | Art Nouveau dönemi | XX yüzyılın sonlarında sanatçılar | reklam yazı işleri yazı işleri müdürü Vladimir Pilyushin 1. yazı işleri müdür yardımcısı Svetlana Pilyushina - [e-posta korumalı] Genel Yayın Yönetmeni Tatyana Samoilova - [e-posta korumalı] uzman gemolog Mikhail Chizhov tasarım ve yerleşim Ekaterina Kalinina çizimleri Ekaterina Kalinina düzeltmen Lyudmila Lebedeva reklam departmanı Kapakta: reklam departmanı Uluslararası Rekabet...»

“On Beşinci Uluslararası Forumu “Yeni Yüzyılın Yeni Fikirleri \ Yeni Yüzyılın Yeni Fikirleri” 15. Uluslararası Forumu “Yeni Yüzyılın Yeni Fikirleri” PR FROM OK OL Rapor -2015” (Uluslararası Üniversitelerin öğretim üyelerinin yayınları sergisi) 27 Şubat 2015 27 Şubat 2015 tarihli “NIoNC-2015”) forumunun katılımcıları JÜRİ OLUŞUMU: Jüri Eşbaşkanlar: Başkanlar Karpova I.N. –...”

«ISSN 1997-4558 SANAT PEDAGOJİSİ http://www.art-education.ru/AE-magazine № 1, 2015 İNSAN YAPIMI OYUNCAKLARIN OKUL ÖNCESİ ÇOCUKLARIN CİNSİYET BİLİNCİNİN OLUŞUMUNDAKİ ÖNEMİ ÜZERİNE OKUL ÖNCESİ ÇOCUKLAR İÇİN EL İMZA YAPILAN OYUNCAKLARIN SOSYO-KÜLTÜREL TANIMLANMASI "CİNSİYET BİLİNCİNİN GELİŞİMİ (SOSYAL VE KÜLTÜREL TANIMLAMA SORUNUNA) LYKOVA İRİNA ALEKSANDROVNA ALYKOVA IRNA Profesörü ...

«Eylül 2013 için TOPLU İNCELEME Beyaz Rusya, yapay olarak oluşturulmuş orman plantasyonlarının kullanımı yoluyla doğal ormanların kesilmesini azaltacaktır, 2 Eylül, Minsk /Maria Dmitrieva BELTA/. Belarus Orman Bakanlığı ormancılık dairesi başkanı Valentin Shatravko bir BelTA muhabirine verdiği demeçte, Belarus, yapay olarak oluşturulmuş orman plantasyonlarının kullanımı yoluyla doğal ormanların kesilmesini azaltacak. Plantasyonların oluşturulması ve kullanılması, yeni baskının taslağı tarafından sağlanmaktadır ... "

« HALK EDEBİYATI VE SANATTA MOTİFLER Nalçik 2014 UDC - 821.352.30:398 LBC - 83.3(0)6 Х - 16 Adıge Filolojisi Anabilim Dalı KBIGI, Filoloji Doktoru H.T. Timizhev Yorumcuları: sektörün baş araştırmacısı...»

«***** Izvestia ***** No. 3 (35), 2014 KOMPLEKS TARIM VE ORMANCILIK HAKKINDA UDC: 674.032:634.0.232(470.44) ULMUS L. İÇİN TÜR SEÇİMİ VE FORM ÇEŞİTLİLİĞİNİN BİLİMSEL TEMELLERİ ALT VOLGA BÖLGESİ KORUYUCU ORMAN BİTKİLERİ I.Yu. Podkovyrov, Tarım Bilimleri Adayı, Doçent Volgograd Devlet Tarım Üniversitesi Bu makale, karmaşık dirençli türler, melezler ve...»




Bilgisayar yardım web sitesi

© Telif hakkı 2022,
rzdoro.ru - Bilgisayar yardım sitesi

  • Kategoriler
  • Ütü
  • Windows 10
  • Tarama
  • Windows 7
  • Ütü
  • Windows 10
  • Tarama
  • Windows 7