Charles Joseph Minard (1781 - 1870) a fost un inginer civil francez, recunoscut pe scară largă ca fiind unul dintre primii maeștri ai vizualizării datelor.

minard

În opinia mea, Charles Minard este probabil cel mai inovator om de știință pentru vizualizarea datelor, având în vedere tehnologia limitată a timpului său, și a fost foarte prolific în producerea mai multor grafice complicate. Al său este cunoscut în special pentru capacitatea sa de a reduce complexitatea multidimensională a întrebărilor importante la grafice simple, care ar putea fi ușor decodificate chiar și de către publicul larg.

Obiectiv grafic

Charles Minard este cunoscut în special pentru diagrama figurativă a marșului lui Napoleon la Moscova în 1812. Campania de război a fost dezastruoasă, începând cu aproximativ 422.000 de soldați de la granița poloneză către Rusia, ajungând la Moscova cu doar 100.000 și revenind învins cu doar 10.000 de soldați. Graficul arată amploarea devastării și este o capodoperă a simplificării complexității, deoarece codifică șapte dimensiuni: dimensiunea armatei, direcția (înaintare sau retragere), distanța parcursă, latitudinea și longitudinea, locația legată de bătăliile semnificative, temperatura și data . Iată graficul original:

Acest grafic a fost descris de Edward Tufte (1983, The Visual Display of Quantitative Information) ca „probabil cel mai bun grafic statistic desenat vreodată”. Ca un omagiu adus lui Charles Minard, voi încerca să reproduc acest grafic (cât mai aproape posibil) folosind Stata.

Management de date

Datele provin de pe site-ul web al lui Leland Wilkinson pe Gramatica graficii. Datele, deși sunt exacte în înregistrarea latitudinii și longitudinii, nu sunt exacte în reprezentarea figurativă a lui Charles Minard, așa că fac câteva ajustări manuale la latitudine și longitudine. De asemenea, asociez longitudinea temperaturii cu longitudinea locațiilor de marș.

Cel mai important aspect al gestionării datelor este găsirea unei modalități de codificare a lățimilor segmentelor de linie, astfel încât acestea să reprezinte dimensiunea armatei care avansează și se retrage. Acest lucru se realizează prin exprimarea dimensiunii armatei în termeni relativi, ca porțiuni la maximum în orice moment dat.

Codul pentru reproducerea întregii analize este furnizat la sfârșitul acestei pagini.

Implanturi vizuale

Graficul original se bazează pe implantarea liniei de codificare, conectând locațiile cheie din marș la Moscova și numărând mărimea armatei.

Partea de jos a graficului codifică o altă informație folosind o altă implantare de linie cu lățime fixă ​​a liniei. Această linie codifică temperatura în timpul marșului de întoarcere de la Moscou (Moscova) la Kwono (Kaunas).

Implanturi de linie suplimentare sunt utilizate pentru a conecta informațiile de temperatură cu locația căii de retur. Aceste linii verticale acționează și ca legături între datele temporale ale datei la care temperatura a fost înregistrată cu datele spațiale ale locațiilor cheie.

Implantarea punctuală este, de asemenea, utilizată pentru a codifica locații de bătălii și evenimente cheie.

Variabile retiniene

Variabila retiniană cheie din graficul original este dimensiunea aplicată pe lățimea relativă a implantării liniei. Lățimea este determinată ca dimensiunea relativă a armatei în diferite etape ale campaniei (în raport cu maximul). Iată o primă trecere a acestei abordări de codificare:

Acesta este nucleul graficului. Numeroasele culori arată clar că este o succesiune de mai multe grafice de linie, fiecare conectând doar două coordonate. Restul informațiilor care sunt codificate se bazează în cea mai mare parte pe codificare personalizată în jurul acestei ieșiri.

Variabila retiniană de culoare este utilizată pentru a codifica direcția armatei în avans (culoarea gresiei) și direcția armatei în retragere (în negru). Reproduc culoarea gresiei folosind instrumentul Color Picker care returnează scara RGB de (226.205.175).

Identificarea graficului

Charles Minard a pus un mare accent pe identificarea detaliată care adaugă context graficului.

Identificări directe considerabile etichetează mărimea exactă a armatei în diferite locații. Important, identificarea segmentului de linie mai mare ca 422.000 de soldați și a celui mai subțire ca 4.000 ajută foarte mult la interpretarea lățimilor de linie variate.

Graficul este o capodoperă a simplității și alegerile implantărilor vizuale și ale variabilelor retiniene se explică de la sine și evită necesitatea identificării interne.

Identificarea externă este, de asemenea, extinsă și adaugă un context util. Există un titlu măreț care descrie Obiectivul graficului, tradus ca „Diagrama figurativă a pierderilor succesive ale oamenilor din armata franceză în timpul campaniei ruse, 1812-1813”, urmat de un subtitlu care îl identifică pe creatorul său, dl. Minard, poziția sa, precum și data și locația la care a fost creat graficul. Sub marele titlu și subtitlu, textul explică câteva evenimente cheie în legătură cu bătălii semnificative și treceri de râuri. În partea de jos a graficului, există două mici note cu adrese care identifică locul în care a fost tipărit graficul.

Îmbunătățirea graficului

Raportul de aspect larg îmbunătățește obiectivul graficului, îmbunătățind senzația unui marș lung spre război.

Suprimarea axelor (cu excepția axei de temperatură) aduce în atenție mesajul principal, fără detalii de referință distractive.

Charles Minard a codificat, de asemenea, locația traversărilor de râuri ca evenimente de referință majore (de exemplu, trecerea râului Berezina a costat aproximativ 36.000 de pierderi pentru Napoleon, de aceea „Berezina” este folosită și astăzi în franceză ca sinonim pentru catastrofă). Nu am putut găsi coordonate pentru codificarea debitului râului și aceasta este singura parte a graficului pe care nu am reușit să o reproduc.

Decodare/percepție vizuală

Cu excepția detaliilor minore și a lipsei de codificare pentru râuri, graficul este foarte apropiat de original. Procesul grafic este adaptat acestui obiectiv grafic și nu poate fi generalizat la alte seturi de date.

Observați cum liniile au muchii rotunjite. Acest efect reflectă înțelegerea de către Stata a primelor principii pentru graficarea datelor, așa cum este descris în modelul Graph Workflow.

Primul pas al fiecărui grafic de date este codificarea coordonatelor pe un plan, iar modul natural de codificare a unei coordonate este printr-un punct. Conexiunea a două puncte face o linie și cu cât linia este mai groasă, cu atât sunt mai mari punctele de conectare, astfel efectul de margine rotunjit.

Aș fi putut reproduce marginile înclinate folosind liniile țepoase ale lui Stata cu lățime groasă, dar de fapt prefer marginile rotunjite decât codificarea originală cu marginile înclinate, deoarece marginile rotunjite sugerează o adunare sau distribuire mai naturală a trupelor armatei într-un mod gradual.