Ինչպես եք ապատեղեկատվություն տարածում սարսափելի վահանակներով
Թվերն ինքնին դժվար է կարդալ, և նույնիսկ ավելի դժվար է իմաստալից եզրակացություններ անելը: Հաճախ է պատահում, որ տվյալների արտացոլումը տարբեր գրաֆիկայի և գծապատկերների տեսքով անհրաժեշտ է իրական տվյալների վերլուծություն կատարելու համար:
Այնուամենայնիվ, եթե դուք ժամանակ եք ծախսել տարբեր գծապատկերների վրա դիտելու համար, ապա վաղուց կհասկանաք մի բան. տվյալների ոչ բոլոր վիզուալիզացիաներն են ստեղծվել հավասար:
Սա կլինի մի քանի ամենատարածված սխալների արագ ամփոփումը, որոնք մարդիկ թույլ են տալիս գծապատկերներ ստեղծելիս՝ տվյալները արագ և հեշտությամբ մարսելի ձևով ներկայացնելու համար:
Վատ քարտեզներ
Հետևելով xkcd-ին սկզբում, իսկապես սովորական է տեսնել, որ տվյալները տեղադրվում են քարտեզի վրա սարսափելի և անօգուտ ձևով: Ամենամեծ և ամենատարածված հանցագործներից մեկը կատակերգության մեջ ցուցադրվածն է:
Բնակչության անհետաքրքիր բաշխումներ
Ինչպես պարզվում է, այս օրերին մարդիկ հակված են ապրել քաղաքներում։
Դուք պետք է անհանգստացնեք ցույց տալ քարտեզը միայն այն դեպքում, եթե ձեր դիտած ակնկալվող բաշխումը չի համընկնում ԱՄՆ-ի ընդհանուր բնակչության բաշխման հետ:
Օրինակ, եթե դուք վաճառում էիք սառեցված տակոներ և իմանաք, որ ձեր վաճառքի կեսից ավելին ստացվում էր Արևմտյան Վիրջինիայի մթերային խանութներից, չնայած դրանց առկայությանը ամբողջ երկրի շուկաներում, դա բավականին ուշագրավ կլիներ:
Ցույց տալով քարտեզը, որը ցույց է տալիս դա, ինչպես նաև այն վայրերում, որտեղ taco-ները հայտնի են, կարող են օգտակար տեղեկատվություն տրամադրել:
Նմանապես, եթե դուք վաճառում եք ապրանք, որն ամբողջությամբ անգլերեն է, դուք պետք է ակնկալեք, որ ձեր հաճախորդների բաշխումը կհամապատասխանի անգլերեն խոսողների բաշխմանը ողջ աշխարհում:
Վատ հացահատիկի չափ
Քարտեզը խաթարելու մեկ այլ միջոց է ընտրել հողը աշխարհագրորեն մասերի բաժանելու վատ եղանակ: Ճիշտ ամենափոքր միավորը գտնելու այս խնդիրը սովորական խնդիր է ողջ BI-ում, և վիզուալիզացիաները բացառություն չեն:
Որպեսզի ավելի պարզ լինի, թե ինչի մասին եմ խոսում, եկեք դիտարկենք նույն հատիկի չափի երկու օրինակ, որոնք ունեն երկու շատ տարբեր ազդեցություն:
Նախ, եկեք նայենք ինչ-որ մեկին, որը պատրաստում է Միացյալ Նահանգների տեղագրական քարտեզը՝ յուրաքանչյուր վարչաշրջանի ամենաբարձր բարձրության կետը տարբեր գույնով ստվերելով սահմանված բանալի երկայնքով:
Թեև դա որոշ չափով արդյունավետ է արևելյան ափի համար, բայց երբ դուք հարվածում եք Ժայռոտ լեռների եզրին, իրականում պարզապես ամբողջ աղմուկ է:
Աշխարհագրության մասին շատ լավ պատկերացում չունեք, քանի որ (պատմական բարդ պատճառներով) շրջանների չափերը հակված են մեծանալու, որքան հեռու եք գնում դեպի արևմուտք: Նրանք պատմում են մի պատմություն, պարզապես ոչ թե աշխարհագրության հետ կապված:
Սա հակադրեք կրոնական պատկանելության քարտեզին՝ ըստ շրջանների:
Այս քարտեզը միանգամայն արդյունավետ է, չնայած օգտագործվում է ճիշտ նույն հատիկի չափը: Մենք ի վիճակի ենք արագ, ճշգրիտ և բովանդակալից եզրակացություններ անել Միացյալ Նահանգների շրջանների մասին, թե ինչպես կարող են ընկալվել այդ շրջանները, ինչ կարող են մտածել այնտեղ ապրող մարդիկ իրենց և երկրի մնացած մասերի մասին:
Արդյունավետ քարտեզ պատրաստելը որպես տեսողական օգնություն, թեև դժվար է, բայց կարող է շատ օգտակար և պարզաբանող լինել: Պարզապես համոզվեք, որ մի փոքր մտածեք այն մասին, թե ինչ է փորձում հաղորդել ձեր քարտեզը:
Վատ գծային գրաֆիկներ
Գծավոր գրաֆիկները սովորաբար ավելի տարածված են, քան քարտեզի վրա ներկայացված տեղեկատվությունը: Դրանք հեշտ է կարդալու, հեշտ է ստեղծելու և, ընդհանուր առմամբ, բավականին խնամված:
Թեև դրանք հեշտ է անել, կան որոշ ընդհանուր սխալներ, որոնք մարդիկ կարող են թույլ տալ՝ փորձելով նորից հորինել անիվը:
մոլորեցնող կշեռքներ
Վատ գծապատկերների ամենատարածված օրինակներից մեկն այն է, երբ ինչ-որ մեկը ձախ առանցքով ինչ-որ անբարենպաստ բան է անում:
Սա հատկապես նենգ խնդիր է և դժվար է ընդհանուր ուղեցույցներ տալ: Որպեսզի այս խնդիրը մի փոքր ավելի հեշտ մարսվի, եկեք քննարկենք մի քանի օրինակներ:
Եկեք պատկերացնենք մի ընկերություն, որը արտադրում է երեք ապրանք. Ալֆա, բետա և գամմա վիդջեթներ: Գործադիրը ցանկանում է իմանալ, թե որքան լավ են նրանք վաճառում միմյանց համեմատ, և BI թիմը նրանց համար գրաֆիկ է պատրաստում:
Մի հայացքից գործադիրի մոտ տպավորություն կստեղծվի, որ Ալֆա վիդջեթները շատ ավելի են վաճառում մրցակցությունից, մինչդեռ իրականում նրանք գամմա վիդջեթներից ավելի են վաճառում ընդամենը մոտ 20%-ով, ոչ թե 500%-ով, ինչպես ենթադրվում է վիզուալիզացիայի մեջ:
Սա շատ ակնհայտորեն նողկալի խեղաթյուրման օրինակ է, թե՞ դա: Կարո՞ղ ենք պատկերացնել մի դեպք, երբ այս նույն աղավաղումը ավելի օգտակար կլինի, քան 0-50,000 վանիլային առանցքը:
Օրինակ, եկեք պատկերացնենք նույն ընկերությունը, միայն թե հիմա գործադիրն այլ բան է ուզում իմանալ:
Այս դեպքում յուրաքանչյուր վիջեթ շահույթ է ստանում միայն այն դեպքում, եթե նրանք վաճառեն առնվազն 45,000 միավոր: Պարզելու համար, թե որքան լավ է յուրաքանչյուր ապրանք՝ համեմատած միմյանց հետ և այս հարկի հետ կապված, BI թիմը սկսում է աշխատել և ներկայացնում է հետևյալ վիզուալիզացիան:
TՀեյ բոլորը, բացարձակ թվերով, գտնվում են միմյանցից 20% պատուհանի սահմաններում, բայց որքանո՞վ են դրանք մոտ բոլոր կարևոր 45,000 նշագծին:
Կարծես թե Gamma վիջեթները մի փոքր պակասում են, բայց արդյոք բետա վիջեթներն են: 45,000 տողն անգամ պիտակավորված չէ:
Այս առանցքային առանցքի շուրջ գծապատկերը մեծացնելը շատ տեղեկատվական կլինի:
Նման դեպքերը շատ դժվարացնում են վերմակ խորհուրդներ տալը: Ավելի լավ է զգույշ լինել: Զգուշորեն վերլուծեք յուրաքանչյուր իրավիճակ՝ նախքան y առանցքը անխոհեմ թողնելով ձգվելն ու կտրելը:
Gimmick Bars
Գծային գրաֆիկների շատ ավելի քիչ սարսափելի և պարզ չարաշահումն այն է, երբ մարդիկ փորձում են չափազանց գեղեցիկ լինել իրենց պատկերացումներով: Ճիշտ է, վանիլային գծապատկերը կարող է մի փոքր ձանձրալի լինել, ուստի խելամիտ է, որ մարդիկ փորձեն համեմել այն:
Հայտնի օրինակ է հսկա լատվիացի կանանց տխրահռչակ դեպքը։
Որոշ առումներով դա վերաբերում է նախորդ բաժնում քննարկված որոշ հարցերի: Եթե գծապատկերի ստեղծողը ներառեր ամբողջ y առանցքը մինչև 0'0'', ապա հնդկուհիները հսկա լատվիացիների հետ համեմատած պիքսիների նման չէին լինի:
Իհարկե, եթե նրանք պարզապես օգտագործեին ձողեր, ապա խնդիրը նույնպես կվերանա: Նրանք ձանձրալի են, բայց նաև արդյունավետ:
Վատ կարկանդակ գծապատկերներ
Կարկանդակ գծապատկերները մարդկության թշնամին են: Նրանք սարսափելի են գրեթե բոլոր առումներով: Սա ավելին է, քան հեղինակի կողմից պաշտպանված կրքոտ կարծիքը, սա օբյեկտիվ, գիտական փաստ է։
Կարկանդակ գծապատկերները սխալ բերելու ավելի շատ եղանակներ կան, քան դրանք ճիշտ դարձնելու համար: Նրանք չափազանց նեղ կիրառություններ ունեն, և նույնիսկ դրանցում հարցական է, թե արդյոք դրանք ամենաարդյունավետ գործիքն են աշխատանքի համար:
Այսպես ասած, եկեք միայն խոսենք ամենասարսափելի սխալ քայլերի մասին:
Գերբնակեցված գծապատկերներ
Այս սխալը չափազանց տարածված չէ, բայց չափազանց զայրացնող է, երբ այն հայտնվում է: Այն նաև ցույց է տալիս pi գծապատկերների հիմնարար խնդիրներից մեկը:
Դիտարկենք հետևյալ օրինակը՝ կարկանդակ աղյուսակը, որը ցույց է տալիս տառերի հաճախականության բաշխումը գրավոր անգլերենում:
Նայելով այս գծապատկերին՝ ի՞նչ եք կարծում, կարող եք վստահորեն ասել, որ ես ավելի տարածված եմ, քան R-ն: Կամ O? Սա անտեսում է, որ որոշ կտորներ չափազանց փոքր են նույնիսկ դրանց վրա պիտակ տեղադրելու համար:
Եկեք համեմատենք սա գեղեցիկ, պարզ գծապատկերի հետ:
Պոեզիա՜
Դուք ոչ միայն կարող եք անմիջապես տեսնել յուրաքանչյուր տառը մյուս բոլորի հետ, այլև ճշգրիտ ինտուիցիա եք ստանում դրանց հաճախականությունների վերաբերյալ և հեշտությամբ տեսանելի առանցք, որը ցույց է տալիս իրական տոկոսները:
Այդ նախորդ աղյուսակը. Անուղղելի։ Ուղղակի շատ փոփոխականներ կան:
3D գծապատկերներ
Կարկանդակ գծապատկերների մեկ այլ կոպիտ չարաշահում այն է, երբ մարդիկ դրանք պատրաստում են 3D-ով, հաճախ դրանք թեքելով անսուրբ անկյուններից:
Եկեք նայենք օրինակին:
Մի հայացքից կապույտ «EUL-NGL»-ը մոտավորապես նույնն է, ինչ կարմիր «S&D»-ը, բայց դա այդպես չէ: Եթե մտովի ուղղենք թեքությունը, տարբերությունը շատ ավելի մեծ է, քան թվում է:
Չկա ընդունելի իրավիճակ, երբ այս տեսակի 3D գրաֆիկը գործի, այն գոյություն ունի միայն ընթերցողին հարաբերական մասշտաբների հարցում մոլորեցնելու համար:
Հարթ կարկանդակ գծապատկերները լավ տեսք ունեն:
Վատ գույների ընտրություն
Վերջնական սխալը, որը մարդիկ հակված են թույլ տալու, աննկատ գունային սխեմաներ ընտրելն է: Սա փոքր միավոր է մյուսների համեմատ, բայց այն կարող է մեծ տարբերություն ունենալ մարդկանց համար:
Դիտարկենք հետևյալ աղյուսակը.
Հավանական է, որ սա ձեզ լավ է թվում: Ամեն ինչ հստակ պիտակավորված է, չափսերն ունեն բավականին մեծ անհամապատասխանություններ, որ հեշտ է տեսնել, թե ինչպես են վաճառքները համեմատվում միմյանց հետ:
Այնուամենայնիվ, եթե դուք տառապում եք գունավոր կուրությամբ, դա, ամենայն հավանականությամբ, շատ նյարդայնացնող է:
Որպես ընդհանուր կանոն, կարմիրն ու կանաչը երբեք չպետք է օգտագործվեն նույն գրաֆիկի վրա, հատկապես միմյանց հարևանությամբ:
Գունային սխեմայի այլ սխալները պետք է ակնհայտ լինեն բոլորի համար, օրինակ՝ ընտրելով 6 տարբեր թեթև երանգներ կամ կարմիր:
Takeaways
Տվյալների վիզուալիզացիա ստեղծելու շատ ու շատ այլ եղանակներ կան, որոնք սարսափելի են և խանգարում են, թե որքան լավ են մարդիկ կարողանում հասկանալ տվյալները: Նրանցից բոլորից կարելի է խուսափել մի փոքր մտածվածությամբ։
Կարևոր է հաշվի առնել, թե ինչպես է ուրիշը տեսնելու գրաֆիկը, ինչ-որ մեկը, ով մոտիկից ծանոթ չէ տվյալներին: Դուք պետք է խորը պատկերացում ունենաք, թե որն է տվյալների դիտարկման նպատակը և ինչպես լավագույնս ընդգծել այդ հատվածները՝ առանց մարդկանց մոլորեցնելու: