Ապատեղեկատվության տարածում սարսափելի վահանակներով

by Aug 17, 2022BI/Analytics0 մեկնաբանություններ

Ինչպես եք ապատեղեկատվություն տարածում սարսափելի վահանակներով

 

 

Թվերն ինքնին դժվար է կարդալ, և նույնիսկ ավելի դժվար է իմաստալից եզրակացություններ անելը: Հաճախ է պատահում, որ տվյալների արտացոլումը տարբեր գրաֆիկայի և գծապատկերների տեսքով անհրաժեշտ է իրական տվյալների վերլուծություն կատարելու համար: 

Այնուամենայնիվ, եթե դուք ժամանակ եք ծախսել տարբեր գծապատկերների վրա դիտելու համար, ապա վաղուց կհասկանաք մի բան. տվյալների ոչ բոլոր վիզուալիզացիաներն են ստեղծվել հավասար:

Սա կլինի մի քանի ամենատարածված սխալների արագ ամփոփումը, որոնք մարդիկ թույլ են տալիս գծապատկերներ ստեղծելիս՝ տվյալները արագ և հեշտությամբ մարսելի ձևով ներկայացնելու համար:

Վատ քարտեզներ

Հետևելով xkcd-ին սկզբում, իսկապես սովորական է տեսնել, որ տվյալները տեղադրվում են քարտեզի վրա սարսափելի և անօգուտ ձևով: Ամենամեծ և ամենատարածված հանցագործներից մեկը կատակերգության մեջ ցուցադրվածն է: 

Բնակչության անհետաքրքիր բաշխումներ

Ինչպես պարզվում է, այս օրերին մարդիկ հակված են ապրել քաղաքներում։ 

Դուք պետք է անհանգստացնեք ցույց տալ քարտեզը միայն այն դեպքում, եթե ձեր դիտած ակնկալվող բաշխումը չի համընկնում ԱՄՆ-ի ընդհանուր բնակչության բաշխման հետ:

Օրինակ, եթե դուք վաճառում էիք սառեցված տակոներ և իմանաք, որ ձեր վաճառքի կեսից ավելին ստացվում էր Արևմտյան Վիրջինիայի մթերային խանութներից, չնայած դրանց առկայությանը ամբողջ երկրի շուկաներում, դա բավականին ուշագրավ կլիներ:

Ցույց տալով քարտեզը, որը ցույց է տալիս դա, ինչպես նաև այն վայրերում, որտեղ taco-ները հայտնի են, կարող են օգտակար տեղեկատվություն տրամադրել: 

Նմանապես, եթե դուք վաճառում եք ապրանք, որն ամբողջությամբ անգլերեն է, դուք պետք է ակնկալեք, որ ձեր հաճախորդների բաշխումը կհամապատասխանի անգլերեն խոսողների բաշխմանը ողջ աշխարհում: 

Վատ հացահատիկի չափ

Քարտեզը խաթարելու մեկ այլ միջոց է ընտրել հողը աշխարհագրորեն մասերի բաժանելու վատ եղանակ: Ճիշտ ամենափոքր միավորը գտնելու այս խնդիրը սովորական խնդիր է ողջ BI-ում, և վիզուալիզացիաները բացառություն չեն:

Որպեսզի ավելի պարզ լինի, թե ինչի մասին եմ խոսում, եկեք դիտարկենք նույն հատիկի չափի երկու օրինակ, որոնք ունեն երկու շատ տարբեր ազդեցություն:

Նախ, եկեք նայենք ինչ-որ մեկին, որը պատրաստում է Միացյալ Նահանգների տեղագրական քարտեզը՝ յուրաքանչյուր վարչաշրջանի ամենաբարձր բարձրության կետը տարբեր գույնով ստվերելով սահմանված բանալի երկայնքով: 

 

 

Թեև դա որոշ չափով արդյունավետ է արևելյան ափի համար, բայց երբ դուք հարվածում եք Ժայռոտ լեռների եզրին, իրականում պարզապես ամբողջ աղմուկ է:

Աշխարհագրության մասին շատ լավ պատկերացում չունեք, քանի որ (պատմական բարդ պատճառներով) շրջանների չափերը հակված են մեծանալու, որքան հեռու եք գնում դեպի արևմուտք: Նրանք պատմում են մի պատմություն, պարզապես ոչ թե աշխարհագրության հետ կապված: 

Սա հակադրեք կրոնական պատկանելության քարտեզին՝ ըստ շրջանների:

 

 

Այս քարտեզը միանգամայն արդյունավետ է, չնայած օգտագործվում է ճիշտ նույն հատիկի չափը: Մենք ի վիճակի ենք արագ, ճշգրիտ և բովանդակալից եզրակացություններ անել Միացյալ Նահանգների շրջանների մասին, թե ինչպես կարող են ընկալվել այդ շրջանները, ինչ կարող են մտածել այնտեղ ապրող մարդիկ իրենց և երկրի մնացած մասերի մասին:

Արդյունավետ քարտեզ պատրաստելը որպես տեսողական օգնություն, թեև դժվար է, բայց կարող է շատ օգտակար և պարզաբանող լինել: Պարզապես համոզվեք, որ մի փոքր մտածեք այն մասին, թե ինչ է փորձում հաղորդել ձեր քարտեզը:

Վատ գծային գրաֆիկներ

Գծավոր գրաֆիկները սովորաբար ավելի տարածված են, քան քարտեզի վրա ներկայացված տեղեկատվությունը: Դրանք հեշտ է կարդալու, հեշտ է ստեղծելու և, ընդհանուր առմամբ, բավականին խնամված:

Թեև դրանք հեշտ է անել, կան որոշ ընդհանուր սխալներ, որոնք մարդիկ կարող են թույլ տալ՝ փորձելով նորից հորինել անիվը: 

մոլորեցնող կշեռքներ

Վատ գծապատկերների ամենատարածված օրինակներից մեկն այն է, երբ ինչ-որ մեկը ձախ առանցքով ինչ-որ անբարենպաստ բան է անում: 

Սա հատկապես նենգ խնդիր է և դժվար է ընդհանուր ուղեցույցներ տալ: Որպեսզի այս խնդիրը մի փոքր ավելի հեշտ մարսվի, եկեք քննարկենք մի քանի օրինակներ: 

Եկեք պատկերացնենք մի ընկերություն, որը արտադրում է երեք ապրանք. Ալֆա, բետա և գամմա վիդջեթներ: Գործադիրը ցանկանում է իմանալ, թե որքան լավ են նրանք վաճառում միմյանց համեմատ, և BI թիմը նրանց համար գրաֆիկ է պատրաստում: 

 

 

Մի հայացքից գործադիրի մոտ տպավորություն կստեղծվի, որ Ալֆա վիդջեթները շատ ավելի են վաճառում մրցակցությունից, մինչդեռ իրականում նրանք գամմա վիդջեթներից ավելի են վաճառում ընդամենը մոտ 20%-ով, ոչ թե 500%-ով, ինչպես ենթադրվում է վիզուալիզացիայի մեջ:

Սա շատ ակնհայտորեն նողկալի խեղաթյուրման օրինակ է, թե՞ դա: Կարո՞ղ ենք պատկերացնել մի դեպք, երբ այս նույն աղավաղումը ավելի օգտակար կլինի, քան 0-50,000 վանիլային առանցքը:

Օրինակ, եկեք պատկերացնենք նույն ընկերությունը, միայն թե հիմա գործադիրն այլ բան է ուզում իմանալ:

Այս դեպքում յուրաքանչյուր վիջեթ շահույթ է ստանում միայն այն դեպքում, եթե նրանք վաճառեն առնվազն 45,000 միավոր: Պարզելու համար, թե որքան լավ է յուրաքանչյուր ապրանք՝ համեմատած միմյանց հետ և այս հարկի հետ կապված, BI թիմը սկսում է աշխատել և ներկայացնում է հետևյալ վիզուալիզացիան: 

 

 

TՀեյ բոլորը, բացարձակ թվերով, գտնվում են միմյանցից 20% պատուհանի սահմաններում, բայց որքանո՞վ են դրանք մոտ բոլոր կարևոր 45,000 նշագծին: 

Կարծես թե Gamma վիջեթները մի փոքր պակասում են, բայց արդյոք բետա վիջեթներն են: 45,000 տողն անգամ պիտակավորված չէ:

Այս առանցքային առանցքի շուրջ գծապատկերը մեծացնելը շատ տեղեկատվական կլինի: 

Նման դեպքերը շատ դժվարացնում են վերմակ խորհուրդներ տալը: Ավելի լավ է զգույշ լինել: Զգուշորեն վերլուծեք յուրաքանչյուր իրավիճակ՝ նախքան y առանցքը անխոհեմ թողնելով ձգվելն ու կտրելը: 

Gimmick Bars

Գծային գրաֆիկների շատ ավելի քիչ սարսափելի և պարզ չարաշահումն այն է, երբ մարդիկ փորձում են չափազանց գեղեցիկ լինել իրենց պատկերացումներով: Ճիշտ է, վանիլային գծապատկերը կարող է մի փոքր ձանձրալի լինել, ուստի խելամիտ է, որ մարդիկ փորձեն համեմել այն:

Հայտնի օրինակ է հսկա լատվիացի կանանց տխրահռչակ դեպքը։

 

 

Որոշ առումներով դա վերաբերում է նախորդ բաժնում քննարկված որոշ հարցերի: Եթե ​​գծապատկերի ստեղծողը ներառեր ամբողջ y առանցքը մինչև 0'0'', ապա հնդկուհիները հսկա լատվիացիների հետ համեմատած պիքսիների նման չէին լինի: 

Իհարկե, եթե նրանք պարզապես օգտագործեին ձողեր, ապա խնդիրը նույնպես կվերանա: Նրանք ձանձրալի են, բայց նաև արդյունավետ:  

Վատ կարկանդակ գծապատկերներ

Կարկանդակ գծապատկերները մարդկության թշնամին են: Նրանք սարսափելի են գրեթե բոլոր առումներով: Սա ավելին է, քան հեղինակի կողմից պաշտպանված կրքոտ կարծիքը, սա օբյեկտիվ, գիտական ​​փաստ է։

Կարկանդակ գծապատկերները սխալ բերելու ավելի շատ եղանակներ կան, քան դրանք ճիշտ դարձնելու համար: Նրանք չափազանց նեղ կիրառություններ ունեն, և նույնիսկ դրանցում հարցական է, թե արդյոք դրանք ամենաարդյունավետ գործիքն են աշխատանքի համար: 

Այսպես ասած, եկեք միայն խոսենք ամենասարսափելի սխալ քայլերի մասին:

Գերբնակեցված գծապատկերներ

Այս սխալը չափազանց տարածված չէ, բայց չափազանց զայրացնող է, երբ այն հայտնվում է: Այն նաև ցույց է տալիս pi գծապատկերների հիմնարար խնդիրներից մեկը:

Դիտարկենք հետևյալ օրինակը՝ կարկանդակ աղյուսակը, որը ցույց է տալիս տառերի հաճախականության բաշխումը գրավոր անգլերենում: 

 

 

Նայելով այս գծապատկերին՝ ի՞նչ եք կարծում, կարող եք վստահորեն ասել, որ ես ավելի տարածված եմ, քան R-ն: Կամ O? Սա անտեսում է, որ որոշ կտորներ չափազանց փոքր են նույնիսկ դրանց վրա պիտակ տեղադրելու համար: 

Եկեք համեմատենք սա գեղեցիկ, պարզ գծապատկերի հետ: 

 

 

Պոեզիա՜

Դուք ոչ միայն կարող եք անմիջապես տեսնել յուրաքանչյուր տառը մյուս բոլորի հետ, այլև ճշգրիտ ինտուիցիա եք ստանում դրանց հաճախականությունների վերաբերյալ և հեշտությամբ տեսանելի առանցք, որը ցույց է տալիս իրական տոկոսները:

Այդ նախորդ աղյուսակը. Անուղղելի։ Ուղղակի շատ փոփոխականներ կան: 

3D գծապատկերներ

Կարկանդակ գծապատկերների մեկ այլ կոպիտ չարաշահում այն ​​է, երբ մարդիկ դրանք պատրաստում են 3D-ով, հաճախ դրանք թեքելով անսուրբ անկյուններից: 

Եկեք նայենք օրինակին:

 

 

Մի հայացքից կապույտ «EUL-NGL»-ը մոտավորապես նույնն է, ինչ կարմիր «S&D»-ը, բայց դա այդպես չէ: Եթե ​​մտովի ուղղենք թեքությունը, տարբերությունը շատ ավելի մեծ է, քան թվում է:

Չկա ընդունելի իրավիճակ, երբ այս տեսակի 3D գրաֆիկը գործի, այն գոյություն ունի միայն ընթերցողին հարաբերական մասշտաբների հարցում մոլորեցնելու համար: 

Հարթ կարկանդակ գծապատկերները լավ տեսք ունեն: 

Վատ գույների ընտրություն

Վերջնական սխալը, որը մարդիկ հակված են թույլ տալու, աննկատ գունային սխեմաներ ընտրելն է: Սա փոքր միավոր է մյուսների համեմատ, բայց այն կարող է մեծ տարբերություն ունենալ մարդկանց համար: 

Դիտարկենք հետևյալ աղյուսակը. 

 

 

Հավանական է, որ սա ձեզ լավ է թվում: Ամեն ինչ հստակ պիտակավորված է, չափսերն ունեն բավականին մեծ անհամապատասխանություններ, որ հեշտ է տեսնել, թե ինչպես են վաճառքները համեմատվում միմյանց հետ:

Այնուամենայնիվ, եթե դուք տառապում եք գունավոր կուրությամբ, դա, ամենայն հավանականությամբ, շատ նյարդայնացնող է: 

Որպես ընդհանուր կանոն, կարմիրն ու կանաչը երբեք չպետք է օգտագործվեն նույն գրաֆիկի վրա, հատկապես միմյանց հարևանությամբ: 

Գունային սխեմայի այլ սխալները պետք է ակնհայտ լինեն բոլորի համար, օրինակ՝ ընտրելով 6 տարբեր թեթև երանգներ կամ կարմիր:

Takeaways

Տվյալների վիզուալիզացիա ստեղծելու շատ ու շատ այլ եղանակներ կան, որոնք սարսափելի են և խանգարում են, թե որքան լավ են մարդիկ կարողանում հասկանալ տվյալները: Նրանցից բոլորից կարելի է խուսափել մի փոքր մտածվածությամբ։

Կարևոր է հաշվի առնել, թե ինչպես է ուրիշը տեսնելու գրաֆիկը, ինչ-որ մեկը, ով մոտիկից ծանոթ չէ տվյալներին: Դուք պետք է խորը պատկերացում ունենաք, թե որն է տվյալների դիտարկման նպատակը և ինչպես լավագույնս ընդգծել այդ հատվածները՝ առանց մարդկանց մոլորեցնելու: 

 

BI/AnalyticsՉդասակարգված
CI / CD
Տուրբո լիցքավորեք ձեր վերլուծության իրականացումը CI/CD-ի միջոցով

Տուրբո լիցքավորեք ձեր վերլուծության իրականացումը CI/CD-ի միջոցով

Այսօրվա արագ տեմպերով digital լանդշաֆտը, ձեռնարկությունները հիմնվում են տվյալների վրա հիմնված պատկերացումների վրա՝ տեղեկացված որոշումներ կայացնելու և մրցակցային առավելություններ ձեռք բերելու համար: Վերլուծական լուծումների արդյունավետ և արդյունավետ ներդրումը չափազանց կարևոր է տվյալներից արժեքավոր տեղեկատվություն ստանալու համար: Մեկ ճանապարհ...

Կարդալ ավելին

BI/Analytics
Մտավոր սեփականության բլոգ
Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում

Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում

Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում Պատմությունը ծանոթ է: Հիմնական աշխատակիցը լքում է ձեր ընկերությունը, և կա մտավախություն, որ աշխատակիցը կվերցնի առևտրային գաղտնիքները և այլ գաղտնի տեղեկատվություն դռնից դուրս գալու ժամանակ: Երևի լսում ես...

Կարդալ ավելին

BI/Analytics
Silicon Valley բանկ
Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը

Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը

Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը Փոփոխությունների կառավարման և պատշաճ վերահսկողության կարևորությունը Բոլորը վերլուծում են Սիլիկոն Վելի բանկի վերջին ձախողման հետևանքները: Ֆեդերատիվները խփում են իրենց՝ նախազգուշացնող նշանները չտեսնելու համար...

Կարդալ ավելին

BI/Analytics
AI՝ Պանդորայի արկղ կամ նորարարություն

AI՝ Պանդորայի արկղ կամ նորարարություն

AI. Պանդորայի արկղ կամ նորարարություն Գտնել հավասարակշռություն Արհեստական ​​ինտելեկտի բարձրացրած նոր հարցերի և նորարարության առավելությունների լուծման միջև Գոյություն ունեն երկու հսկայական խնդիր՝ կապված AI-ի և մտավոր սեփականության հետ: Մեկը դրա բովանդակության օգտագործումն է: Օգտագործողը մուտքագրում է բովանդակություն մի...

Կարդալ ավելին

BI/Analytics
Կյանքի խաղացում

Կյանքի խաղացում

The Gamification of Life Կարո՞ղ է այն բարելավել տվյալների գրագիտությունը և օգնել կազմակերպություններին ավելի լավ որոշումներ կայացնել: Ես Քաբի հետախույզ էի: Ֆրեդ Հադսոնի մայրը որջի մայրն էր: Մենք ոտքերը խաչած նստում էինք հատակին Ֆրեդի նկուղում՝ իմանալով մեր հաջորդ արկածի մասին: Արկածային...

Կարդալ ավելին

BI/Analytics
NCAA բասկետբոլի տվյալների կողմնակալություն
Swish or Miss. Տվյալների կողմնակալության դերը NCAA բասկետբոլի կանխատեսումների մեջ

Swish or Miss. Տվյալների կողմնակալության դերը NCAA բասկետբոլի կանխատեսումների մեջ

Swish or Miss. Տվյալների կողմնակալության դերը NCAA բասկետբոլի կանխատեսումներում 2023 թվականի քոլեջի բասկետբոլի սեզոնը պսակեց երկու անսպասելի չեմպիոններ, LSU կանանց և UConn տղամարդկանց թիմերը գավաթներ բարձրացրին համապատասխանաբար Դալլասում և Հյուսթոնում: Ասում եմ՝ անսպասելի, քանի որ...

Կարդալ ավելին