Ապատեղեկատվության տարածում սարսափելի վահանակներով

by Aug 17, 2022BI/Analytics0 մեկնաբանություններ

Ինչպես եք ապատեղեկատվություն տարածում սարսափելի վահանակներով

 

 

Թվերն ինքնին դժվար է կարդալ, և նույնիսկ ավելի դժվար է իմաստալից եզրակացություններ անելը: Հաճախ է պատահում, որ տվյալների արտացոլումը տարբեր գրաֆիկայի և գծապատկերների տեսքով անհրաժեշտ է իրական տվյալների վերլուծություն կատարելու համար: 

Այնուամենայնիվ, եթե դուք ժամանակ եք ծախսել տարբեր գծապատկերների վրա դիտելու համար, ապա վաղուց կհասկանաք մի բան. տվյալների ոչ բոլոր վիզուալիզացիաներն են ստեղծվել հավասար:

Սա կլինի մի քանի ամենատարածված սխալների արագ ամփոփումը, որոնք մարդիկ թույլ են տալիս գծապատկերներ ստեղծելիս՝ տվյալները արագ և հեշտությամբ մարսելի ձևով ներկայացնելու համար:

Վատ քարտեզներ

Հետևելով xkcd-ին սկզբում, իսկապես սովորական է տեսնել, որ տվյալները տեղադրվում են քարտեզի վրա սարսափելի և անօգուտ ձևով: Ամենամեծ և ամենատարածված հանցագործներից մեկը կատակերգության մեջ ցուցադրվածն է: 

Բնակչության անհետաքրքիր բաշխումներ

Ինչպես պարզվում է, այս օրերին մարդիկ հակված են ապրել քաղաքներում։ 

Դուք պետք է անհանգստացնեք ցույց տալ քարտեզը միայն այն դեպքում, եթե ձեր դիտած ակնկալվող բաշխումը չի համընկնում ԱՄՆ-ի ընդհանուր բնակչության բաշխման հետ:

Օրինակ, եթե դուք վաճառում էիք սառեցված տակոներ և իմանաք, որ ձեր վաճառքի կեսից ավելին ստացվում էր Արևմտյան Վիրջինիայի մթերային խանութներից, չնայած դրանց առկայությանը ամբողջ երկրի շուկաներում, դա բավականին ուշագրավ կլիներ:

Ցույց տալով քարտեզը, որը ցույց է տալիս դա, ինչպես նաև այն վայրերում, որտեղ taco-ները հայտնի են, կարող են օգտակար տեղեկատվություն տրամադրել: 

Նմանապես, եթե դուք վաճառում եք ապրանք, որն ամբողջությամբ անգլերեն է, դուք պետք է ակնկալեք, որ ձեր հաճախորդների բաշխումը կհամապատասխանի անգլերեն խոսողների բաշխմանը ողջ աշխարհում: 

Վատ հացահատիկի չափ

Քարտեզը խաթարելու մեկ այլ միջոց է ընտրել հողը աշխարհագրորեն մասերի բաժանելու վատ եղանակ: Ճիշտ ամենափոքր միավորը գտնելու այս խնդիրը սովորական խնդիր է ողջ BI-ում, և վիզուալիզացիաները բացառություն չեն:

Որպեսզի ավելի պարզ լինի, թե ինչի մասին եմ խոսում, եկեք դիտարկենք նույն հատիկի չափի երկու օրինակ, որոնք ունեն երկու շատ տարբեր ազդեցություն:

Նախ, եկեք նայենք ինչ-որ մեկին, որը պատրաստում է Միացյալ Նահանգների տեղագրական քարտեզը՝ յուրաքանչյուր վարչաշրջանի ամենաբարձր բարձրության կետը տարբեր գույնով ստվերելով սահմանված բանալի երկայնքով: 

 

 

Թեև դա որոշ չափով արդյունավետ է արևելյան ափի համար, բայց երբ դուք հարվածում եք Ժայռոտ լեռների եզրին, իրականում պարզապես ամբողջ աղմուկ է:

Աշխարհագրության մասին շատ լավ պատկերացում չունեք, քանի որ (պատմական բարդ պատճառներով) շրջանների չափերը հակված են մեծանալու, որքան հեռու եք գնում դեպի արևմուտք: Նրանք պատմում են մի պատմություն, պարզապես ոչ թե աշխարհագրության հետ կապված: 

Սա հակադրեք կրոնական պատկանելության քարտեզին՝ ըստ շրջանների:

 

 

Այս քարտեզը միանգամայն արդյունավետ է, չնայած օգտագործվում է ճիշտ նույն հատիկի չափը: Մենք ի վիճակի ենք արագ, ճշգրիտ և բովանդակալից եզրակացություններ անել Միացյալ Նահանգների շրջանների մասին, թե ինչպես կարող են ընկալվել այդ շրջանները, ինչ կարող են մտածել այնտեղ ապրող մարդիկ իրենց և երկրի մնացած մասերի մասին:

Արդյունավետ քարտեզ պատրաստելը որպես տեսողական օգնություն, թեև դժվար է, բայց կարող է շատ օգտակար և պարզաբանող լինել: Պարզապես համոզվեք, որ մի փոքր մտածեք այն մասին, թե ինչ է փորձում հաղորդել ձեր քարտեզը:

Վատ գծային գրաֆիկներ

Գծավոր գրաֆիկները սովորաբար ավելի տարածված են, քան քարտեզի վրա ներկայացված տեղեկատվությունը: Դրանք հեշտ է կարդալու, հեշտ է ստեղծելու և, ընդհանուր առմամբ, բավականին խնամված:

Թեև դրանք հեշտ է անել, կան որոշ ընդհանուր սխալներ, որոնք մարդիկ կարող են թույլ տալ՝ փորձելով նորից հորինել անիվը: 

մոլորեցնող կշեռքներ

Վատ գծապատկերների ամենատարածված օրինակներից մեկն այն է, երբ ինչ-որ մեկը ձախ առանցքով ինչ-որ անբարենպաստ բան է անում: 

Սա հատկապես նենգ խնդիր է և դժվար է ընդհանուր ուղեցույցներ տալ: Որպեսզի այս խնդիրը մի փոքր ավելի հեշտ մարսվի, եկեք քննարկենք մի քանի օրինակներ: 

Եկեք պատկերացնենք մի ընկերություն, որը արտադրում է երեք ապրանք. Ալֆա, բետա և գամմա վիդջեթներ: Գործադիրը ցանկանում է իմանալ, թե որքան լավ են նրանք վաճառում միմյանց համեմատ, և BI թիմը նրանց համար գրաֆիկ է պատրաստում: 

 

 

Մի հայացքից գործադիրի մոտ տպավորություն կստեղծվի, որ Ալֆա վիդջեթները շատ ավելի են վաճառում մրցակցությունից, մինչդեռ իրականում նրանք գամմա վիդջեթներից ավելի են վաճառում ընդամենը մոտ 20%-ով, ոչ թե 500%-ով, ինչպես ենթադրվում է վիզուալիզացիայի մեջ:

Սա շատ ակնհայտորեն նողկալի խեղաթյուրման օրինակ է, թե՞ դա: Կարո՞ղ ենք պատկերացնել մի դեպք, երբ այս նույն աղավաղումը ավելի օգտակար կլինի, քան 0-50,000 վանիլային առանցքը:

Օրինակ, եկեք պատկերացնենք նույն ընկերությունը, միայն թե հիմա գործադիրն այլ բան է ուզում իմանալ:

Այս դեպքում յուրաքանչյուր վիջեթ շահույթ է ստանում միայն այն դեպքում, եթե նրանք վաճառեն առնվազն 45,000 միավոր: Պարզելու համար, թե որքան լավ է յուրաքանչյուր ապրանք՝ համեմատած միմյանց հետ և այս հարկի հետ կապված, BI թիմը սկսում է աշխատել և ներկայացնում է հետևյալ վիզուալիզացիան: 

 

 

TՀեյ բոլորը, բացարձակ թվերով, գտնվում են միմյանցից 20% պատուհանի սահմաններում, բայց որքանո՞վ են դրանք մոտ բոլոր կարևոր 45,000 նշագծին: 

Կարծես թե Gamma վիջեթները մի փոքր պակասում են, բայց արդյոք բետա վիջեթներն են: 45,000 տողն անգամ պիտակավորված չէ:

Այս առանցքային առանցքի շուրջ գծապատկերը մեծացնելը շատ տեղեկատվական կլինի: 

Նման դեպքերը շատ դժվարացնում են վերմակ խորհուրդներ տալը: Ավելի լավ է զգույշ լինել: Զգուշորեն վերլուծեք յուրաքանչյուր իրավիճակ՝ նախքան y առանցքը անխոհեմ թողնելով ձգվելն ու կտրելը: 

Gimmick Bars

Գծային գրաֆիկների շատ ավելի քիչ սարսափելի և պարզ չարաշահումն այն է, երբ մարդիկ փորձում են չափազանց գեղեցիկ լինել իրենց պատկերացումներով: Ճիշտ է, վանիլային գծապատկերը կարող է մի փոքր ձանձրալի լինել, ուստի խելամիտ է, որ մարդիկ փորձեն համեմել այն:

Հայտնի օրինակ է հսկա լատվիացի կանանց տխրահռչակ դեպքը։

 

 

Որոշ առումներով դա վերաբերում է նախորդ բաժնում քննարկված որոշ հարցերի: Եթե ​​գծապատկերի ստեղծողը ներառեր ամբողջ y առանցքը մինչև 0'0'', ապա հնդկուհիները հսկա լատվիացիների հետ համեմատած պիքսիների նման չէին լինի: 

Իհարկե, եթե նրանք պարզապես օգտագործեին ձողեր, ապա խնդիրը նույնպես կվերանա: Նրանք ձանձրալի են, բայց նաև արդյունավետ:  

Վատ կարկանդակ գծապատկերներ

Կարկանդակ գծապատկերները մարդկության թշնամին են: Նրանք սարսափելի են գրեթե բոլոր առումներով: Սա ավելին է, քան հեղինակի կողմից պաշտպանված կրքոտ կարծիքը, սա օբյեկտիվ, գիտական ​​փաստ է։

Կարկանդակ գծապատկերները սխալ բերելու ավելի շատ եղանակներ կան, քան դրանք ճիշտ դարձնելու համար: Նրանք չափազանց նեղ կիրառություններ ունեն, և նույնիսկ դրանցում հարցական է, թե արդյոք դրանք ամենաարդյունավետ գործիքն են աշխատանքի համար: 

Այսպես ասած, եկեք միայն խոսենք ամենասարսափելի սխալ քայլերի մասին:

Գերբնակեցված գծապատկերներ

Այս սխալը չափազանց տարածված չէ, բայց չափազանց զայրացնող է, երբ այն հայտնվում է: Այն նաև ցույց է տալիս pi գծապատկերների հիմնարար խնդիրներից մեկը:

Դիտարկենք հետևյալ օրինակը՝ կարկանդակ աղյուսակը, որը ցույց է տալիս տառերի հաճախականության բաշխումը գրավոր անգլերենում: 

 

 

Նայելով այս գծապատկերին՝ ի՞նչ եք կարծում, կարող եք վստահորեն ասել, որ ես ավելի տարածված եմ, քան R-ն: Կամ O? Սա անտեսում է, որ որոշ կտորներ չափազանց փոքր են նույնիսկ դրանց վրա պիտակ տեղադրելու համար: 

Եկեք համեմատենք սա գեղեցիկ, պարզ գծապատկերի հետ: 

 

 

Պոեզիա՜

Դուք ոչ միայն կարող եք անմիջապես տեսնել յուրաքանչյուր տառը մյուս բոլորի հետ, այլև ճշգրիտ ինտուիցիա եք ստանում դրանց հաճախականությունների վերաբերյալ և հեշտությամբ տեսանելի առանցք, որը ցույց է տալիս իրական տոկոսները:

Այդ նախորդ աղյուսակը. Անուղղելի։ Ուղղակի շատ փոփոխականներ կան: 

3D գծապատկերներ

Կարկանդակ գծապատկերների մեկ այլ կոպիտ չարաշահում այն ​​է, երբ մարդիկ դրանք պատրաստում են 3D-ով, հաճախ դրանք թեքելով անսուրբ անկյուններից: 

Եկեք նայենք օրինակին:

 

 

Մի հայացքից կապույտ «EUL-NGL»-ը մոտավորապես նույնն է, ինչ կարմիր «S&D»-ը, բայց դա այդպես չէ: Եթե ​​մտովի ուղղենք թեքությունը, տարբերությունը շատ ավելի մեծ է, քան թվում է:

Չկա ընդունելի իրավիճակ, երբ այս տեսակի 3D գրաֆիկը գործի, այն գոյություն ունի միայն ընթերցողին հարաբերական մասշտաբների հարցում մոլորեցնելու համար: 

Հարթ կարկանդակ գծապատկերները լավ տեսք ունեն: 

Վատ գույների ընտրություն

Վերջնական սխալը, որը մարդիկ հակված են թույլ տալու, աննկատ գունային սխեմաներ ընտրելն է: Սա փոքր միավոր է մյուսների համեմատ, բայց այն կարող է մեծ տարբերություն ունենալ մարդկանց համար: 

Դիտարկենք հետևյալ աղյուսակը. 

 

 

Հավանական է, որ սա ձեզ լավ է թվում: Ամեն ինչ հստակ պիտակավորված է, չափսերն ունեն բավականին մեծ անհամապատասխանություններ, որ հեշտ է տեսնել, թե ինչպես են վաճառքները համեմատվում միմյանց հետ:

Այնուամենայնիվ, եթե դուք տառապում եք գունավոր կուրությամբ, դա, ամենայն հավանականությամբ, շատ նյարդայնացնող է: 

Որպես ընդհանուր կանոն, կարմիրն ու կանաչը երբեք չպետք է օգտագործվեն նույն գրաֆիկի վրա, հատկապես միմյանց հարևանությամբ: 

Գունային սխեմայի այլ սխալները պետք է ակնհայտ լինեն բոլորի համար, օրինակ՝ ընտրելով 6 տարբեր թեթև երանգներ կամ կարմիր:

Takeaways

Տվյալների վիզուալիզացիա ստեղծելու շատ ու շատ այլ եղանակներ կան, որոնք սարսափելի են և խանգարում են, թե որքան լավ են մարդիկ կարողանում հասկանալ տվյալները: Նրանցից բոլորից կարելի է խուսափել մի փոքր մտածվածությամբ։

Կարևոր է հաշվի առնել, թե ինչպես է ուրիշը տեսնելու գրաֆիկը, ինչ-որ մեկը, ով մոտիկից ծանոթ չէ տվյալներին: Դուք պետք է խորը պատկերացում ունենաք, թե որն է տվյալների դիտարկման նպատակը և ինչպես լավագույնս ընդգծել այդ հատվածները՝ առանց մարդկանց մոլորեցնելու: 

 

BI/Analytics
Դուք վերջերս բացահայտել եք ինքներդ ձեզ:

Դուք վերջերս բացահայտել եք ինքներդ ձեզ:

  Մենք խոսում ենք ամպի անվտանգության մասին Over Exposure. Եկեք այսպես ձևակերպենք, ի՞նչն է ձեզ անհանգստացնում մերկացման մասին: Որո՞նք են ձեր ամենաթանկ ակտիվները: Ձեր սոցիալական ապահովության համարը: Ձեր բանկային հաշվի տվյալները: Անձնական փաստաթղթեր, թե՞ լուսանկարներ։ Ձեր կրիպտո...

Կարդալ ավելին

BI/Analytics
KPI-ների կարևորությունը և դրանց արդյունավետ օգտագործման եղանակները

KPI-ների կարևորությունը և դրանց արդյունավետ օգտագործման եղանակները

KPI-ների կարևորությունը Եվ երբ միջակությունն ավելի լավ է, քան կատարյալը Ձախողման ճանապարհներից մեկը կատարելության վրա պնդելն է: Կատարելությունն անհնար է և բարու թշնամին: Օդային հարձակման վաղ նախազգուշացման ռադարի գյուտարարն առաջարկել է «անկատարի պաշտամունք»։ Նրա փիլիսոփայությունն էր...

Կարդալ ավելին

BI/AnalyticsՉդասակարգված
CI / CD
Տուրբո լիցքավորեք ձեր վերլուծության իրականացումը CI/CD-ի միջոցով

Տուրբո լիցքավորեք ձեր վերլուծության իրականացումը CI/CD-ի միջոցով

Այսօրվա արագ տեմպերով digital լանդշաֆտը, ձեռնարկությունները հիմնվում են տվյալների վրա հիմնված պատկերացումների վրա՝ տեղեկացված որոշումներ կայացնելու և մրցակցային առավելություններ ձեռք բերելու համար: Վերլուծական լուծումների արդյունավետ և արդյունավետ ներդրումը չափազանց կարևոր է տվյալներից արժեքավոր տեղեկատվություն ստանալու համար: Մեկ ճանապարհ...

Կարդալ ավելին

BI/Analytics
Մտավոր սեփականության բլոգ
Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում

Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում

Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում Պատմությունը ծանոթ է: Հիմնական աշխատակիցը լքում է ձեր ընկերությունը, և կա մտավախություն, որ աշխատակիցը կվերցնի առևտրային գաղտնիքները և այլ գաղտնի տեղեկատվություն դռնից դուրս գալու ժամանակ: Երևի լսում ես...

Կարդալ ավելին

BI/Analytics
Silicon Valley բանկ
Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը

Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը

Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը Փոփոխությունների կառավարման և պատշաճ վերահսկողության կարևորությունը Բոլորը վերլուծում են Սիլիկոն Վելի բանկի վերջին ձախողման հետևանքները: Ֆեդերատիվները խփում են իրենց՝ նախազգուշացնող նշանները չտեսնելու համար...

Կարդալ ավելին

BI/Analytics
AI՝ Պանդորայի արկղ կամ նորարարություն

AI՝ Պանդորայի արկղ կամ նորարարություն

AI. Պանդորայի արկղ կամ նորարարություն Գտնել հավասարակշռություն Արհեստական ​​ինտելեկտի բարձրացրած նոր հարցերի և նորարարության առավելությունների լուծման միջև Գոյություն ունեն երկու հսկայական խնդիր՝ կապված AI-ի և մտավոր սեփականության հետ: Մեկը դրա բովանդակության օգտագործումն է: Օգտագործողը մուտքագրում է բովանդակություն մի...

Կարդալ ավելին