Վերլուծություն Սուտ

by Aug 31, 2022BI/Analytics0 մեկնաբանություններ

Վերլուծություն Սուտ

Վերլուծության կողմնակալությունը

 

Մարկ Տվենը վիճելիորեն ասաց. «Կա երեք տեսակի սուտ՝ սուտ, անիծյալ սուտ և. Վերլուծություն». 

Մենք ընդունում ենք, որ վերլուծությունը մեզ տալիս է օգտակար, գործնական պատկերացումներ: Այն, ինչ մենք հաճախ չենք գիտակցում, այն է, թե ինչպես են մեր սեփական և այլոց կողմնակալությունները ազդում պատասխանների վրա, որոնք մեզ տրվում են նույնիսկ ամենաբարդ ծրագրերի և համակարգերի կողմից: Երբեմն մենք կարող ենք անազնիվ կերպով մանիպուլյացիայի ենթարկվել, բայց, ավելի հաճախ, դա կարող է լինել նուրբ և անգիտակցական կողմնակալություններ, որոնք սողում են մեր վերլուծության մեջ: Կողմնակալ վերլուծության հիմքում ընկած մոտիվացիան բազմաթիվ է: Երբեմն գիտությունից ակնկալվող անկողմնակալ արդյունքների վրա ազդում են 1) նուրբ ընտրությունները, թե ինչպես են ներկայացվում տվյալները, 2) անհամապատասխան կամ ոչ ներկայացուցչական տվյալները, 3) ինչպես են ուսուցանվում AI համակարգերը, 4) հետազոտողների կամ այլ փորձողների անտեղյակությունը, անկարողությունը։ պատմել պատմությունը, 5) վերլուծությունն ինքնին.    

Ներկայացումը կողմնակալ է

Որոշ սուտ ավելի հեշտ է նկատել, քան մյուսները: Երբ դուք գիտեք, թե ինչ պետք է փնտրել, կարող եք ավելի հեշտությամբ հայտնաբերել պոտենցիալը մոլորեցնող գրաֆիկներ և գծապատկերներ: 

Գոնե կան Տվյալները մոլորեցնող կերպով ցուցադրելու հինգ եղանակ: 1) Ցույց տալ սահմանափակ տվյալների հավաքածու, 2). Ցույց տալ անկապ հարաբերակցությունները, 3) Ցուցադրել տվյալները ոչ ճշգրիտ, 4) Ցույց տալ տվյալները ոչ սովորական, կամ 5): Ցուցադրել չափազանց պարզեցված տվյալները:

Ցույց տալ սահմանափակ տվյալների հավաքածու

Տվյալների սահմանափակումը կամ տվյալների ոչ պատահական հատված ընտրելը հաճախ կարող է պատմել մի պատմություն, որը համահունչ չէ մեծ պատկերին: Վատ նմուշառումը կամ բալի ջոկելը այն է, երբ վերլուծաբանն օգտագործում է ոչ ներկայացուցչական նմուշ՝ ավելի մեծ խումբ ներկայացնելու համար: 

Մարտի 2020, Վրաստանի հանրային առողջության դեպարտամենտ հրապարակել է այս աղյուսակը որպես իր ամենօրյա կարգավիճակի հաշվետվության մաս: Այն իրականում ավելի շատ հարցեր է առաջացնում, քան պատասխաններ:  

Բացակայող բաներից մեկը համատեքստն է: Օրինակ, օգտակար կլինի իմանալ, թե յուրաքանչյուր տարիքային խմբի բնակչության քանի տոկոսն է կազմում: Պարզ տեսք ունեցող կարկանդակ աղյուսակի մեկ այլ խնդիր է անհավասար տարիքային խմբերը: 0-17-ն ունի 18 տարի, 18-59-ը՝ 42, 60+-ը բաց է, բայց ունի մոտ 40 տարի: Եզրակացությունը, հաշվի առնելով միայն այս աղյուսակը, այն է, որ դեպքերի մեծ մասը վերաբերում է 18-59 տարեկան տարիքային խմբին։ 60+ տարեկան տարիքային խումբը կարծես թե ավելի քիչ է տուժում COVID-ի դեպքերից։ Բայց սա ամբողջ պատմությունը չէ:

Համեմատության համար նշենք, որ այս տարբեր տվյալների հավաքածուն CDC կայք գծագրում է COVID-ի դեպքերն ըստ տարիքային խմբերի՝ ԱՄՆ-ի բնակչության տոկոսի վերաբերյալ լրացուցիչ տվյալներով, որը գտնվում է յուրաքանչյուր տարիքային միջակայքում:  

Սա ավելի լավ է: Մենք ավելի շատ ենթատեքստ ունենք. Կարելի է տեսնել, որ 18-29, 30-39, 40-49 տարիքային խմբերը բոլորն էլ ունեն դեպքերի ավելի բարձր տոկոս, քան բնակչության տարիքային խմբի տոկոսը: Դեռևս կան որոշ անհավասար տարիքային խմբեր։ Ինչու՞ է 16-17-ն առանձին տարիքային խումբ։ Այնուամենայնիվ, սա ամբողջ պատմությունը չէ, բայց փորձագետները սյունակներ են գրել, կանխատեսումներ և մանդատներ են արել ավելի քիչ, քան սրանից: Ակնհայտ է, որ COVID-ի դեպքում, բացի տարիքից, կան բազմաթիվ փոփոխականներ, որոնք ազդում են որպես դրական դեպք հաշվելու վրա՝ պատվաստման կարգավիճակը, թեստերի առկայությունը, թեստերի քանակը, համակցված հիվանդությունները և շատ ուրիշներ: Դեպքերի քանակն ինքնին թերի պատկեր է տալիս։ Փորձագետների մեծամասնությունը նաև դիտարկում է մահացությունների թիվը, կամ մահերի տոկոսները 100,000 բնակչի հաշվով կամ մահացության դեպքերը, որպեսզի տեսնեն, թե ինչպես է COVID-ն ազդում յուրաքանչյուր տարիքային խմբի վրա:

Ցույց տալ անկապ հարաբերակցությունները

Ակնհայտ է, որ կա ա ուժեղ հարաբերակցություն Գիտության, տիեզերքի և տեխնոլոգիաների վրա ԱՄՆ-ի ծախսերի և կախվելու, խեղդամահ անելու և խեղդամահ անելու միջոցով ինքնասպանությունների թվի միջև: Հարաբերակցությունը 99.79% է, գրեթե կատարյալ համընկնում:  

Այնուամենայնիվ, ո՞վ կարող է փաստել, որ դրանք ինչ-որ կերպ կապված են, կամ մեկը մյուսի պատճառն է: Կան այլ ոչ այնքան ծայրահեղ օրինակներ, բայց ոչ պակաս կեղծ: Նմանատիպ ամուր հարաբերակցություն կա Scripps National Spelling Bee-ի հաղթող խոսքում տառերի և թունավոր սարդերի կողմից սպանված մարդկանց թվի միջև: Պատահականությո՞ւն։ Դու որոշիր։

Այս տվյալները գծագրելու մեկ այլ եղանակ, որը կարող է ավելի քիչ ապակողմնորոշիչ լինել, կլինի Y-առանցքների վրա զրո ներառելը:

Ցույց տալ տվյալները սխալ

From Ինչպես վատ ցուցադրել տվյալներըԱՄՆ Ջորջիա նահանգը ներկայացրել է COVID-5-ով հաստատված դեպքերի ամենամեծ քանակով թոփ 19 երկրները։

Օրինական է թվում, չէ՞: Հստակորեն կա COVID-19-ի հաստատված դեպքերի նվազման միտում. Կարո՞ղ եք կարդալ X առանցքը: X առանցքը ներկայացնում է ժամանակը: Սովորաբար, ամսաթվերը կավելանան ձախից աջ: Այստեղ մենք տեսնում ենք ժամանակի մի փոքր ճանապարհորդություն X առանցքի վրա. 

4/28/2020

4/27/2020

4/29/2020

5/1/2020

4/30/2020

5/4/2020

5/6/2020

5/5/2020

5/2/22020 ...

Սպասե՞լ: Ինչ? X-առանցքը ժամանակագրական կարգով դասավորված չէ: Այսպիսով, որքան էլ որ միտումը գեղեցիկ թվա, մենք չենք կարող որևէ եզրակացություն անել: Եթե ​​ամսաթվերը պատվիրված են, ապա դեպքերի քանակի համար նախատեսված ձողերն ավելի շատ սղոցային օրինաչափություն են ցույց տալիս, քան ցանկացած տեսակի միտում:

Այստեղ հեշտ լուծումը ամսաթվերը դասավորելն է այնպես, ինչպես դա անում է օրացույցը:

Ցուցադրել տվյալները ոչ սովորական

Մենք բոլորս զբաղված ենք: Մեր ուղեղը մեզ սովորեցրել է արագ դատողություններ անել՝ հիմնված ենթադրությունների վրա, որոնք համահունչ են եղել մեր աշխարհում: Օրինակ, յուրաքանչյուր գրաֆիկ, որը ես երբևէ տեսել եմ, ցույց է տալիս x- և y- առանցքների հանդիպումը զրոյական կամ ամենացածր արժեքներով: Հակիրճ նայելով այս գծապատկերին՝ ինչ եզրակացություններ կարող եք անել Ֆլորիդայի ազդեցության մասին «Կանգնեք ձեր հիմնական օրենքը.»? Ես ամաչում եմ դա խոստովանել, բայց այս գրաֆիկը սկզբում խաբեց ինձ: Ձեր աչքը հարմար կերպով ձգվում է դեպի տեքստը և սլաքը գրաֆիկի մեջտեղում: Ներքևն այս գրաֆիկում վերև է: Հնարավոր է, որ դա սուտ չէ. տվյալները ամեն ինչ ճիշտ են: Բայց ես պետք է մտածեմ, որ դա խաբելու համար է: Եթե ​​դեռ չեք տեսել, ապա y առանցքի վրա զրոյականը վերևում է: Այսպիսով, քանի որ տվյալների միտումները նվազում են, դա նշանակում է ավելի շատ մահեր: Այս աղյուսակը ցույց է տալիս հրազենի գործադրմամբ սպանությունների թիվը աճել է 2005 թվականից հետո, ինչը վկայում է շարունակվող միտումի մասին ցած.

Ցույց տալ տվյալները չափազանց պարզեցված

Տվյալների չափից ավելի պարզեցման օրինակ կարելի է տեսնել, երբ վերլուծաբաններն օգտվում են Սիմփսոնի պարադոքսից: Սա մի երևույթ է, որը տեղի է ունենում, երբ ագրեգացված տվյալները ցույց են տալիս այլ եզրակացություն, քան երբ դրանք բաժանվում են ենթաբազմությունների: Այս թակարդը հեշտ է ընկնել բարձր մակարդակի համախմբված տոկոսները դիտարկելիս: Սիմփսոնի աշխատավայրում պարադոքսի պարզագույն նկարազարդումներից մեկը կապված է ծեծի միջինները.  

Այստեղ մենք տեսնում ենք, որ Դերեկ Ջեթերն ունի ավելի բարձր միջին հարված, քան Դեյվիդ Ջասթիսը 1995 և 1996 սեզոնների համար: Պարադոքսն ի հայտ է գալիս, երբ մենք գիտակցում ենք, որ արդարադատությունը Ջեթերին հաղթել է միջին հաշվով այդ երկու տարիներին էլ: Եթե ​​ուշադիր նայեք, իմաստ ունի, երբ հասկանում եք, որ 4 թվականին Ջեթերը մոտավորապես 1996 անգամ ավելի շատ չղջիկներ ուներ, 007թ.-ին 1996-ով ցածր միջինը: Մինչդեռ Justice-ն ուներ մոտավորապես 10 անգամ չղջիկների թիվը միայն . 003 ավելի բարձր միջին 1995 թ.

Ներկայացումը պարզ է թվում, բայց Սիմփսոնի պարադոքսը, գիտակցաբար կամ ակամա, հանգեցրել է սխալ եզրակացությունների: Վերջերս Սիմփսոնի պարադոքսի օրինակներ են հայտնվել նորություններում և սոցիալական ցանցերում՝ կապված պատվաստումների և COVID-ից մահացության հետ: Մեկը աղյուսակ ցույց է տալիս գծային գրաֆիկ, որը համեմատում է մահացության մակարդակը պատվաստվածների և չպատվաստվածների միջև 10-59 տարեկան մարդկանց համար: Գծապատկերը ցույց է տալիս, որ չպատվաստվածները մահացության ավելի ցածր մակարդակ ունեն: Ինչ է այստեղ կատարվում?  

Խնդիրը նման է նրան, որ մենք տեսնում ենք միջին թվերի դեպքում: Հայտարարն այս դեպքում յուրաքանչյուր տարիքային խմբի անհատների քանակն է: Գրաֆիկը միավորում է խմբերը, որոնք ունեն տարբեր արդյունքներ: Եթե ​​առանձին նայենք ավելի մեծ տարիքային խմբին՝ 50-59, ապա կտեսնենք, որ պատվաստվածներն ավելի լավ են անցնում։ Նույն կերպ, եթե նայենք 10-49-ին, ապա կտեսնենք, որ պատվաստվածներն ավելի լավ են ապրում։ Պարադոքսալ է, երբ համակցված հավաքածուն դիտելիս չպատվաստվածները ավելի վատ ելք ունեն: Այսպիսով, դուք կարող եք հակառակ փաստարկների համար հիմք ստեղծել՝ օգտագործելով տվյալները:

Տվյալները կողմնակալ են

Տվյալներին չի կարելի միշտ վստահել: Նույնիսկ գիտական ​​համայնքում հարցված հետազոտողների ավելի քան մեկ երրորդը խոստովանել է «Կասկածելի հետազոտական ​​պրակտիկա»:  Ուրիշ հետազոտական ​​խարդախության հետախույզ «Շատ հավանական է, որ տվյալների մեջ շատ ավելի շատ խարդախություններ կան՝ աղյուսակներ, գծերի գծապատկերներ, տվյալների հաջորդականություն [– քան մենք իրականում հայտնաբերում ենք]: Յուրաքանչյուր ոք, ով նստում է իր խոհանոցի սեղանի մոտ, կարող է որոշ թվեր տեղադրել աղյուսակի մեջ և կազմել գծային գրաֆիկ, որը համոզիչ տեսք ունի»։

Սա առաջինն է օրինակ կարծես ինչ-որ մեկը հենց դա է արել: Ես չեմ ասում, որ սա խարդախություն է, բայց որպես հարցում, այն պարզապես չի առաջացնում որևէ տվյալ, որը նպաստում է տեղեկացված որոշմանը: Կարծես թե հարցման մեջ հարցվածներին հարց է տրվել բենզալցակայանի սուրճի կամ այլ համապատասխան ընթացիկ իրադարձության մասին իրենց կարծիքի մասին: 

  1. Հոյակապ 
  2. Մեծ
  3. Շատ լավն է 

Ես կտրել եմ Twitter-ի գրառումը՝ հանելու մեղավոր կողմի հիշատակումները, բայց սա հարցման վերջնական արդյունքների իրական ամբողջ աղյուսակն է: Նման հարցումները հազվադեպ չեն: Ակնհայտ է, որ պատասխանների արդյունքում ստացված տվյալների հիման վրա ստեղծված ցանկացած աղյուսակ ցույց կտա, թե խնդրո առարկա սուրճը չպետք է բաց թողնել:  

Խնդիրն այն է, որ եթե ձեզ տրված լինեիք այս հարցումը և չգտնեիք ձեր մտածելակերպին համապատասխան պատասխան, դուք բաց կթողնեիք հարցումը: Սա կարող է լինել ծայրահեղ օրինակ, թե ինչպես կարող են ստեղծվել անվստահելի տվյալներ: Հարցման վատ ձևավորումը, այնուամենայնիվ, կարող է հանգեցնել ավելի քիչ պատասխանների, և նրանք, ովքեր պատասխանում են, ունեն միայն մեկ կարծիք, դա պարզապես աստիճանի հարց է: Տվյալները կողմնակալ են.

Տվյալների կողմնակալության այս երկրորդ օրինակը ստացված է «COVID 19-ի ամենավատ ապակողմնորոշիչ գրաֆիկները». 

Կրկին, սա նուրբ է և ոչ ամբողջովին ակնհայտ: Գծաձև գրաֆիկը ցույց է տալիս ժամանակի ընթացքում Ֆլորիդայի շրջաններից մեկում դրական COVID-19 դեպքերի տոկոսի սահուն, գրեթե չափազանց հարթ, անկում: Դուք հեշտությամբ կարող եք եզրակացնել, որ դեպքերը նվազում են: Դա հիանալի է, վիզուալիզացիան ճշգրիտ ներկայացնում է տվյալները: Խնդիրը տվյալների մեջ է։ Այսպիսով, դա ավելի ստոր կողմնակալություն է, քանի որ դուք չեք կարող դա տեսնել: Այն թխված է տվյալների մեջ: Հարցերը, որոնք դուք պետք է տաք, ներառում են, թե ով է փորձարկվում: Այսինքն՝ ո՞րն է հայտարարը, կամ որի բնակչությունը տոկոս ենք նայում։ Ենթադրվում է, որ դա ամբողջ բնակչությունն է կամ առնվազն ներկայացուցչական ընտրանք:

Այնուամենայնիվ, այս շրջանում այս շրջանում թեստեր են տրվել միայն սահմանափակ թվով մարդկանց: Նրանք պետք է ունենային COVID-ի նման ախտանիշներ կամ վերջերս մեկնել էին թեժ կետերի ցանկում գտնվող երկիր: Արդյունքները նաև շփոթեցնող է այն փաստը, որ յուրաքանչյուր դրական թեստ հաշվվել է և յուրաքանչյուր բացասական թեստ՝ հաշվել: Սովորաբար, երբ անհատի թեստը դրական է եղել, նրանք նորից թեստ են անցկացնում, երբ վիրուսն անցել է իր ընթացքը և թեստը բացասական է եղել: Այսպիսով, ինչ-որ իմաստով, յուրաքանչյուր դրական դեպքի համար կա բացասական թեստային դեպք, որը չեղարկում է այն: Թեստերի ճնշող մեծամասնությունը բացասական է, և յուրաքանչյուր անհատի բացասական թեստերը հաշվվել են: Դուք կարող եք տեսնել, թե ինչպես են տվյալները կողմնակալ և առանձնապես օգտակար չեն որոշումներ կայացնելու համար: 

AI մուտքագրումը և ուսուցումը կողմնակալ են

Գոյություն ունի առնվազն երկու եղանակ, որոնցով AI-ն կարող է հանգեցնել կողմնակալ արդյունքների. սկսել կողմնակալ տվյալներից կամ օգտագործել կողմնակալ ալգորիթմներ՝ վավեր տվյալներ մշակելու համար:  

կողմնակալ մուտքագրում

Մեզանից շատերի մոտ այն տպավորությունն է, որ AI-ին կարելի է վստահել թվերը ճզմելու, դրա ալգորիթմները կիրառելու և տվյալների հուսալի վերլուծության մեջ: Արհեստական ​​ինտելեկտը կարող է լինել միայն այնքան խելացի, որքան պատրաստված է: Եթե ​​տվյալները, որոնց վերաբերյալ այն վերապատրաստվել է, թերի են, արդյունքներին կամ եզրակացություններին նույնպես հնարավոր չի լինի վստահել: Հարցման կողմնակալության վերը նշված դեպքի նման, կան մի շարք եղանակներ, որոնցով կարող են լինել տվյալները կողմնակալ մեքենայական ուսուցման մեջ.  

  • Ընտրանքային կողմնակալություն – ուսուցման տվյալների հավաքածուն ամբողջ բնակչությանը չի ներկայացնում:
  • Բացառման կողմնակալություն – երբեմն իրականում վավեր են այն, ինչ թվում է արտաքուստ, կամ որտեղ մենք սահմանում ենք այն, թե ինչ պետք է ներառել (փոստային ինդեքսներ, ամսաթվեր և այլն):
  • Չափման կողմնակալություն – պայմանական է, որ միշտ չափել մենիսկի կենտրոնից և ներքևից, օրինակ, հեղուկները չափելիս ծավալային կոլբայի կամ փորձանոթի մեջ (բացառությամբ սնդիկի):
  • Հիշել կողմնակալությունը – երբ հետազոտությունը կախված է մասնակիցների հիշողությունից:
  • Դիտորդների կողմնակալություն. գիտնականները, ինչպես բոլոր մարդիկ, ավելի հակված են տեսնելու այն, ինչ նրանք ակնկալում են տեսնել:
  • Սեքսիստական ​​և ռասիստական ​​կողմնակալություն. սեռը կամ ռասան կարող է չափազանց կամ պակաս ներկայացված լինել:  
  • Ասոցիացիայի կողմնակալություն – տվյալները ամրապնդում են կարծրատիպերը

Որպեսզի AI-ն վստահելի արդյունքներ վերադարձնի, դրա վերապատրաստման տվյալները պետք է ներկայացնեն իրական աշխարհը: Ինչպես մենք քննարկել ենք բլոգի նախորդ հոդվածում, տվյալների պատրաստումը կարևոր է և ինչպես ցանկացած այլ տվյալների նախագիծ: Անվստահելի տվյալները կարող են մեքենայական ուսուցման համակարգերին սխալ դաս սովորեցնել և հանգեցնել սխալ եզրակացության: «Բոլոր տվյալները կողմնակալ են: Սա պարանոյա չէ: Սա փաստ է»։ – Բժիշկ Սանջիվ Մ. Նարայան, Սթենֆորդի համալսարանի բժշկության դպրոց:

Վերապատրաստման համար կողմնակալ տվյալների օգտագործումը հանգեցրել է մի շարք նկատելի AI ձախողումների: (Օրինակներ այստեղ և այստեղ, հետազոտություն այստեղ..)

կողմնակալ ալգորիթմներ

Ալգորիթմը կանոնների մի շարք է, որն ընդունում է մուտքագրումը և ստեղծում ելք՝ բիզնես խնդրին պատասխանելու համար: Նրանք հաճախ լավ սահմանված որոշումների ծառեր են: Ալգորիթմները կարծես սև արկղեր լինեն: Ոչ ոք վստահ չէ, թե ինչպես են նրանք աշխատում, հաճախ, նույնիսկ ոչ ընկերություններ, որոնք օգտագործում են դրանք. Ահ, և դրանք հաճախ սեփականություն են: Նրանց խորհրդավոր և բարդ բնույթը պատճառներից մեկն է, թե ինչու են կողմնակալ ալգորիթմներն այդքան նենգ: . 

Դիտարկենք AI ալգորիթմները բժշկության, HR կամ ֆինանսների ոլորտում, որոնք հաշվի են առնում մրցավազքը: Եթե ​​ռասան գործոն է, ապա ալգորիթմը չի կարող ռասայականորեն կույր լինել: Սա տեսական չէ։ Նման խնդիրներ հայտնաբերվել են իրական աշխարհում՝ օգտագործելով AI-ն վարձում, ride-share, վարկի դիմումըվ, իսկ երիկամների փոխպատվաստում

Եզրակացությունն այն է, որ եթե ձեր տվյալները կամ ալգորիթմները վատն են, ավելի վատ են, քան անօգուտ, դրանք կարող են վտանգավոր լինել: Կա այնպիսի բան, ինչպիսին է «ալգորիթմական աուդիտ»: Նպատակն է օգնել կազմակերպություններին բացահայտել ալգորիթմի հետ կապված հնարավոր ռիսկերը, քանի որ այն վերաբերում է արդարությանը, կողմնակալությանը և խտրականությանը: Ուրիշ տեղ, facebook օգտագործում է AI-ն՝ AI-ում կողմնակալության դեմ պայքարելու համար:

Մարդիկ կողմնակալ են

Մենք ունենք հավասարման երկու կողմերում գտնվող մարդիկ: Մարդիկ պատրաստում են վերլուծությունները, մարդիկ ստանում են տեղեկատվությունը։ Կան հետազոտողներ և կան ընթերցողներ։ Ցանկացած հաղորդակցության ժամանակ կարող են խնդիրներ առաջանալ փոխանցման կամ ընդունման մեջ:

Վերցրեք, օրինակ, եղանակը: Ի՞նչ է նշանակում «անձրևի հավանականություն»: Նախ, ի՞նչ նկատի ունեն օդերեւութաբանները, երբ ասում են, որ անձրեւի հավանականություն կա: Ըստ ԱՄՆ կառավարության Ազգային Եղանակ Ծառայություն, անձրևի հավանականությունը կամ այն, ինչ նրանք անվանում են Տեղումների հավանականություն (PoP), եղանակի կանխատեսման ամենաքիչ հասկացված տարրերից մեկն է: Այն ունի ստանդարտ սահմանում. «Տեղումների հավանականությունը պարզապես վիճակագրական հավանականություն է 0.01 դյույմ [sic]-ից [sic] ավելի տեղումների տվյալ տարածքում տվյալ կանխատեսման տարածքում նշված ժամանակահատվածում»: «Տրված տարածքը» կանխատեսման տարածքն է, կամ բroadձուլված տարածք: Դա նշանակում է, որ տեղումների պաշտոնական հավանականությունը կախված է տարածքում ինչ-որ տեղ անձրևելու վստահությունից և տարածքի այն տոկոսից, որը խոնավանալու է: Այլ կերպ ասած, եթե օդերևութաբանը վստահ է, որ անձրև է գալու կանխատեսվող տարածքում (Վստահություն = 100%), ապա PoP-ը ներկայացնում է տարածքի այն հատվածը, որը անձրև է ստանալու:  

Փարիզի փողոց; Անձրեւոտ օրԳուստավ Կեյլեբոթ (1848-1894) Չիկագոյի արվեստի ինստիտուտի հանրային տիրույթ

Անձրևի հավանականությունը կախված է ինչպես վստահությունից, այնպես էլ տարածքից: Ես չգիտեի, որ. Ես կասկածում եմ, որ այլ մարդիկ նույնպես դա չգիտեն: Բնակչության մոտ 75%-ը ճշգրիտ չի հասկանում, թե ինչպես է հաշվարկվում PoP-ը կամ ինչ է այն պետք ներկայացնել: Ուրեմն, մեզ խաբու՞մ են, թե՞ սա ընկալման խնդիր է։ Եկեք դա անվանենք տեղումների ընկալում: Մեղադրու՞մ ենք եղանակի տեսաբանին։ Արդարության համար նշենք, որ կան շփոթմունք եղանակի տեսության մասնագետների շրջանում նույնպես։ Մեկում ուսումնասիրությունՀարցված օդերևութաբանների 43%-ը նշել է, որ ՊՈՊ-ի սահմանման մեջ շատ քիչ հետևողականություն կա:

Ինքնին վերլուծությունը կողմնակալ է

Հինգ ազդող գործոններից վերլուծությունն ինքնին կարող է ամենազարմանալին լինել: Գիտական ​​հետազոտություններում, որոնք հանգեցնում են վերանայված հոդվածի հրապարակմանը, սովորաբար վարկած է տրվում տեսության, մեթոդները սահմանվում են վարկածը ստուգելու համար, տվյալները հավաքվում են, այնուհետև տվյալները վերլուծվում են: Վերլուծության տեսակը, որն արվում է և ինչպես է այն արվում, թերագնահատված է այն առումով, թե ինչպես է այն ազդում եզրակացությունների վրա: Մեջ թուղթ Այս տարվա սկզբին (Հունվար 2022), հեղինակները Քաղցկեղի միջազգային ամսագրում հրապարակել են, թե արդյոք պատահականացված վերահսկվող փորձարկումների և հետահայաց դիտորդական ուսումնասիրությունների արդյունքները: Նրանց բացահայտումները եզրակացրել են, որ.

Համեմատական ​​արդյունավետության հետազոտության մեջ վերլուծական ընտրությունները տարբերելով՝ մենք հակառակ արդյունքներ ստեղծեցինք: Մեր արդյունքները ցույց են տալիս, որ որոշ հետահայաց դիտողական ուսումնասիրություններ կարող են պարզել, որ բուժումը բարելավում է արդյունքները հիվանդների համար, մինչդեռ մեկ այլ նմանատիպ ուսումնասիրություն կարող է պարզել, որ դա չի անում՝ պարզապես հիմնվելով վերլուծական ընտրությունների վրա:

Նախկինում գիտական ​​ամսագրի հոդված կարդալիս, եթե դուք ինձ նման եք, կարող էիք մտածել, որ արդյունքները կամ եզրակացությունները բոլորը վերաբերում են տվյալներին: Այժմ, ըստ երևույթին, արդյունքները կամ նախնական վարկածի հաստատումը կամ հերքումը նույնպես կարող են կախված լինել վերլուծության մեթոդից:

Ուրիշ սովորել գտել են նմանատիպ արդյունքներ: Հոդվածը, Շատ վերլուծաբաններ, մեկ տվյալների հավաքածու. Թափանցիկ դարձնելը, թե ինչպես են վերլուծական ընտրությունների տատանումները ազդում արդյունքների վրա նկարագրում է, թե ինչպես են նրանք տվել նույն տվյալները 29 տարբեր թիմերի՝ վերլուծելու համար: Տվյալների վերլուծությունը հաճախ դիտվում է որպես խիստ, հստակ սահմանված գործընթաց, որը հանգեցնում է մեկ եզրակացության:  

Չնայած մեթոդաբանների պնդումներին, հեշտ է անտեսել այն փաստը, որ արդյունքները կարող են կախված լինել ընտրված վերլուծական ռազմավարությունից, որն ինքնին ներծծված է տեսությամբ, ենթադրություններով և ընտրության կետերով: Շատ դեպքերում կան բազմաթիվ ողջամիտ (և շատ անհիմն) մոտեցումներ տվյալների գնահատման համար, որոնք վերաբերում են հետազոտական ​​հարցին:

Հետազոտողները հավաքել են տվյալների վերլուծությունը և եկել այն եզրակացության, որ բոլոր հետազոտությունները ներառում են սուբյեկտիվ որոշումներ, ներառյալ վերլուծության որ տեսակը օգտագործել, ինչը կարող է ազդել հետազոտության վերջնական արդյունքի վրա:

Մեկ ուրիշի առաջարկությունը հետազոտող ով վերլուծել է վերը նշված ուսումնասիրությունը, պետք է զգույշ լինի որոշումներ կայացնելիս կամ եզրակացություններ անելիս մեկ փաստաթուղթ օգտագործելիս:

Անդրադառնալով կողմնակալությանը Analytics-ում

Սա պարզապես նախազգուշացնող հեքիաթ է: Գիտելիքը կարող է պաշտպանել մեզ խաբեություններից: Որքան ավելի շատ տեղյակ լինի այն հնարավոր մեթոդների մասին, որոնք սկաները կարող է օգտագործել մեզ հիմարացնելու համար, այնքան քիչ հավանական է, որ մեզ կտարվեն, ասենք, գրպանահատի սխալ ուղղորդմամբ կամ Պոնզիի պիեսի սահուն խոսակցություններով: Այսպիսով, դա տեղի է ունենում պոտենցիալ կողմնակալությունների ըմբռնման և ճանաչման դեպքում, որոնք ազդում են մեր վերլուծության վրա: Եթե ​​մենք տեղյակ լինենք հնարավոր ազդեցությունների մասին, մենք կարող ենք ավելի լավ ներկայացնել պատմությունը և, ի վերջո, ավելի լավ որոշումներ կայացնել:  

BI/Analytics
Դուք վերջերս բացահայտել եք ինքներդ ձեզ:

Դուք վերջերս բացահայտել եք ինքներդ ձեզ:

  Մենք խոսում ենք ամպի անվտանգության մասին Over Exposure. Եկեք այսպես ձևակերպենք, ի՞նչն է ձեզ անհանգստացնում մերկացման մասին: Որո՞նք են ձեր ամենաթանկ ակտիվները: Ձեր սոցիալական ապահովության համարը: Ձեր բանկային հաշվի տվյալները: Անձնական փաստաթղթեր, թե՞ լուսանկարներ։ Ձեր կրիպտո...

Կարդալ ավելին

BI/Analytics
KPI-ների կարևորությունը և դրանց արդյունավետ օգտագործման եղանակները

KPI-ների կարևորությունը և դրանց արդյունավետ օգտագործման եղանակները

KPI-ների կարևորությունը Եվ երբ միջակությունն ավելի լավ է, քան կատարյալը Ձախողման ճանապարհներից մեկը կատարելության վրա պնդելն է: Կատարելությունն անհնար է և բարու թշնամին: Օդային հարձակման վաղ նախազգուշացման ռադարի գյուտարարն առաջարկել է «անկատարի պաշտամունք»։ Նրա փիլիսոփայությունն էր...

Կարդալ ավելին

BI/AnalyticsՉդասակարգված
CI / CD
Տուրբո լիցքավորեք ձեր վերլուծության իրականացումը CI/CD-ի միջոցով

Տուրբո լիցքավորեք ձեր վերլուծության իրականացումը CI/CD-ի միջոցով

Այսօրվա արագ տեմպերով digital լանդշաֆտը, ձեռնարկությունները հիմնվում են տվյալների վրա հիմնված պատկերացումների վրա՝ տեղեկացված որոշումներ կայացնելու և մրցակցային առավելություններ ձեռք բերելու համար: Վերլուծական լուծումների արդյունավետ և արդյունավետ ներդրումը չափազանց կարևոր է տվյալներից արժեքավոր տեղեկատվություն ստանալու համար: Մեկ ճանապարհ...

Կարդալ ավելին

BI/Analytics
Մտավոր սեփականության բլոգ
Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում

Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում

Արդյո՞ք դա իմն է: Բաց աղբյուրների զարգացում և IP-ն AI-ի դարաշրջանում Պատմությունը ծանոթ է: Հիմնական աշխատակիցը լքում է ձեր ընկերությունը, և կա մտավախություն, որ աշխատակիցը կվերցնի առևտրային գաղտնիքները և այլ գաղտնի տեղեկատվություն դռնից դուրս գալու ժամանակ: Երևի լսում ես...

Կարդալ ավելին

BI/Analytics
Silicon Valley բանկ
Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը

Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը

Silicon Valley Bank-ի խաղամոլությունը KPI-ի հետ հանգեցրել է իր փլուզմանը Փոփոխությունների կառավարման և պատշաճ վերահսկողության կարևորությունը Բոլորը վերլուծում են Սիլիկոն Վելի բանկի վերջին ձախողման հետևանքները: Ֆեդերատիվները խփում են իրենց՝ նախազգուշացնող նշանները չտեսնելու համար...

Կարդալ ավելին

BI/Analytics
AI՝ Պանդորայի արկղ կամ նորարարություն

AI՝ Պանդորայի արկղ կամ նորարարություն

AI. Պանդորայի արկղ կամ նորարարություն Գտնել հավասարակշռություն Արհեստական ​​ինտելեկտի բարձրացրած նոր հարցերի և նորարարության առավելությունների լուծման միջև Գոյություն ունեն երկու հսկայական խնդիր՝ կապված AI-ի և մտավոր սեփականության հետ: Մեկը դրա բովանդակության օգտագործումն է: Օգտագործողը մուտքագրում է բովանդակություն մի...

Կարդալ ավելին