Аналитик худал

by Нийтэлсэн 31, 2022BI/analytics0 санал

Аналитик худал

Шинжилгээний хазайлт

 

Марк Твейн "Худал гурван янз байдаг: худал хуурмаг, хараал идсэн худал. анализ. " 

Аналитик нь бидэнд хэрэгтэй, хэрэгжүүлэх боломжтой ойлголтыг өгдөг гэдгийг бид ердийн зүйл гэж үздэг. Бидний мэддэггүй зүйл бол хамгийн боловсронгуй программ хангамж, системүүд хүртэл бидний өгсөн хариултуудад бидний болон бусдын буруу хандлага хэрхэн нөлөөлж байгааг анзаардаггүй. Заримдаа биднийг шударга бусаар залилан мэхэлж болох ч ихэнхдээ энэ нь бидний аналитикт далд, ухамсаргүй өрөөсгөл хандлага байж болно. Нэг талыг барьсан аналитикийн цаад сэдэл нь олон талтай. Заримдаа шинжлэх ухаанаас бидний хүлээж буй шударга үр дүнд 1) өгөгдлийг хэрхэн танилцуулах нарийн сонголтууд, 2) үл нийцэх эсвэл төлөөлөх бус өгөгдөл, 3) хиймэл оюун ухааны системийг хэрхэн сургах, 4) судлаачид болон бусад хүмүүсийн мунхаг, чадваргүй байдал нөлөөлдөг. түүхийг ярих, 5) шинжилгээ өөрөө.    

Илтгэл нь нэг талыг барьсан байна

Зарим худал хуурмаг нь бусдаас илүү амархан анзаарагддаг. Хэрэв та юу хайхаа мэдэж байвал болзошгүйг илүү хялбар илрүүлж чадна төөрөгдүүлсэн график, графикууд. 

Наад зах нь байдаг Мэдээллийг төөрөгдүүлэн харуулах таван арга: 1) Хязгаарлагдмал өгөгдлийн багцыг харуулах, 2). Холбоогүй хамаарлыг харуулах, 3) Өгөгдлийг буруу харуулах, 4) Өгөгдлийг уламжлалт бус байдлаар харуулах, эсвэл 5). Өгөгдлийг хэт хялбаршуулсан байдлаар харуулах.

Хязгаарлагдмал өгөгдлийн багцыг харуулах

Өгөгдлийг хязгаарлах, эсвэл санамсаргүй бус хэсгийг гараар сонгох нь том дүр зурагтай нийцэхгүй түүхийг өгүүлдэг. Муу түүвэрлэлт буюу интоорын түүвэр гэдэг нь шинжээч том бүлгийг төлөөлөхийн тулд төлөөлөх бус түүврийг ашиглах явдал юм. 

Гуравдугаар сард 2020, Жоржиа улсын Нийгмийн эрүүл мэндийн газар энэхүү графикийг өдөр тутмын байдлын тайлангийнхаа нэг хэсэг болгон нийтэлжээ. Энэ нь үнэндээ хариултаас илүү олон асуултыг бий болгодог.  

Дутуу дулимаг зүйл бол контекст юм. Тухайлбал, хүн амын хэдэн хувь нь насны ангилалд багтаж байгааг мэдэх нь тустай. Энгийн харагдах дугуй графиктай холбоотой өөр нэг асуудал бол тэгш бус насны бүлгүүд юм. 0-17 нас 18 нас, 18-59 нас 42, 60-аас дээш насныхан нээлттэй, гэхдээ 40 орчим настай. Зөвхөн энэ графикаас харахад ихэнх тохиолдол нь 18-59 насныхан байна гэсэн дүгнэлт гарч байна. 60-аас дээш насны бүлэгт COVID-ийн тохиолдол бага өртсөн бололтой. Гэхдээ энэ бол бүхэл бүтэн түүх биш юм.

Харьцуулбал, энэ өөр өөр өгөгдөл дээр тавигдсан CDC вэб сайт АНУ-ын хүн амын насны ангилал тус бүрт байгаа нэмэлт мэдээлэл бүхий COVID-ийн тохиолдлыг насны бүлгээр графикаар харуулав.  

Энэ нь дээр. Бидэнд илүү контекст бий. 18-29, 30-39, 40-49 насныхан бүгд хүн амд эзлэх насны бүлэгтэй харьцуулахад өвчлөлийн хувь өндөр байгааг бид харж байна. Насны тэгш бус ангилал байсаар байна. Яагаад 16-17 насыг тусдаа насны бүлэг гэж үздэг вэ? Энэ бол бүхэл бүтэн түүх биш ч шинжээчид үүнээс бага зүйл дээр багана бичиж, таамаглал дэвшүүлж, үүрэг даалгавар өгсөн. Мэдээжийн хэрэг, COVID-ийн хувьд наснаас гадна эерэг тохиолдол гэж тооцогдоход нөлөөлдөг олон хувьсагч байдаг: вакцинжуулалтын байдал, шинжилгээний бэлэн байдал, шинжилгээнд хамрагдсан тоо, хавсарсан өвчин болон бусад олон хүчин зүйлүүд. Хэргийн тоо нь өөрөө бүрэн бус дүр зургийг өгдөг. Ихэнх шинжээчид нас баралтын тоо, эсвэл 100,000 хүн амд ногдох нас баралтын хувь, эсвэл нас баралтын тохиолдлоор нас баралтын тохиолдлыг судалж, COVID нь насны бүлэг бүрт хэрхэн нөлөөлж байгааг хардаг.

Холбоогүй хамаарлыг харуул

Мэдээжийн хэрэг, байдаг хүчтэй хамаарал АНУ-ын шинжлэх ухаан, сансар огторгуй, технологид зарцуулж буй зардал болон дүүжлэх, боомилох, амьсгал боогдуулж амиа хорлосон хүмүүсийн тоо хоёрын хооронд. Корреляци 99.79%, бараг төгс таарч байна.  

Эдгээр нь ямар нэгэн байдлаар холбоотой эсвэл нэг нь нөгөөг нь үүсгэдэг гэж хэн хэлэх вэ? Бусад бага зэргийн хэт жишээнүүд байдаг, гэхдээ хуурамч биш. Scripps National Spelling Bee-ийн Winning Word дахь үсэг болон Хорт аалзны улмаас амь үрэгдсэн хүмүүсийн тоо хоёрын хооронд ижил төстэй хүчтэй хамаарал байдаг. Тохиолдол уу? Чи шийд.

Төөрөгдөл багатай энэ өгөгдлийг графиклах өөр нэг арга бол Y тэнхлэгт хоёуланд нь тэг оруулах явдал юм.

Өгөгдлийг буруу харуулах

эхлэн Мэдээллийг хэрхэн муу харуулах вэ, АНУ-ын Жоржиа муж COVID-5 халдварын хамгийн их батлагдсан тохиолдол бүхий топ 19 мужийг танилцууллаа.

Хууль ёсны харагдаж байна, тийм үү? COVID-19-ийн батлагдсан тохиолдлууд буурах хандлагатай байгаа нь тодорхой байна. Та X тэнхлэгийг уншиж чадах уу? X тэнхлэг нь цаг хугацааг илэрхийлдэг. Ихэвчлэн огноо зүүнээс баруун тийш нэмэгдэх болно. Эндээс бид X тэнхлэг дээр бага зэрэг цаг хугацаагаар аялахыг харж байна. 

4/28/2020

4/27/2020

4/29/2020

5/1/2020

4/30/2020

5/4/2020

5/6/2020

5/5/2020

5/2/22020 ...

Хүлээгээрэй? Юу? X тэнхлэг нь он цагийн дарааллаар эрэмблэгдээгүй. Тиймээс, чиг хандлага нь сайхан харагдаж байгаа ч бид ямар ч дүгнэлт хийж чадахгүй. Хэрэв огноог эрэмбэлсэн бол тохиолдлын тоог харуулсан баар нь ямар ч төрлийн трендээс илүү хөрөөний шүдийг харуулж байна.

Энд хялбар засвар бол хуанли шиг огноог эрэмбэлэх явдал юм.

Өгөгдлийг уламжлалт бус байдлаар харуулах

Бид бүгд завгүй байна. Бидний тархи бидний ертөнцөд тогтвортой байсан таамаглал дээр үндэслэн хурдан дүгнэлт хийхийг заадаг. Жишээлбэл, миний харж байсан график бүр x ба y тэнхлэгүүдийг тэг буюу хамгийн бага утгуудад таарч байгааг харуулж байна. Энэ хүснэгтийг товч харвал Флоридагийн нөлөөний талаар та ямар дүгнэлт хийж болох вэ “Үндсэн хуулиа барь.”? Би хүлээн зөвшөөрөхөөс ичиж байна, гэхдээ энэ график анх намайг хуурсан. Графикийн голд байгаа текст болон сум руу таны нүдийг татахад тохиромжтой. Энэ график дээр доошоо дээш байна. Энэ нь худал биш байж болох юм - өгөгдөл тэнд байгаа. Гэхдээ би үүнийг хуурах зорилготой гэж бодох ёстой. Хэрэв та хараахан үзэж амжаагүй бол y тэнхлэг дээрх тэг нь дээд талд байна. Тиймээс өгөгдөл буурах хандлагатай байгаа нь илүү олон нас баралт гэсэн үг юм. Энэ графикаас харахад галт зэвсэг ашиглан хүн амины хэрэг гарсан байна нэмэгдсэн 2005 оноос хойшхи хандлага ажиглагдаж байна доош нь.

Өгөгдлийг хэт хялбарчилсан байдлаар харуул

Шинжээчид Симпсоны Парадоксын давуу талыг ашиглах үед өгөгдлийг хэт хялбарчлах нэг жишээг харж болно. Энэ нь нэгтгэсэн өгөгдөл нь дэд бүлэгт хуваагдсанаас өөр дүгнэлтийг харуулах үед тохиолддог үзэгдэл юм. Өндөр түвшний нэгтгэсэн хувийг харахад энэ урхинд амархан ордог. Симпсоны Парадоксын ажил дээрх хамгийн тод жишээнүүдийн нэг нь холбоотой юм цохилтын дундаж.  

Эндээс бид Дерек Жетер 1995, 1996 оны улиралд Дэвид Жастисаас илүү өндөр оноотой байгааг харж байна. Шударга ёс тэр хоёр жилийн дундаж цохилтоор Жетерийг ялсныг бид ойлгох үед парадокс гарч ирдэг. Хэрэв та анхааралтай ажиглавал Жетер 4 онд ойролцоогоор 1996 дахин илүү цохиур (хүлээн авагч) байсан гэдгийг ойлгох нь утга учиртай болно. 007 онд .1996-оор бага байсан. Харин Шударга ёс нь ердөө . 10 онд дунджаар 003-аас дээш.

Танилцуулга нь энгийн мэт боловч Симпсоны Парадокс нь санамсаргүй эсвэл санамсаргүй байдлаар буруу дүгнэлт хийхэд хүргэсэн. Сүүлийн үед вакцин, COVID-ийн нас баралттай холбоотой мэдээ, олон нийтийн мэдээллийн хэрэгслээр Симпсоны парадоксын жишээ гарч байна. Нэг зураг 10-59 насны хүмүүсийн вакцинд хамрагдсан болон хийгээгүй нас баралтын түвшинг харьцуулсан шугаман графикийг үзүүлэв. Вакцин хийлгээгүй хүмүүсийн нас баралтын түвшин байнга бага байгааг график харуулж байна. Энд юу болоод байна?  

Асуудал нь цохиурын дундаж үзүүлэлттэй төстэй юм. Энэ тохиолдолд хуваагч нь насны бүлэг тус бүрийн хувь хүмүүсийн тоо юм. График нь өөр өөр үр дүнтэй бүлгүүдийг нэгтгэдэг. Хэрэв бид 50-59 насны ахмад настныг тусад нь авч үзвэл вакцинжуулалт илүү сайн байгааг харж болно. Үүний нэгэн адил бид 10-49-ийг харвал вакцинжуулалт илүү сайн байгааг харж болно. Хачирхалтай нь, хосолсон багцыг харахад вакцин хийлгээгүй нь илүү муу үр дагавартай байдаг. Ийм байдлаар та өгөгдлийг ашиглан эсрэг аргументуудыг гаргах боломжтой болно.

Өгөгдөл нь нэг талыг барьсан

Өгөгдөлд үргэлж итгэж болохгүй. Шинжлэх ухааны нийгэмлэгт ч гэсэн судалгаанд хамрагдсан судлаачдын гуравны нэгээс илүү нь үүнийг хүлээн зөвшөөрсөн "Эргэлзээтэй судалгааны практик."  Өөр нэг судалгааны залилангийн мөрдөгч "Хүснэгт, шугаман график, дараалсан өгөгдөл зэрэгт [бидний олж илрүүлж байгаагаас хамаагүй] илүү их луйвар гарах магадлалтай. Гал тогооныхоо ширээний ард сууж буй хэн бүхэн хүснэгтэд хэдэн тоо оруулаад итгэл үнэмшилтэй харагдацтай шугаман график хийж болно."

Эхнийх нь жишээ нь Хэн нэгэн үүнийг хийсэн бололтой. Би үүнийг хууран мэхлэлт гэж хэлэхгүй байна, гэхдээ судалгааны хувьд энэ нь мэдээлэлтэй шийдвэр гаргахад хувь нэмэр оруулах ямар ч өгөгдөл үүсгэдэггүй. Судалгаанд оролцогчдоос шатахуун түгээх станцын кофе эсвэл бусад холбогдох үйл явдлын талаар санал бодлоо асуусан бололтой. 

  1. Хамгийн гайхалтай 
  2. Агуу их
  3. маш сайн 

Би буруутай этгээдийн лавлагааг арилгахын тулд Twitter-ийн нийтлэлийг тайрсан боловч энэ нь судалгааны эцсийн үр дүнгийн бодит график юм. Энэ мэт санал асуулга нь ховор биш юм. Хариултуудын үр дүнд бий болсон аливаа график нь тухайн кофег орхигдуулж болохгүйг харуулах нь ойлгомжтой.  

Асуудал нь хэрэв танд энэ судалгааг өгсөн бол таны бодолд тохирсон хариулт олоогүй бол та судалгааг алгасах байсан. Энэ нь найдваргүй өгөгдөл хэрхэн бий болдгийн туйлын жишээ байж болох юм. Судалгааны буруу загвар нь хариултыг цөөрүүлэхэд хүргэдэг бөгөөд хариулсан хүмүүс зөвхөн нэг л үзэл бодолтой байдаг, энэ нь зөвхөн түвшний асуудал юм. Өгөгдөл нь өрөөсгөл юм.

Өгөгдлийн гажуудлын энэ хоёр дахь жишээ нь "Хамгийн муу COVID 19 төөрөгдүүлсэн графикууд. " 

Дахин хэлэхэд, энэ нь нарийн бөгөөд бүрэн тодорхой биш юм. Зураасан график нь Флоридагийн нэгэн мужид цаг хугацааны явцад эерэг COVID-19 тохиолдлын хувь хэмжээ жигд, бараг хэтэрхий жигд буурч байгааг харуулж байна. Хэргийн тоо буурч байна гэсэн дүгнэлтийг та амархан гаргаж болно. Энэ бол гайхалтай, дүрслэл нь өгөгдлийг үнэн зөв илэрхийлдэг. Асуудал нь өгөгдөлд байна. Тэгэхээр та үүнийг харж чадахгүй байгаа учраас энэ нь илүү далд өрөөсгөл юм. Энэ нь өгөгдөлд шатаасан байна. Таны асуух ёстой асуултуудад хэн шалгагдаж байгаа вэ? Өөрөөр хэлбэл, хуваагч нь юу вэ, эсвэл бидний хэдэн хувиар харж байгаа хүн ам. Энэ нь нийт хүн ам буюу наад зах нь төлөөлөх түүвэр гэсэн таамаглал юм.

Гэсэн хэдий ч энэ хугацаанд энэ мужид зөвхөн цөөн тооны хүмүүст шинжилгээ өгсөн. Тэд COVID-тэй төстэй шинж тэмдэг илэрсэн эсвэл халуун цэгийн жагсаалтад орсон улс руу саяхан аялсан байх ёстой. Үүнээс гадна үр дүнг будлиантуулж байгаа нь эерэг тест бүрийг тоолж, сөрөг тест бүрийг тоолдог явдал юм. Дүрмээр бол тухайн хүн эерэг шинжилгээ өгөхөд вирусын явц дууссаны дараа дахин шинжилгээ хийлгэж, сөрөг шинжилгээ өгдөг. Тэгэхээр нэг ёсондоо эерэг тохиолдол бүрт үүнийг хүчингүй болгодог сөрөг тест тохиолдол байдаг. Туршилтын дийлэнх нь сөрөг гарсан бөгөөд хүн бүрийн сөрөг тестийг тоолсон. Өгөгдөл нь ямар нэг талыг барьсан бөгөөд шийдвэр гаргахад тийм ч чухал биш болохыг харж болно. 

AI оролт ба сургалт нь нэг талыг барьсан

AI нь өрөөсгөл үр дүнд хүргэх дор хаяж хоёр арга байдаг: нэг талыг барьсан мэдээллээс эхлэх, эсвэл хүчинтэй өгөгдлийг боловсруулахын тулд өрөөсгөл алгоритмыг ашиглах.  

Өргөтгөсөн оролт

Бидний олонхи нь хиймэл оюун ухаан нь тоонуудыг задлах, алгоритмуудыг нь ашиглах, өгөгдөлд найдвартай дүн шинжилгээ хийхэд итгэж болно гэсэн сэтгэгдэлтэй байдаг. Хиймэл оюун ухаан нь сургагдсан шигээ ухаалаг байж чадна. Хэрэв сургагдсан өгөгдөл нь төгс бус байвал үр дүн, дүгнэлтэд итгэх боломжгүй болно. Дээрх судалгааны хэвийсэн тохиолдолтой адил өгөгдөл байж болох хэд хэдэн арга байдаг хэвийсэн машин сургалтын чиглэлээр:.  

  • Түүврийн хазайлт – сургалтын мэдээллийн багц нь нийт хүн амыг төлөөлөхгүй.
  • Хасагдах хэвийсэн утга – заримдаа хэт давсан үзүүлэлтүүд хүчинтэй байдаг, эсвэл бид юу оруулах (зип код, огноо гэх мэт) дээр шугам татдаг.
  • Хэмжилтийн хазайлт - жишиг нь жишээлбэл, хэмжээст колбонд эсвэл туршилтын хоолойд (мөнгөн уснаас бусад) шингэнийг хэмжих үед жийргэвчний төв ба доод хэсгээс хэмжих ёстой.
  • Эрсдэлийг эргэн санах - судалгаанд оролцогчдын ой санамжаас хамаарах үед.
  • Ажиглагчийн өрөөсгөл хандлага - эрдэмтэд бүх хүмүүсийн нэгэн адил харахыг хүлээж буй зүйлээ харах хандлагатай байдаг.
  • Хүйс болон арьс өнгөөр ​​ялгаварлан гадуурхах үзэл - хүйс, арьсны өнгө нь хэт эсвэл дутуу төлөөлөлтэй байж болно.  
  • Холбооны хэвшмэл ойлголт - өгөгдөл нь хэвшмэл ойлголтыг бэхжүүлдэг

AI найдвартай үр дүнг гаргахын тулд сургалтын өгөгдөл нь бодит ертөнцийг илэрхийлэх ёстой. Өмнөх блогийн нийтлэлд дурдсанчлан өгөгдөл бэлтгэх нь бусад өгөгдлийн төслийн нэгэн адил маш чухал юм. Найдваргүй өгөгдөл нь машин сургалтын системд буруу хичээл зааж, буруу дүгнэлт гаргахад хүргэдэг. Энэ нь "Бүх өгөгдөл нэг талыг барьсан. Энэ бол параной биш. Энэ бол баримт." – Санжив М.Наранаяны доктор, Стэнфордын их сургуулийн Анагаах ухааны сургууль.

Сургалтанд нэг талыг барьсан өгөгдлийг ашиглах нь хиймэл оюун ухааны хэд хэдэн мэдэгдэхүйц бүтэлгүйтэлд хүргэсэн. (Жишээ нь энд болон энд, судалгаа энд..)

Өргөтгөсөн алгоритмууд

Алгоритм гэдэг нь бизнесийн асуудалд хариулах оролтыг хүлээн авч, гаралтыг бий болгодог дүрмийн багц юм. Эдгээр нь ихэвчлэн сайн тодорхойлсон шийдвэрийн мод юм. Алгоритмууд нь хар хайрцаг шиг санагддаг. Хэрхэн ажилладаг талаар хэн ч мэдэхгүй, ихэнхдээ тэр байтугай тэдгээрийг ашигладаг компаниуд. Өө, тэд ихэвчлэн өмчлөлд байдаг. Тэдний нууцлаг, ээдрээтэй шинж чанар нь хэвийсэн алгоритмууд ийм нууцлагдмал байдгийн нэг шалтгаан юм. . 

Уралдааныг харгалзан үздэг анагаах ухаан, хүний ​​​​нөөц эсвэл санхүүгийн чиглэлээр AI алгоритмуудыг авч үзье. Хэрэв арьс өнгөний хүчин зүйл бол алгоритм нь арьсны өнгөөр ​​​​харалган байж чадахгүй. Энэ бол онолын хувьд биш. Иймэрхүү асуудлуудыг хиймэл оюун ухаан ашиглан бодит ертөнцөд илрүүлсэн ажилд авах, унах-хуваалцах, зээлийн өргөдөлs, ба бөөр шилжүүлэн суулгах

Хамгийн гол нь хэрэв таны өгөгдөл эсвэл алгоритмууд муу, ашиггүйгээс муу байвал аюултай байж магадгүй юм. Ийм зүйл байдаг.алгоритмын аудит.” Зорилго нь байгууллагуудад алгоритмтай холбоотой учирч болзошгүй эрсдлийг тодорхойлоход нь туслах явдал юм. Өөр газар, Facebook-ийн нь хиймэл оюун ухаанд нэг талыг барьсантай тэмцэхийн тулд хиймэл оюун ухааныг ашиглаж байна.

Хүмүүс нэг талыг барьсан

Бид тэгшитгэлийн хоёр талд байгаа хүмүүстэй. Хүмүүс шинжилгээгээ бэлдээд, мэдээллээ авч байгаа. Судлаачид ч байна, уншигчид ч байна. Аливаа харилцааны хувьд дамжуулах, хүлээн авахад асуудал гардаг.

Жишээлбэл, цаг агаарыг авч үзье. "Бороо орох магадлалтай" гэдэг нь юу гэсэн үг вэ? Нэгдүгээрт, бороо орох магадлалтай гэж цаг уурчид юу гэсэн үг вэ? АНУ-ын засгийн газрын мэдээлснээр Үндэсний цаг уурын үйлчилгээ, бороо орох магадлал буюу хур тунадасны магадлал (PoP) нь цаг агаарын урьдчилсан мэдээний хамгийн бага ойлгогддог элементүүдийн нэг юм. Үүнд: "Тунадас орох магадлал нь тогтоосон хугацаанд өгөгдсөн бүс нутагт 0.01 инч [sic] илүү хур тунадас орох статистик магадлал" гэсэн стандарт тодорхойлолттой. “Өгөгдсөн талбай” нь урьдчилсан мэдээний хэсэг буюу broadцутгах талбай. Энэ нь хур тунадасны албан ёсны магадлал нь тухайн бүс нутгийн хаа нэгтээ бороо орно гэсэн итгэл үнэмшил, чийглэг болох хэсгийн хувиас хамаарна гэсэн үг юм. Өөрөөр хэлбэл, хэрэв цаг уурчид урьдчилан таамагласан бүсэд бороо орно гэдэгт итгэлтэй байгаа бол (Итгэл = 100%), PoP нь бороо орох хэсгийн хэсгийг илэрхийлнэ.  

Парисын гудамж; Бороотой өдөр, Gustave Caillebotte (1848-1894) Чикагогийн урлагийн хүрээлэнгийн олон нийтийн газар

Бороо орох магадлал нь итгэлцэл болон бүс нутгаас хамаарна. Би энэ тухай мэдэхгүй байсан. Бусад хүмүүс ч үүнийг мэдэхгүй гэж би сэжиглэж байна. Хүн амын 75 орчим хувь нь PoP-ийг хэрхэн тооцдог, эсвэл энэ нь юуг төлөөлөх ёстойг нарийн ойлгодоггүй. Тэгэхээр биднийг хуурч байна уу, эсвэл энэ бол ойлголтын асуудал юм уу. Үүнийг хур тунадасны ойлголт гэж нэрлэе. Бид цаг агаарын мэдээлэгчийг буруутгах уу? Шударга байхын тулд зарим нь бий төөрөлдөж байна цаг уурчдын дунд ч гэсэн. Нэг дотор судалгаа, Судалгаанд хамрагдсан цаг уурчдын 43% нь PoP-ийн тодорхойлолтод маш бага нийцтэй байна гэж хариулсан.

Шинжилгээ нь өөрөө өрөөсгөл юм

Нөлөөлөх таван хүчин зүйлээс шинжилгээ нь өөрөө хамгийн гайхмаар зүйл байж болох юм. Шинжлэх ухааны судалгааны үр дүнд хянагдсан нийтлэл хэвлэгдэн гарахад ихэвчлэн онолыг таамаглаж, таамаглалыг шалгах аргуудыг тодорхойлж, өгөгдөл цуглуулж, дараа нь өгөгдөлд дүн шинжилгээ хийдэг. Шинжилгээний төрөл, хэрхэн хийгдсэн нь дүгнэлтэд хэрхэн нөлөөлж байгааг дутуу үнэлдэг. Дотор цаасан Энэ оны эхээр (2022 оны XNUMX-р сард) олон улсын хорт хавдрын сэтгүүлд нийтлэгдсэн бөгөөд зохиогчид санамсаргүй хяналттай туршилтууд болон ретроспектив ажиглалтын судалгааны үр дүнг үнэлэв. Тэдний дүгнэлтээр,

Харьцуулсан үр ашгийн судалгаанд аналитик сонголтуудыг өөрчилснөөр бид эсрэг тэсрэг үр дүнг бий болгосон. Бидний үр дүнгээс харахад зарим нэг ретроспектив ажиглалтын судалгаагаар эмчилгээ нь өвчтөний үр дүнг сайжруулдаг болохыг харуулж байгаа бол өөр нэг ижил төстэй судалгаагаар зүгээр л аналитик сонголтод тулгуурлан энэ нь тийм биш гэдгийг харуулж байна.

Өмнө нь шинжлэх ухааны сэтгүүлийн нийтлэлийг уншиж байхдаа, хэрэв та надтай адил бол үр дүн эсвэл дүгнэлт нь зөвхөн өгөгдөлтэй холбоотой гэж бодож байсан байх. Одоо үр дүн, эсвэл анхны таамаглалыг батлах эсвэл үгүйсгэх эсэх нь шинжилгээний аргаас хамаарна.

Өөр нэг судалгаа ижил төстэй үр дүнг олсон. Нийтлэл, Олон шинжээчид, нэг мэдээллийн багц: Аналитик сонголтын өөрчлөлтүүд үр дүнд хэрхэн нөлөөлдөгийг ил тод болгох, Тэд 29 өөр багт дүн шинжилгээ хийхийн тулд ижил өгөгдлийг хэрхэн өгсөнийг тайлбарладаг. Өгөгдлийн шинжилгээг ихэвчлэн нэг дүгнэлтэд хүргэдэг хатуу, нарийн тодорхойлсон үйл явц гэж үздэг.  

Арга зүйчдийн тайлбарыг үл харгалзан үр дүн нь онол, таамаглал, сонголтын цэгүүдээр шингэсэн сонгосон аналитик стратегиас хамаарна гэдгийг анзаарахгүй өнгөрөхөд хялбар байдаг. Ихэнх тохиолдолд судалгааны асуултад хамаарах өгөгдлийг үнэлэх олон үндэслэлтэй (мөн олон үндэслэлгүй) аргууд байдаг.

Судлаачид өгөгдлийн дүн шинжилгээг олон тооны эх сурвалжаас гаргаж авсан бөгөөд бүх судалгаанд судалгааны эцсийн үр дүнд нөлөөлж болох субьектив шийдвэр, тэр дундаа ямар төрлийн шинжилгээг ашиглах зэрэг шийдвэрүүд багтдаг гэсэн дүгнэлтэд хүрчээ.

Өөр хүний ​​зөвлөмж судлаач Дээрх судалгаанд дүн шинжилгээ хийсэн хүн шийдвэр гаргах эсвэл дүгнэлт гаргахдаа нэг цаас ашиглахдаа болгоомжтой байх хэрэгтэй.

Аналитик дахь хазайлтыг арилгах

Энэ бол зүгээр л сэрэмжлүүлэг байх зорилготой юм. Мэдлэг биднийг залилан мэхлэхээс хамгаалж чадна. Сканнер биднийг хуурахын тулд ашиглаж болох аргуудыг хэдий чинээ сайн мэддэг байх тусам халаасны хулгайчийн буруу чиглүүлэлт эсвэл Понзи жүжгийн гөлгөр ярианд автах магадлал төдий чинээ бага байх болно. Энэ нь бидний аналитикт нөлөөлж болзошгүй гажуудлыг ойлгож, хүлээн зөвшөөрөх явдал юм. Хэрэв бид боломжит нөлөөллийн талаар мэдэж байвал түүхийг илүү сайн танилцуулж, эцсийн дүндээ илүү сайн шийдвэр гаргах боломжтой.  

BI/analyticsАнгилаагүй
Яагаад Microsoft Excel нь №1 аналитик хэрэгсэл вэ?
Excel яагаад №1 аналитик хэрэгсэл вэ?

Excel яагаад №1 аналитик хэрэгсэл вэ?

  Энэ нь хямд бөгөөд хялбар юм. Microsoft Excel хүснэгтийн программ хангамжийг бизнесийн хэрэглэгчийн компьютер дээр суулгасан байх магадлалтай. Өнөөдөр олон хэрэглэгчид ахлах сургуулиасаа эсвэл бүр эртнээс Microsoft Office программ хангамжтай танилцсан. Энэ өвдөг шороодсон хариу...

Цааш унших

BI/analyticsАнгилаагүй
Өөрийн ойлголтыг задлаарай: Аналитик хаврын цэвэрлэгээний гарын авлага

Өөрийн ойлголтыг задлаарай: Аналитик хаврын цэвэрлэгээний гарын авлага

Үзэл бодлоо цэгцлэх Аналитикийн гарын авлага Хаврын цэвэрлэгээ Шинэ жил тэсрэлтээр эхэлдэг; жилийн эцсийн тайлангуудыг гаргаж, нягтлан шалгасны дараа хүн бүр тогтмол ажлын хуваарьтай болно. Өдрүүд уртсаж, мод цэцэг дэлгэрч,...

Цааш унших

BI/analyticsАнгилаагүй
NY Style vs. Chicago Style Pizza: Амттай мэтгэлцээн

NY Style vs. Chicago Style Pizza: Амттай мэтгэлцээн

Бидний хүсэл тэмүүллийг хангахад хэдхэн зүйл л халуун зүсэм пиццаны баяр баясгалантай өрсөлдөж чадна. Нью-Йорк маягийн болон Чикаго маягийн пицца хоёрын хоорондох мэтгэлцээн хэдэн арван жилийн турш халуун яриа өрнүүлсээр ирсэн. Загвар бүр өөрийн гэсэн өвөрмөц онцлогтой, үнэнч шүтэн бишрэгчидтэй....

Цааш унших

BI/analyticsCognos Analytics
Cognos Query Studio
Таны хэрэглэгчид Query Studio-г хүсч байна

Таны хэрэглэгчид Query Studio-г хүсч байна

IBM Cognos Analytics 12-г гаргаснаар Query Studio болон Analysis Studio-г удаан зарласан цуцалт нь Cognos Analytics-ийн хувилбарыг тэдгээр студиудыг хассанаар эцэст нь хүргэсэн. Хэдийгээр энэ нь үйл ажиллагаа эрхэлдэг ихэнх хүмүүст гэнэтийн зүйл биш байх ёстой ...

Цааш унших

BI/analyticsАнгилаагүй
Тейлор Свифтийн эффект бодит мөн үү?

Тейлор Свифтийн эффект бодит мөн үү?

Зарим шүүмжлэгчид түүнийг Super Bowl-ийн тасалбарын үнийг өсгөж байна гэж үзэж байна. Энэ амралтын өдрүүдэд болох Super Bowl телевизийн түүхэн дэх хамгийн олон үзэгчтэй 3 тэмцээний нэг байх төлөвтэй байна. Өнгөрсөн жилийн дээд амжилт, 1969 оны сарнаас ч илүү байж магадгүй...

Цааш унших

BI/analytics
Аналитик каталогууд – Аналитик экосистемд мандаж буй од

Аналитик каталогууд – Аналитик экосистемд мандаж буй од

Танилцуулга Технологийн ахлах захирлын (CTO) хувьд би аналитикт хандах хандлагыг өөрчлөх шинэ технологиудыг үргэлж эрэлхийлдэг. Сүүлийн хэдэн жилийн турш миний анхаарлыг татсан, асар их ирээдүйтэй технологи бол Analytics...

Цааш унших