ਵਿਸ਼ਲੇਸ਼ਣ ਝੂਠ

by ਅਗਸਤ ਨੂੰ 31, 2022BI/ਵਿਸ਼ਲੇਸ਼ਣ0 ਟਿੱਪਣੀ

ਵਿਸ਼ਲੇਸ਼ਣ ਝੂਠ

ਵਿਸ਼ਲੇਸ਼ਣ ਦਾ ਪੱਖਪਾਤ

 

ਮਾਰਕ ਟਵੇਨ ਨੇ ਬਹਿਸਬਾਜ਼ੀ ਨਾਲ ਕੁਝ ਅਜਿਹਾ ਕਿਹਾ, "ਇੱਥੇ ਤਿੰਨ ਕਿਸਮ ਦੇ ਝੂਠ ਹਨ: ਝੂਠ, ਬਦਨਾਮ ਝੂਠ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ. " 

ਅਸੀਂ ਇਹ ਮੰਨਦੇ ਹਾਂ ਕਿ ਵਿਸ਼ਲੇਸ਼ਣ ਸਾਨੂੰ ਉਪਯੋਗੀ, ਕਾਰਵਾਈਯੋਗ ਸੂਝ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਸਾਨੂੰ ਅਕਸਰ ਇਹ ਅਹਿਸਾਸ ਨਹੀਂ ਹੁੰਦਾ ਕਿ ਸਾਡੇ ਆਪਣੇ ਅਤੇ ਦੂਜਿਆਂ ਦੇ ਪੱਖਪਾਤ ਉਹਨਾਂ ਜਵਾਬਾਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦੇ ਹਨ ਜੋ ਅਸੀਂ ਸਭ ਤੋਂ ਵਧੀਆ ਸੌਫਟਵੇਅਰ ਅਤੇ ਪ੍ਰਣਾਲੀਆਂ ਦੁਆਰਾ ਦਿੱਤੇ ਜਾਂਦੇ ਹਾਂ। ਕਦੇ-ਕਦੇ, ਸਾਡੇ ਨਾਲ ਬੇਈਮਾਨੀ ਨਾਲ ਹੇਰਾਫੇਰੀ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਪਰ, ਆਮ ਤੌਰ 'ਤੇ, ਇਹ ਸੂਖਮ ਅਤੇ ਅਚੇਤ ਪੱਖਪਾਤ ਹੋ ਸਕਦੇ ਹਨ ਜੋ ਸਾਡੇ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਘੁਸ ਜਾਂਦੇ ਹਨ। ਪੱਖਪਾਤੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਪਿੱਛੇ ਪ੍ਰੇਰਣਾ ਕਈ ਗੁਣਾ ਹੈ। ਕਈ ਵਾਰ ਅਸੀਂ ਵਿਗਿਆਨ ਤੋਂ ਨਿਰਪੱਖ ਨਤੀਜਿਆਂ ਦੀ ਉਮੀਦ ਕਰਦੇ ਹਾਂ 1) ਡੇਟਾ ਨੂੰ ਕਿਵੇਂ ਪੇਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਇਸ ਵਿੱਚ ਸੂਖਮ ਵਿਕਲਪ, 2) ਅਸੰਗਤ ਜਾਂ ਗੈਰ-ਪ੍ਰਤੀਨਿਧੀ ਡੇਟਾ, 3) AI ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਕਿਵੇਂ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, 4) ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਅਗਿਆਨਤਾ, ਅਯੋਗਤਾ ਜਾਂ ਹੋਰ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹਨ ਕਹਾਣੀ ਦੱਸਣ ਲਈ, 5) ਵਿਸ਼ਲੇਸ਼ਣ ਖੁਦ।    

ਪੇਸ਼ਕਾਰੀ ਪੱਖਪਾਤੀ ਹੈ

ਕੁਝ ਝੂਠਾਂ ਨੂੰ ਦੂਜਿਆਂ ਨਾਲੋਂ ਲੱਭਣਾ ਆਸਾਨ ਹੁੰਦਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਜਾਣਦੇ ਹੋ ਕਿ ਕੀ ਲੱਭਣਾ ਹੈ ਤਾਂ ਤੁਸੀਂ ਵਧੇਰੇ ਆਸਾਨੀ ਨਾਲ ਸੰਭਾਵੀ ਤੌਰ 'ਤੇ ਖੋਜ ਕਰ ਸਕਦੇ ਹੋ ਗੁੰਮਰਾਹਕੁੰਨ ਗ੍ਰਾਫ ਅਤੇ ਚਾਰਟ. 

ਉਥੇ ਘੱਟੋ ਘੱਟ ਹਨ ਗੁੰਮਰਾਹਕੁੰਨ ਢੰਗ ਨਾਲ ਡੇਟਾ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨ ਦੇ ਪੰਜ ਤਰੀਕੇ: 1) ਇੱਕ ਸੀਮਤ ਡੇਟਾ ਸੈੱਟ ਦਿਖਾਓ, 2). ਗੈਰ-ਸੰਬੰਧਿਤ ਸਬੰਧ ਦਿਖਾਓ, 3) ਡੇਟਾ ਨੂੰ ਗਲਤ ਦਿਖਾਓ, 4) ਗੈਰ-ਰਵਾਇਤੀ ਤੌਰ 'ਤੇ ਡੇਟਾ ਦਿਖਾਓ, ਜਾਂ 5)। ਜ਼ਿਆਦਾ ਸਰਲ ਡਾਟਾ ਦਿਖਾਓ।

ਇੱਕ ਸੀਮਤ ਡਾਟਾ ਸੈੱਟ ਦਿਖਾਓ

ਡੇਟਾ ਨੂੰ ਸੀਮਿਤ ਕਰਨਾ, ਜਾਂ ਡੇਟਾ ਦੇ ਇੱਕ ਗੈਰ-ਬੇਤਰਤੀਬ ਭਾਗ ਦੀ ਚੋਣ ਕਰਨਾ ਅਕਸਰ ਇੱਕ ਕਹਾਣੀ ਦੱਸ ਸਕਦਾ ਹੈ ਜੋ ਵੱਡੀ ਤਸਵੀਰ ਦੇ ਨਾਲ ਇਕਸਾਰ ਨਹੀਂ ਹੈ। ਖਰਾਬ ਨਮੂਨਾ, ਜਾਂ ਚੈਰੀ ਚੁੱਕਣਾ, ਉਦੋਂ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਵਿਸ਼ਲੇਸ਼ਕ ਇੱਕ ਵੱਡੇ ਸਮੂਹ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਗੈਰ-ਪ੍ਰਤੀਨਿਧੀ ਨਮੂਨੇ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ। 

ਮਾਰਚ 2020 ਵਿੱਚ, ਜਾਰਜੀਆ ਦੇ ਪਬਲਿਕ ਹੈਲਥ ਵਿਭਾਗ ਇਸ ਚਾਰਟ ਨੂੰ ਆਪਣੀ ਰੋਜ਼ਾਨਾ ਸਥਿਤੀ ਰਿਪੋਰਟ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ। ਇਹ ਅਸਲ ਵਿੱਚ ਇਸਦੇ ਜਵਾਬਾਂ ਨਾਲੋਂ ਵੱਧ ਸਵਾਲ ਉਠਾਉਂਦਾ ਹੈ।  

ਇੱਕ ਚੀਜ਼ ਜੋ ਗੁੰਮ ਹੈ ਉਹ ਪ੍ਰਸੰਗ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਇਹ ਜਾਣਨਾ ਮਦਦਗਾਰ ਹੋਵੇਗਾ ਕਿ ਹਰੇਕ ਉਮਰ ਸਮੂਹ ਲਈ ਆਬਾਦੀ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਕਿੰਨੀ ਹੈ। ਸਧਾਰਨ ਦਿੱਖ ਵਾਲੇ ਪਾਈ ਚਾਰਟ ਦੇ ਨਾਲ ਇੱਕ ਹੋਰ ਮੁੱਦਾ ਅਸਮਾਨ ਉਮਰ ਸਮੂਹ ਹੈ। 0-17 ਵਿੱਚ 18 ਸਾਲ ਹਨ, 18-59 ਵਿੱਚ 42, 60+ ਓਪਨ-ਐਂਡ ਹੈ, ਪਰ ਲਗਭਗ 40 ਸਾਲ ਹਨ। ਇਕੱਲੇ ਇਸ ਚਾਰਟ ਤੋਂ ਸਿੱਟਾ ਇਹ ਨਿਕਲਦਾ ਹੈ ਕਿ ਜ਼ਿਆਦਾਤਰ ਕੇਸ 18-59 ਸਾਲ ਦੀ ਉਮਰ ਦੇ ਹਨ। 60+ ਸਾਲ ਦੀ ਉਮਰ ਵਰਗ ਕੋਵਿਡ ਦੇ ਕੇਸਾਂ ਤੋਂ ਘੱਟ ਪ੍ਰਭਾਵਿਤ ਹੋਇਆ ਜਾਪਦਾ ਹੈ। ਪਰ ਇਹ ਸਾਰੀ ਕਹਾਣੀ ਨਹੀਂ ਹੈ।

ਤੁਲਨਾ ਲਈ, 'ਤੇ ਇਹ ਵੱਖਰਾ ਡਾਟਾ ਸੈੱਟ ਕੀਤਾ ਗਿਆ ਹੈ ਸੀਡੀਸੀ ਵੈੱਬ ਸਾਈਟ ਯੂਐਸ ਆਬਾਦੀ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ 'ਤੇ ਵਾਧੂ ਡੇਟਾ ਦੇ ਨਾਲ ਉਮਰ ਸਮੂਹ ਦੁਆਰਾ COVID ਕੇਸਾਂ ਨੂੰ ਚਾਰਟ ਕਰਦਾ ਹੈ ਜੋ ਹਰੇਕ ਉਮਰ ਸੀਮਾ ਵਿੱਚ ਹੈ।  

ਇਹ ਬਿਹਤਰ ਹੈ। ਸਾਡੇ ਕੋਲ ਹੋਰ ਪ੍ਰਸੰਗ ਹੈ। ਅਸੀਂ ਦੇਖ ਸਕਦੇ ਹਾਂ ਕਿ 18-29, 30-39, 40-49 ਉਮਰ ਸਮੂਹਾਂ ਵਿੱਚ ਆਬਾਦੀ ਵਿੱਚ ਉਮਰ ਸਮੂਹ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਨਾਲੋਂ ਕੇਸਾਂ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਵੱਧ ਹੈ। ਅਜੇ ਵੀ ਕੁਝ ਅਸਮਾਨ ਉਮਰ ਸਮੂਹ ਹਨ। 16-17 ਇੱਕ ਵੱਖਰਾ ਉਮਰ ਸਮੂਹ ਕਿਉਂ ਹੈ? ਫਿਰ ਵੀ ਇਹ ਸਾਰੀ ਕਹਾਣੀ ਨਹੀਂ ਹੈ, ਪਰ ਪੰਡਤਾਂ ਨੇ ਇਸ ਤੋਂ ਘੱਟ ਬਾਰੇ ਕਾਲਮ ਲਿਖੇ ਹਨ, ਭਵਿੱਖਬਾਣੀਆਂ ਕੀਤੀਆਂ ਹਨ ਅਤੇ ਆਦੇਸ਼ ਦਿੱਤੇ ਹਨ। ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ, ਕੋਵਿਡ ਦੇ ਨਾਲ, ਉਮਰ ਦੇ ਨਾਲ-ਨਾਲ ਬਹੁਤ ਸਾਰੇ ਵੇਰੀਏਬਲ ਹਨ ਜੋ ਸਕਾਰਾਤਮਕ ਕੇਸ ਵਜੋਂ ਗਿਣੇ ਜਾਣ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰਦੇ ਹਨ: ਟੀਕਾਕਰਨ ਸਥਿਤੀ, ਟੈਸਟਾਂ ਦੀ ਉਪਲਬਧਤਾ, ਟੈਸਟ ਕੀਤੇ ਜਾਣ ਦੀ ਗਿਣਤੀ, ਸਹਿਜਤਾ, ਅਤੇ ਹੋਰ ਬਹੁਤ ਸਾਰੇ। ਕੇਸਾਂ ਦੀ ਗਿਣਤੀ, ਆਪਣੇ ਆਪ ਵਿੱਚ, ਇੱਕ ਅਧੂਰੀ ਤਸਵੀਰ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ. ਬਹੁਤੇ ਮਾਹਰ ਮੌਤਾਂ ਦੀ ਸੰਖਿਆ, ਜਾਂ ਪ੍ਰਤੀ 100,000 ਆਬਾਦੀ ਦੀ ਮੌਤ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ, ਜਾਂ ਕੇਸ-ਮੌਤ ਨੂੰ ਇਹ ਵੇਖਣ ਲਈ ਵੀ ਦੇਖਦੇ ਹਨ ਕਿ ਕੋਵਿਡ ਹਰੇਕ ਉਮਰ ਸਮੂਹ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦਾ ਹੈ।

ਗੈਰ-ਸੰਬੰਧਿਤ ਸਬੰਧ ਦਿਖਾਓ

ਸਪੱਸ਼ਟ ਹੈ ਕਿ, ਏ ਮਜ਼ਬੂਤ ​​ਸਬੰਧ ਵਿਗਿਆਨ, ਪੁਲਾੜ ਅਤੇ ਤਕਨਾਲੋਜੀ 'ਤੇ ਅਮਰੀਕਾ ਦੇ ਖਰਚੇ ਅਤੇ ਫਾਂਸੀ, ਗਲਾ ਘੁੱਟਣ ਅਤੇ ਦਮ ਘੁੱਟ ਕੇ ਖੁਦਕੁਸ਼ੀਆਂ ਦੀ ਗਿਣਤੀ ਦੇ ਵਿਚਕਾਰ। ਸਬੰਧ 99.79% ਹੈ, ਲਗਭਗ ਇੱਕ ਸੰਪੂਰਨ ਮੈਚ।  

ਹਾਲਾਂਕਿ, ਕੌਣ ਇਹ ਕੇਸ ਬਣਾਵੇਗਾ ਕਿ ਇਹ ਕਿਸੇ ਤਰ੍ਹਾਂ ਨਾਲ ਸਬੰਧਤ ਹਨ, ਜਾਂ ਇੱਕ ਦੂਜੇ ਦਾ ਕਾਰਨ ਬਣਦਾ ਹੈ? ਹੋਰ ਵੀ ਘੱਟ ਅਤਿ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਹਨ, ਪਰ ਕੋਈ ਘੱਟ ਜਾਅਲੀ ਨਹੀਂ ਹਨ। ਸਕ੍ਰਿਪਸ ਨੈਸ਼ਨਲ ਸਪੈਲਿੰਗ ਬੀ ਦੇ ਵਿਨਿੰਗ ਵਰਡ ਅਤੇ ਵੇਨੋਮਸ ਸਪਾਈਡਰਸ ਦੁਆਰਾ ਮਾਰੇ ਗਏ ਲੋਕਾਂ ਦੀ ਸੰਖਿਆ ਵਿੱਚ ਅੱਖਰਾਂ ਵਿੱਚ ਇੱਕ ਸਮਾਨ ਮਜ਼ਬੂਤ ​​ਸਬੰਧ ਹੈ। ਇਤਫ਼ਾਕ? ਤੁਸੀਂ ਫੈਸਲਾ ਕਰੋ.

ਇਸ ਡੇਟਾ ਨੂੰ ਚਾਰਟ ਕਰਨ ਦਾ ਇੱਕ ਹੋਰ ਤਰੀਕਾ ਜੋ ਘੱਟ ਗੁੰਮਰਾਹਕੁੰਨ ਹੋ ਸਕਦਾ ਹੈ, ਦੋਵੇਂ Y-ਧੁਰਿਆਂ 'ਤੇ ਜ਼ੀਰੋ ਸ਼ਾਮਲ ਕਰਨਾ ਹੋਵੇਗਾ।

ਡਾਟਾ ਗਲਤ ਦਿਖਾਓ

ਤੋਂ ਡੇਟਾ ਨੂੰ ਬੁਰੀ ਤਰ੍ਹਾਂ ਕਿਵੇਂ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨਾ ਹੈ, ਅਮਰੀਕਾ ਦੇ ਜਾਰਜੀਆ ਰਾਜ ਨੇ ਪੁਸ਼ਟੀ ਕੀਤੀ COVID-5 ਕੇਸਾਂ ਦੀ ਸਭ ਤੋਂ ਵੱਡੀ ਸੰਖਿਆ ਦੇ ਨਾਲ ਚੋਟੀ ਦੀਆਂ 19 ਕਾਉਂਟੀਆਂ ਪੇਸ਼ ਕੀਤੀਆਂ।

ਜਾਇਜ਼ ਲੱਗਦਾ ਹੈ, ਠੀਕ ਹੈ? ਕੋਵਿਡ-19 ਦੇ ਪੁਸ਼ਟੀ ਕੀਤੇ ਕੇਸਾਂ ਦਾ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਹੇਠਾਂ ਵੱਲ ਰੁਝਾਨ ਹੈ। ਕੀ ਤੁਸੀਂ ਐਕਸ-ਐਕਸਿਸ ਨੂੰ ਪੜ੍ਹ ਸਕਦੇ ਹੋ? X-ਧੁਰਾ ਸਮੇਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਆਮ ਤੌਰ 'ਤੇ, ਤਾਰੀਖਾਂ ਖੱਬੇ ਤੋਂ ਸੱਜੇ ਵਧਣਗੀਆਂ। ਇੱਥੇ, ਅਸੀਂ X-ਧੁਰੇ 'ਤੇ ਥੋੜਾ ਜਿਹਾ ਸਮਾਂ ਯਾਤਰਾ ਦੇਖਦੇ ਹਾਂ: 

4/28/2020

4/27/2020

4/29/2020

5/1/2020

4/30/2020

5/4/2020

5/6/2020

5/5/2020

5/2/22020 ...

ਉਡੀਕ ਕਰੋ? ਕੀ? X-ਧੁਰੇ ਨੂੰ ਕਾਲਕ੍ਰਮ ਅਨੁਸਾਰ ਕ੍ਰਮਬੱਧ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਲਈ, ਰੁਝਾਨ ਜਿੰਨਾ ਵਧੀਆ ਲੱਗ ਸਕਦਾ ਹੈ, ਅਸੀਂ ਕੋਈ ਸਿੱਟਾ ਨਹੀਂ ਕੱਢ ਸਕਦੇ। ਜੇਕਰ ਤਾਰੀਖਾਂ ਦਾ ਆਦੇਸ਼ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਕੇਸਾਂ ਦੀ ਗਿਣਤੀ ਲਈ ਬਾਰ ਕਿਸੇ ਵੀ ਕਿਸਮ ਦੇ ਰੁਝਾਨ ਨਾਲੋਂ ਆਰਾ-ਟੂਥ ਪੈਟਰਨ ਨੂੰ ਜ਼ਿਆਦਾ ਦਿਖਾਉਂਦਾ ਹੈ।

ਇੱਥੇ ਆਸਾਨ ਫਿਕਸ ਤਰੀਕਾਂ ਨੂੰ ਕੈਲੰਡਰ ਦੇ ਤਰੀਕੇ ਨਾਲ ਕ੍ਰਮਬੱਧ ਕਰਨਾ ਹੈ।

ਗੈਰ-ਰਵਾਇਤੀ ਤੌਰ 'ਤੇ ਡਾਟਾ ਦਿਖਾਓ

ਅਸੀਂ ਸਾਰੇ ਰੁੱਝੇ ਹੋਏ ਹਾਂ। ਸਾਡੇ ਦਿਮਾਗਾਂ ਨੇ ਸਾਨੂੰ ਉਨ੍ਹਾਂ ਧਾਰਨਾਵਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਜਲਦੀ ਨਿਰਣਾ ਕਰਨਾ ਸਿਖਾਇਆ ਹੈ ਜੋ ਸਾਡੀ ਦੁਨੀਆ ਵਿਚ ਇਕਸਾਰ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਹਰ ਗ੍ਰਾਫ਼ ਜੋ ਮੈਂ ਕਦੇ ਦੇਖਿਆ ਹੈ, x- ਅਤੇ y- ਅਕਸ਼ਾਂ ਨੂੰ ਜ਼ੀਰੋ, ਜਾਂ ਸਭ ਤੋਂ ਘੱਟ ਮੁੱਲਾਂ 'ਤੇ ਮਿਲਦੇ ਹੋਏ ਦਿਖਾਉਂਦਾ ਹੈ। ਇਸ ਚਾਰਟ ਨੂੰ ਸੰਖੇਪ ਵਿੱਚ ਦੇਖਦੇ ਹੋਏ, ਤੁਸੀਂ ਫਲੋਰੀਡਾ ਦੇ ਪ੍ਰਭਾਵ ਬਾਰੇ ਕੀ ਸਿੱਟਾ ਕੱਢ ਸਕਦੇ ਹੋ “ਆਪਣੇ ਜ਼ਮੀਨੀ ਕਾਨੂੰਨ ਨੂੰ ਕਾਇਮ ਰੱਖੋ।"? ਮੈਂ ਇਸਨੂੰ ਸਵੀਕਾਰ ਕਰਨ ਵਿੱਚ ਸ਼ਰਮ ਮਹਿਸੂਸ ਕਰਦਾ ਹਾਂ, ਪਰ ਇਸ ਗ੍ਰਾਫ ਨੇ ਮੈਨੂੰ ਪਹਿਲਾਂ ਮੂਰਖ ਬਣਾਇਆ. ਤੁਹਾਡੀ ਅੱਖ ਆਸਾਨੀ ਨਾਲ ਗ੍ਰਾਫਿਕ ਦੇ ਮੱਧ ਵਿੱਚ ਟੈਕਸਟ ਅਤੇ ਤੀਰ ਵੱਲ ਖਿੱਚੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਗ੍ਰਾਫ ਵਿੱਚ ਹੇਠਾਂ ਉੱਪਰ ਹੈ। ਇਹ ਝੂਠ ਨਹੀਂ ਹੋ ਸਕਦਾ - ਡੇਟਾ ਉੱਥੇ ਸਭ ਕੁਝ ਠੀਕ ਹੈ। ਪਰ, ਮੈਨੂੰ ਇਹ ਸੋਚਣਾ ਪਏਗਾ ਕਿ ਇਹ ਧੋਖਾ ਦੇਣ ਲਈ ਹੈ. ਜੇਕਰ ਤੁਸੀਂ ਇਸਨੂੰ ਅਜੇ ਤੱਕ ਨਹੀਂ ਦੇਖਿਆ ਹੈ, ਤਾਂ y-ਧੁਰੇ 'ਤੇ ਜ਼ੀਰੋ ਸਿਖਰ 'ਤੇ ਹੈ। ਇਸ ਲਈ, ਜਿਵੇਂ ਕਿ ਡੇਟਾ ਦਾ ਰੁਝਾਨ ਘਟਦਾ ਹੈ, ਇਸਦਾ ਅਰਥ ਹੈ ਹੋਰ ਮੌਤਾਂ. ਇਹ ਚਾਰਟ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਹਥਿਆਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਕਤਲਾਂ ਦੀ ਗਿਣਤੀ ਵਾਧਾ ਹੋਇਆ 2005 ਤੋਂ ਬਾਅਦ, ਚੱਲ ਰਹੇ ਰੁਝਾਨ ਦੁਆਰਾ ਦਰਸਾਏ ਗਏ ਥੱਲੇ.

ਡਾਟਾ ਓਵਰ-ਸਰਲੀਕ੍ਰਿਤ ਦਿਖਾਓ

ਡੇਟਾ ਦੇ ਓਵਰ-ਸਰਲੀਕਰਨ ਦੀ ਇੱਕ ਉਦਾਹਰਣ ਦੇਖੀ ਜਾ ਸਕਦੀ ਹੈ ਜਦੋਂ ਵਿਸ਼ਲੇਸ਼ਕ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ ਦਾ ਫਾਇਦਾ ਉਠਾਉਂਦੇ ਹਨ। ਇਹ ਇੱਕ ਅਜਿਹਾ ਵਰਤਾਰਾ ਹੈ ਜੋ ਉਦੋਂ ਵਾਪਰਦਾ ਹੈ ਜਦੋਂ ਸਮੁੱਚਾ ਡੇਟਾ ਸਬਸੈਟਾਂ ਵਿੱਚ ਵੱਖ ਕੀਤੇ ਜਾਣ ਨਾਲੋਂ ਇੱਕ ਵੱਖਰੇ ਸਿੱਟੇ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ। ਉੱਚ-ਪੱਧਰੀ ਸਮੁੱਚੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਨੂੰ ਦੇਖਦੇ ਹੋਏ ਇਸ ਜਾਲ ਵਿੱਚ ਫਸਣਾ ਆਸਾਨ ਹੈ। ਕੰਮ 'ਤੇ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ ਦੇ ਸਪੱਸ਼ਟ ਦ੍ਰਿਸ਼ਟਾਂਤ ਵਿੱਚੋਂ ਇੱਕ ਨਾਲ ਸਬੰਧਤ ਹੈ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ.  

ਇੱਥੇ ਅਸੀਂ ਦੇਖਦੇ ਹਾਂ ਕਿ ਡੇਰੇਕ ਜੇਟਰ ਦੀ 1995 ਅਤੇ 1996 ਸੀਜ਼ਨਾਂ ਲਈ ਡੇਵਿਡ ਜਸਟਿਸ ਨਾਲੋਂ ਉੱਚੀ ਓਵਰਆਲ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ ਹੈ। ਵਿਰੋਧਾਭਾਸ ਉਦੋਂ ਆਉਂਦਾ ਹੈ ਜਦੋਂ ਸਾਨੂੰ ਇਹ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਜਸਟਿਸ ਨੇ ਉਨ੍ਹਾਂ ਦੋਵਾਂ ਸਾਲਾਂ ਦੀ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ ਵਿੱਚ ਜੇਟਰ ਨੂੰ ਸਰਵੋਤਮ ਕੀਤਾ। ਜੇ ਤੁਸੀਂ ਧਿਆਨ ਨਾਲ ਦੇਖਦੇ ਹੋ, ਤਾਂ ਇਹ ਸਮਝ ਵਿੱਚ ਆਉਂਦਾ ਹੈ ਜਦੋਂ ਤੁਹਾਨੂੰ ਇਹ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਜੇਟਰ ਕੋਲ 4 ਵਿੱਚ .1996 ਘੱਟ ਔਸਤ ਨਾਲ 007 ਵਿੱਚ ਲਗਭਗ 1996 ਗੁਣਾ ਜ਼ਿਆਦਾ ਐਟ-ਬੈਟਸ (ਭਾਰ) ਸੀ। 10 ਵਿੱਚ 003 ਉੱਚ ਔਸਤ.

ਪੇਸ਼ਕਾਰੀ ਸਿੱਧੀ ਜਾਪਦੀ ਹੈ, ਪਰ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ, ਜਾਣ-ਬੁੱਝ ਕੇ ਜਾਂ ਅਣਜਾਣੇ ਵਿੱਚ, ਗਲਤ ਸਿੱਟੇ ਕੱਢੇ ਹਨ। ਹਾਲ ਹੀ ਵਿੱਚ, ਟੀਕਿਆਂ ਅਤੇ ਕੋਵਿਡ ਮੌਤ ਦਰ ਨਾਲ ਸਬੰਧਤ ਖਬਰਾਂ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਵਿੱਚ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਸਾਹਮਣੇ ਆਈਆਂ ਹਨ। ਇੱਕ ਚਾਰਟ 10-59 ਸਾਲ ਦੀ ਉਮਰ ਦੇ ਲੋਕਾਂ ਲਈ ਟੀਕਾਕਰਨ ਅਤੇ ਅਣ-ਟੀਕਾਕਰਨ ਦੇ ਵਿਚਕਾਰ ਮੌਤ ਦਰਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਵਾਲਾ ਇੱਕ ਲਾਈਨ ਗ੍ਰਾਫ ਦਿਖਾਉਂਦਾ ਹੈ। ਚਾਰਟ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਟੀਕਾਕਰਨ ਨਾ ਕੀਤੇ ਗਏ ਲੋਕਾਂ ਦੀ ਮੌਤ ਦਰ ਲਗਾਤਾਰ ਘੱਟ ਹੁੰਦੀ ਹੈ। ਇੱਥੇ ਕੀ ਹੋ ਰਿਹਾ ਹੈ?  

ਇਹ ਮੁੱਦਾ ਉਸੇ ਤਰ੍ਹਾਂ ਦਾ ਹੈ ਜੋ ਅਸੀਂ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ ਨਾਲ ਦੇਖਦੇ ਹਾਂ। ਇਸ ਕੇਸ ਵਿੱਚ ਹਰ ਉਮਰ ਸਮੂਹ ਦੇ ਵਿਅਕਤੀਆਂ ਦੀ ਸੰਖਿਆ ਹੈ। ਗ੍ਰਾਫ ਉਹਨਾਂ ਸਮੂਹਾਂ ਨੂੰ ਜੋੜਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦੇ ਵੱਖ-ਵੱਖ ਨਤੀਜੇ ਹੁੰਦੇ ਹਨ। ਜੇ ਅਸੀਂ ਬਜ਼ੁਰਗ ਉਮਰ ਸਮੂਹ, 50-59, ਨੂੰ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਦੇਖਦੇ ਹਾਂ, ਤਾਂ ਅਸੀਂ ਦੇਖਦੇ ਹਾਂ ਕਿ ਟੀਕਾਕਰਨ ਦਾ ਕਿਰਾਇਆ ਬਿਹਤਰ ਹੈ। ਇਸੇ ਤਰ੍ਹਾਂ, ਜੇ ਅਸੀਂ 10-49 ਨੂੰ ਵੇਖੀਏ, ਤਾਂ ਅਸੀਂ ਇਹ ਵੀ ਦੇਖਦੇ ਹਾਂ ਕਿ ਟੀਕਾ ਲਗਾਇਆ ਗਿਆ ਕਿਰਾਇਆ ਬਿਹਤਰ ਹੈ. ਵਿਰੋਧਾਭਾਸੀ ਤੌਰ 'ਤੇ, ਜਦੋਂ ਸੰਯੁਕਤ ਸੈੱਟ ਨੂੰ ਦੇਖਦੇ ਹੋਏ, ਅਣਵਿਆਸੀ ਦਾ ਇੱਕ ਬੁਰਾ ਨਤੀਜਾ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ, ਤੁਸੀਂ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਉਲਟ ਦਲੀਲਾਂ ਲਈ ਕੇਸ ਬਣਾਉਣ ਦੇ ਯੋਗ ਹੋ.

ਡੇਟਾ ਪੱਖਪਾਤੀ ਹੈ

ਡਾਟਾ ਹਮੇਸ਼ਾ ਭਰੋਸੇਯੋਗ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇੱਥੋਂ ਤੱਕ ਕਿ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਵਿੱਚ, ਇੱਕ ਤਿਹਾਈ ਤੋਂ ਵੱਧ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਮੰਨਿਆ "ਸੰਦੇਹਯੋਗ ਖੋਜ ਅਭਿਆਸ."  ਹੋਰ ਰਿਸਰਚ ਫਰਾਡ ਜਾਸੂਸ ਕਹਿੰਦਾ ਹੈ, "ਡਾਟਾ - ਟੇਬਲ, ਲਾਈਨ ਗ੍ਰਾਫ, ਸੀਕੁਏਂਸਿੰਗ ਡੇਟਾ [- ਜਿੰਨਾ ਅਸੀਂ ਅਸਲ ਵਿੱਚ ਖੋਜ ਰਹੇ ਹਾਂ] ਵਿੱਚ ਬਹੁਤ ਜ਼ਿਆਦਾ ਧੋਖਾਧੜੀ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ। ਆਪਣੀ ਰਸੋਈ ਦੇ ਮੇਜ਼ 'ਤੇ ਬੈਠਾ ਕੋਈ ਵੀ ਵਿਅਕਤੀ ਸਪ੍ਰੈਡਸ਼ੀਟ ਵਿੱਚ ਕੁਝ ਨੰਬਰ ਪਾ ਸਕਦਾ ਹੈ ਅਤੇ ਇੱਕ ਲਾਈਨ ਗ੍ਰਾਫ ਬਣਾ ਸਕਦਾ ਹੈ ਜੋ ਯਕੀਨਨ ਲੱਗਦਾ ਹੈ।

ਇਹ ਪਹਿਲਾ ਉਦਾਹਰਨ ਇੰਝ ਜਾਪਦਾ ਹੈ ਕਿ ਕਿਸੇ ਨੇ ਅਜਿਹਾ ਕੀਤਾ ਹੈ। ਮੈਂ ਇਹ ਨਹੀਂ ਕਹਿ ਰਿਹਾ ਹਾਂ ਕਿ ਇਹ ਧੋਖਾਧੜੀ ਹੈ, ਪਰ ਇੱਕ ਸਰਵੇਖਣ ਦੇ ਤੌਰ 'ਤੇ, ਇਹ ਸਿਰਫ਼ ਕੋਈ ਵੀ ਡੇਟਾ ਤਿਆਰ ਨਹੀਂ ਕਰਦਾ ਹੈ ਜੋ ਇੱਕ ਸੂਚਿਤ ਫੈਸਲੇ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦਾ ਹੈ। ਅਜਿਹਾ ਲਗਦਾ ਹੈ ਕਿ ਸਰਵੇਖਣ ਨੇ ਉੱਤਰਦਾਤਾਵਾਂ ਨੂੰ ਗੈਸ ਸਟੇਸ਼ਨ ਕੌਫੀ, ਜਾਂ ਕਿਸੇ ਹੋਰ ਸੰਬੰਧਿਤ ਮੌਜੂਦਾ ਘਟਨਾ ਬਾਰੇ ਉਹਨਾਂ ਦੀ ਰਾਏ ਬਾਰੇ ਪੁੱਛਿਆ ਹੈ। 

  1. ਸ਼ਾਨਦਾਰ 
  2. ਮਹਾਨ
  3. ਬਹੁਤ ਅੱਛਾ 

ਮੈਂ ਦੋਸ਼ੀ ਧਿਰ ਦੇ ਸੰਦਰਭਾਂ ਨੂੰ ਹਟਾਉਣ ਲਈ ਟਵਿੱਟਰ ਪੋਸਟ ਨੂੰ ਕੱਟਿਆ ਹੈ, ਪਰ ਇਹ ਸਰਵੇਖਣ ਦੇ ਅੰਤਮ ਨਤੀਜਿਆਂ ਦਾ ਅਸਲ ਪੂਰਾ ਚਾਰਟ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਸਰਵੇਖਣ ਅਸਧਾਰਨ ਨਹੀਂ ਹਨ। ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ, ਜਵਾਬਾਂ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਡੇਟਾ ਤੋਂ ਬਣਾਇਆ ਗਿਆ ਕੋਈ ਵੀ ਚਾਰਟ ਦਰਸਾਏਗਾ ਕਿ ਪ੍ਰਸ਼ਨ ਵਿੱਚ ਕੌਫੀ ਨੂੰ ਖੁੰਝਾਇਆ ਨਹੀਂ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ।  

ਸਮੱਸਿਆ ਇਹ ਹੈ ਕਿ ਜੇਕਰ ਤੁਹਾਨੂੰ ਇਹ ਸਰਵੇਖਣ ਦਿੱਤਾ ਗਿਆ ਸੀ ਅਤੇ ਤੁਹਾਡੀ ਸੋਚ ਦੇ ਅਨੁਕੂਲ ਕੋਈ ਜਵਾਬ ਨਹੀਂ ਮਿਲਿਆ, ਤਾਂ ਤੁਸੀਂ ਸਰਵੇਖਣ ਨੂੰ ਛੱਡ ਦਿੰਦੇ। ਇਹ ਇੱਕ ਅਤਿ ਉਦਾਹਰਨ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਭਰੋਸੇਮੰਦ ਡੇਟਾ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਮਾੜੀ ਸਰਵੇਖਣ ਡਿਜ਼ਾਈਨ, ਹਾਲਾਂਕਿ, ਘੱਟ ਜਵਾਬਾਂ ਦੀ ਅਗਵਾਈ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਜੋ ਜਵਾਬ ਦਿੰਦੇ ਹਨ ਉਹਨਾਂ ਦੀ ਸਿਰਫ ਇੱਕ ਰਾਏ ਹੈ, ਇਹ ਸਿਰਫ ਡਿਗਰੀ ਦੀ ਗੱਲ ਹੈ। ਡੇਟਾ ਪੱਖਪਾਤੀ ਹੈ।

ਡੇਟਾ ਪੱਖਪਾਤ ਦੀ ਇਹ ਦੂਜੀ ਉਦਾਹਰਨ "" ਦੀਆਂ ਫਾਈਲਾਂ ਤੋਂ ਹੈਸਭ ਤੋਂ ਭੈੜੇ ਕੋਵਿਡ 19 ਗੁੰਮਰਾਹਕੁੰਨ ਗ੍ਰਾਫ਼. " 

ਦੁਬਾਰਾ ਫਿਰ, ਇਹ ਸੂਖਮ ਹੈ ਅਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਪੱਸ਼ਟ ਨਹੀਂ ਹੈ. ਬਾਰ ਗ੍ਰਾਫ ਫਲੋਰੀਡਾ ਵਿੱਚ ਇੱਕ ਕਾਉਂਟੀ ਲਈ ਸਮੇਂ ਦੇ ਨਾਲ ਸਕਾਰਾਤਮਕ COVID-19 ਕੇਸਾਂ ਦੀ ਪ੍ਰਤੀਸ਼ਤ ਵਿੱਚ ਇੱਕ ਨਿਰਵਿਘਨ - ਲਗਭਗ ਬਹੁਤ ਹੀ ਨਿਰਵਿਘਨ - ਗਿਰਾਵਟ ਦਿਖਾਉਂਦਾ ਹੈ। ਤੁਸੀਂ ਆਸਾਨੀ ਨਾਲ ਇਹ ਸਿੱਟਾ ਕੱਢ ਸਕਦੇ ਹੋ ਕਿ ਕੇਸ ਘਟ ਰਹੇ ਹਨ। ਇਹ ਬਹੁਤ ਵਧੀਆ ਹੈ, ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਡੇਟਾ ਨੂੰ ਸਹੀ ਰੂਪ ਵਿੱਚ ਦਰਸਾਉਂਦੀ ਹੈ। ਸਮੱਸਿਆ ਡੇਟਾ ਵਿੱਚ ਹੈ। ਇਸ ਲਈ, ਇਹ ਇੱਕ ਹੋਰ ਧੋਖੇਬਾਜ਼ ਪੱਖਪਾਤ ਹੈ ਕਿਉਂਕਿ ਤੁਸੀਂ ਇਸਨੂੰ ਨਹੀਂ ਦੇਖ ਸਕਦੇ. ਇਹ ਡਾਟਾ ਵਿੱਚ ਬੇਕ ਹੈ. ਉਹ ਸਵਾਲ ਜੋ ਤੁਹਾਨੂੰ ਪੁੱਛਣ ਦੀ ਲੋੜ ਹੈ, ਸ਼ਾਮਲ ਕਰੋ, ਕਿਸ ਦੀ ਜਾਂਚ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ? ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਭਾਅ ਕੀ ਹੈ, ਜਾਂ ਜਨਸੰਖਿਆ ਜਿਸਦਾ ਅਸੀਂ ਪ੍ਰਤੀਸ਼ਤ ਦੇਖ ਰਹੇ ਹਾਂ। ਧਾਰਨਾ ਇਹ ਹੈ ਕਿ ਇਹ ਸਮੁੱਚੀ ਆਬਾਦੀ, ਜਾਂ ਘੱਟੋ ਘੱਟ, ਇੱਕ ਪ੍ਰਤੀਨਿਧੀ ਨਮੂਨਾ ਹੈ।

ਹਾਲਾਂਕਿ, ਇਸ ਮਿਆਦ ਦੇ ਦੌਰਾਨ, ਇਸ ਕਾਉਂਟੀ ਵਿੱਚ, ਟੈਸਟ ਸਿਰਫ ਸੀਮਤ ਗਿਣਤੀ ਵਿੱਚ ਲੋਕਾਂ ਨੂੰ ਦਿੱਤੇ ਗਏ ਸਨ। ਉਹਨਾਂ ਕੋਲ ਕੋਵਿਡ ਵਰਗੇ ਲੱਛਣ ਹੋਣੇ ਸਨ, ਜਾਂ ਉਹਨਾਂ ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਗਰਮ ਸਥਾਨਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਕਿਸੇ ਦੇਸ਼ ਦੀ ਯਾਤਰਾ ਕੀਤੀ ਸੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ ਨਤੀਜਿਆਂ ਨੂੰ ਉਲਝਾਉਣਾ ਇਹ ਤੱਥ ਹੈ ਕਿ ਹਰੇਕ ਸਕਾਰਾਤਮਕ ਟੈਸਟ ਗਿਣਿਆ ਗਿਆ ਅਤੇ ਹਰੇਕ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਗਿਣਿਆ ਗਿਆ। ਆਮ ਤੌਰ 'ਤੇ, ਜਦੋਂ ਕੋਈ ਵਿਅਕਤੀ ਸਕਾਰਾਤਮਕ ਟੈਸਟ ਕਰਦਾ ਹੈ, ਤਾਂ ਉਹ ਦੁਬਾਰਾ ਟੈਸਟ ਕਰਨਗੇ ਜਦੋਂ ਵਾਇਰਸ ਆਪਣਾ ਕੋਰਸ ਚਲਾ ਗਿਆ ਸੀ ਅਤੇ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਕਰੇਗਾ। ਇਸ ਲਈ, ਇੱਕ ਅਰਥ ਵਿੱਚ, ਹਰੇਕ ਸਕਾਰਾਤਮਕ ਕੇਸ ਲਈ, ਇੱਕ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਕੇਸ ਹੁੰਦਾ ਹੈ ਜੋ ਇਸਨੂੰ ਰੱਦ ਕਰਦਾ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਟੈਸਟ ਨਕਾਰਾਤਮਕ ਹੁੰਦੇ ਹਨ ਅਤੇ ਹਰੇਕ ਵਿਅਕਤੀ ਦੇ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਗਿਣੇ ਜਾਂਦੇ ਹਨ। ਤੁਸੀਂ ਦੇਖ ਸਕਦੇ ਹੋ ਕਿ ਡੇਟਾ ਕਿਵੇਂ ਪੱਖਪਾਤੀ ਹੈ ਅਤੇ ਫੈਸਲੇ ਲੈਣ ਲਈ ਖਾਸ ਤੌਰ 'ਤੇ ਉਪਯੋਗੀ ਨਹੀਂ ਹੈ। 

AI ਇਨਪੁਟ ਅਤੇ ਸਿਖਲਾਈ ਪੱਖਪਾਤੀ ਹੈ

ਘੱਟੋ-ਘੱਟ ਦੋ ਤਰੀਕੇ ਹਨ ਜਿਨ੍ਹਾਂ ਵਿੱਚ AI ਪੱਖਪਾਤੀ ਨਤੀਜੇ ਲਿਆ ਸਕਦਾ ਹੈ: ਪੱਖਪਾਤੀ ਡੇਟਾ ਨਾਲ ਸ਼ੁਰੂ ਕਰਨਾ, ਜਾਂ ਵੈਧ ਡੇਟਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਲਈ ਪੱਖਪਾਤੀ ਐਲਗੋਰਿਦਮ ਦੀ ਵਰਤੋਂ ਕਰਨਾ।  

ਪੱਖਪਾਤੀ ਇਨਪੁਟ

ਸਾਡੇ ਵਿੱਚੋਂ ਬਹੁਤ ਸਾਰੇ ਇਸ ਪ੍ਰਭਾਵ ਦੇ ਅਧੀਨ ਹਨ ਕਿ AI 'ਤੇ ਸੰਖਿਆਵਾਂ ਨੂੰ ਘਟਾਉਣ, ਇਸਦੇ ਐਲਗੋਰਿਦਮ ਨੂੰ ਲਾਗੂ ਕਰਨ, ਅਤੇ ਡੇਟਾ ਦੇ ਭਰੋਸੇਯੋਗ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਥੁੱਕਣ ਲਈ ਭਰੋਸਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਸਿਰਫ ਓਨੀ ਹੀ ਚੁਸਤ ਹੋ ਸਕਦੀ ਹੈ ਜਿੰਨੀ ਇਸਨੂੰ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਜੇਕਰ ਉਹ ਡੇਟਾ ਜਿਸ 'ਤੇ ਇਸ ਨੂੰ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ਅਪੂਰਣ ਹੈ, ਤਾਂ ਨਤੀਜਿਆਂ ਜਾਂ ਸਿੱਟਿਆਂ 'ਤੇ ਵੀ ਭਰੋਸਾ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਸਰਵੇਖਣ ਪੱਖਪਾਤ ਦੇ ਉਪਰੋਕਤ ਕੇਸ ਵਾਂਗ, ਇੱਥੇ ਬਹੁਤ ਸਾਰੇ ਤਰੀਕੇ ਹਨ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਡੇਟਾ ਹੋ ਸਕਦਾ ਹੈ ਪੱਖਪਾਤੀ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਵਿੱਚ:.  

  • ਨਮੂਨਾ ਪੱਖਪਾਤ - ਸਿਖਲਾਈ ਡੇਟਾਸੈਟ ਪੂਰੀ ਆਬਾਦੀ ਦਾ ਪ੍ਰਤੀਨਿਧ ਨਹੀਂ ਹੈ।
  • ਬੇਦਖਲੀ ਪੱਖਪਾਤ - ਕਈ ਵਾਰ ਜੋ ਬਾਹਰੀ ਜਾਪਦਾ ਹੈ ਉਹ ਅਸਲ ਵਿੱਚ ਵੈਧ ਹੁੰਦਾ ਹੈ, ਜਾਂ, ਜਿੱਥੇ ਅਸੀਂ ਇਸ ਬਾਰੇ ਲਾਈਨ ਖਿੱਚਦੇ ਹਾਂ ਕਿ ਕੀ ਸ਼ਾਮਲ ਕਰਨਾ ਹੈ (ਜ਼ਿਪ ਕੋਡ, ਮਿਤੀਆਂ, ਆਦਿ)।
  • ਮਾਪ ਪੱਖਪਾਤ - ਸੰਮੇਲਨ ਹਮੇਸ਼ਾ ਮੇਨਿਸਕਸ ਦੇ ਕੇਂਦਰ ਅਤੇ ਹੇਠਾਂ ਤੋਂ ਮਾਪਣਾ ਹੈ, ਉਦਾਹਰਨ ਲਈ, ਜਦੋਂ ਵੋਲਯੂਮੈਟ੍ਰਿਕ ਫਲਾਸਕ ਜਾਂ ਟੈਸਟ ਟਿਊਬਾਂ (ਪਾਰਾ ਨੂੰ ਛੱਡ ਕੇ) ਵਿੱਚ ਤਰਲ ਪਦਾਰਥਾਂ ਨੂੰ ਮਾਪਦੇ ਹੋ।
  • ਪੱਖਪਾਤ ਨੂੰ ਯਾਦ ਕਰੋ - ਜਦੋਂ ਖੋਜ ਭਾਗੀਦਾਰਾਂ ਦੀ ਯਾਦਾਸ਼ਤ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ।
  • ਨਿਰੀਖਕ ਪੱਖਪਾਤ - ਵਿਗਿਆਨੀ, ਸਾਰੇ ਮਨੁੱਖਾਂ ਵਾਂਗ, ਇਹ ਦੇਖਣ ਲਈ ਵਧੇਰੇ ਝੁਕਾਅ ਰੱਖਦੇ ਹਨ ਕਿ ਉਹ ਕੀ ਦੇਖਣ ਦੀ ਉਮੀਦ ਕਰਦੇ ਹਨ।
  • ਲਿੰਗਵਾਦੀ ਅਤੇ ਨਸਲਵਾਦੀ ਪੱਖਪਾਤ - ਲਿੰਗ ਜਾਂ ਨਸਲ ਨੂੰ ਵੱਧ ਜਾਂ ਘੱਟ-ਪ੍ਰਤੀਨਿਧਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।  
  • ਐਸੋਸੀਏਸ਼ਨ ਪੱਖਪਾਤ - ਡੇਟਾ ਸਟੀਰੀਓਟਾਈਪਾਂ ਨੂੰ ਮਜ਼ਬੂਤ ​​ਕਰਦਾ ਹੈ

AI ਨੂੰ ਭਰੋਸੇਯੋਗ ਨਤੀਜੇ ਦੇਣ ਲਈ, ਇਸਦੇ ਸਿਖਲਾਈ ਡੇਟਾ ਨੂੰ ਅਸਲ ਸੰਸਾਰ ਨੂੰ ਦਰਸਾਉਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਪਿਛਲੇ ਬਲੌਗ ਲੇਖ ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਹੈ, ਡੇਟਾ ਦੀ ਤਿਆਰੀ ਮਹੱਤਵਪੂਰਨ ਹੈ ਅਤੇ ਕਿਸੇ ਵੀ ਹੋਰ ਡੇਟਾ ਪ੍ਰੋਜੈਕਟ ਦੀ ਤਰ੍ਹਾਂ. ਭਰੋਸੇਮੰਦ ਡੇਟਾ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਗਲਤ ਸਬਕ ਸਿਖਾ ਸਕਦਾ ਹੈ ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ ਗਲਤ ਸਿੱਟੇ ਨਿਕਲਣਗੇ। ਉਸ ਨੇ ਕਿਹਾ, “ਸਾਰਾ ਡੇਟਾ ਪੱਖਪਾਤੀ ਹੈ। ਇਹ ਪਾਗਲਪਣ ਨਹੀਂ ਹੈ। ਇਹ ਤੱਥ ਹੈ।” - ਡਾ: ਸੰਜੀਵ ਐਮ. ਨਰਾਇਣ, ਸਟੈਨਫੋਰਡ ਯੂਨੀਵਰਸਿਟੀ ਸਕੂਲ ਆਫ਼ ਮੈਡੀਸਨ।

ਸਿਖਲਾਈ ਲਈ ਪੱਖਪਾਤੀ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਨ ਨਾਲ ਬਹੁਤ ਸਾਰੀਆਂ ਮਹੱਤਵਪੂਰਨ AI ਅਸਫਲਤਾਵਾਂ ਹੋਈਆਂ ਹਨ। (ਉਦਾਹਰਨਾਂ ਇਥੇ ਅਤੇ ਇਥੇ, ਖੋਜ ਇਥੇ..)

ਪੱਖਪਾਤੀ ਐਲਗੋਰਿਦਮ

ਇੱਕ ਐਲਗੋਰਿਦਮ ਨਿਯਮਾਂ ਦਾ ਇੱਕ ਸਮੂਹ ਹੈ ਜੋ ਇੱਕ ਇੰਪੁੱਟ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ ਅਤੇ ਇੱਕ ਵਪਾਰਕ ਸਮੱਸਿਆ ਦਾ ਜਵਾਬ ਦੇਣ ਲਈ ਆਉਟਪੁੱਟ ਬਣਾਉਂਦਾ ਹੈ। ਉਹ ਅਕਸਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਰਿਭਾਸ਼ਿਤ ਫੈਸਲੇ ਦੇ ਰੁੱਖ ਹੁੰਦੇ ਹਨ। ਐਲਗੋਰਿਦਮ ਬਲੈਕ ਬਾਕਸ ਵਾਂਗ ਮਹਿਸੂਸ ਕਰਦੇ ਹਨ। ਕੋਈ ਵੀ ਯਕੀਨੀ ਨਹੀਂ ਹੁੰਦਾ ਕਿ ਉਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਅਕਸਰ, ਇੱਥੋਂ ਤੱਕ ਕਿ ਨਹੀਂ ਕੰਪਨੀਆਂ ਜੋ ਇਹਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੀਆਂ ਹਨ. ਓਹ, ਅਤੇ ਉਹ ਅਕਸਰ ਮਲਕੀਅਤ ਹੁੰਦੇ ਹਨ. ਉਹਨਾਂ ਦਾ ਰਹੱਸਮਈ ਅਤੇ ਗੁੰਝਲਦਾਰ ਸੁਭਾਅ ਇੱਕ ਕਾਰਨ ਹੈ ਕਿ ਪੱਖਪਾਤੀ ਐਲਗੋਰਿਦਮ ਇੰਨੇ ਧੋਖੇਬਾਜ਼ ਹਨ। . 

ਦਵਾਈ, ਐਚਆਰ ਜਾਂ ਵਿੱਤ ਵਿੱਚ AI ਐਲਗੋਰਿਦਮ 'ਤੇ ਵਿਚਾਰ ਕਰੋ ਜੋ ਦੌੜ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹਨ। ਜੇਕਰ ਨਸਲ ਇੱਕ ਕਾਰਕ ਹੈ, ਤਾਂ ਐਲਗੋਰਿਦਮ ਨਸਲੀ ਤੌਰ 'ਤੇ ਅੰਨ੍ਹਾ ਨਹੀਂ ਹੋ ਸਕਦਾ। ਇਹ ਸਿਧਾਂਤਕ ਨਹੀਂ ਹੈ। AI in ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਸਲ ਸੰਸਾਰ ਵਿੱਚ ਇਸ ਤਰ੍ਹਾਂ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਲੱਭੀਆਂ ਗਈਆਂ ਹਨ ਮਜੂਰੀ, ਰਾਈਡ-ਸ਼ੇਅਰ, ਕਰਜ਼ਾ ਅਰਜ਼ੀs, ਅਤੇ ਗੁਰਦੇ ਟ੍ਰਾਂਸਪਲਾਂਟ

ਤਲ ਲਾਈਨ ਇਹ ਹੈ ਕਿ ਜੇ ਤੁਹਾਡਾ ਡੇਟਾ ਜਾਂ ਐਲਗੋਰਿਦਮ ਖਰਾਬ ਹਨ, ਬੇਕਾਰ ਤੋਂ ਵੀ ਮਾੜੇ ਹਨ, ਤਾਂ ਉਹ ਖਤਰਨਾਕ ਹੋ ਸਕਦੇ ਹਨ. ਇੱਕ ਅਜਿਹੀ ਚੀਜ਼ ਹੈ ਜਿਵੇਂ "ਐਲਗੋਰਿਦਮਿਕ ਆਡਿਟ" ਟੀਚਾ ਐਲਗੋਰਿਦਮ ਨਾਲ ਸਬੰਧਤ ਸੰਭਾਵੀ ਖਤਰਿਆਂ ਦੀ ਪਛਾਣ ਕਰਨ ਵਿੱਚ ਸੰਸਥਾਵਾਂ ਦੀ ਮਦਦ ਕਰਨਾ ਹੈ ਕਿਉਂਕਿ ਇਹ ਨਿਰਪੱਖਤਾ, ਪੱਖਪਾਤ ਅਤੇ ਵਿਤਕਰੇ ਨਾਲ ਸਬੰਧਤ ਹੈ। ਕਿਤੇ ਹੋਰ, ਫੇਸਬੁੱਕ AI ਵਿੱਚ ਪੱਖਪਾਤ ਨਾਲ ਲੜਨ ਲਈ AI ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ।

ਲੋਕ ਪੱਖਪਾਤੀ ਹਨ

ਸਾਡੇ ਕੋਲ ਸਮੀਕਰਨ ਦੇ ਦੋਵੇਂ ਪਾਸੇ ਲੋਕ ਹਨ। ਲੋਕ ਵਿਸ਼ਲੇਸ਼ਣ ਤਿਆਰ ਕਰ ਰਹੇ ਹਨ ਅਤੇ ਲੋਕ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰ ਰਹੇ ਹਨ। ਖੋਜੀ ਹਨ ਅਤੇ ਪਾਠਕ ਹਨ। ਕਿਸੇ ਵੀ ਸੰਚਾਰ ਵਿੱਚ, ਪ੍ਰਸਾਰਣ ਜਾਂ ਰਿਸੈਪਸ਼ਨ ਵਿੱਚ ਸਮੱਸਿਆਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ.

ਉਦਾਹਰਨ ਲਈ, ਮੌਸਮ ਲਓ। "ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ" ਦਾ ਕੀ ਮਤਲਬ ਹੈ? ਪਹਿਲਾਂ, ਮੌਸਮ ਵਿਗਿਆਨੀਆਂ ਦਾ ਕੀ ਮਤਲਬ ਹੈ ਜਦੋਂ ਉਹ ਕਹਿੰਦੇ ਹਨ ਕਿ ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ ਹੈ? ਅਮਰੀਕੀ ਸਰਕਾਰ ਦੇ ਅਨੁਸਾਰ ਰਾਸ਼ਟਰੀ ਮੌਸਮ ਸੇਵਾ, ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ, ਜਾਂ ਜਿਸਨੂੰ ਉਹ ਪ੍ਰੌਬੇਬਿਲਟੀ ਆਫ਼ ਪ੍ਰਿਸੀਪੀਟੇਸ਼ਨ (PoP) ਕਹਿੰਦੇ ਹਨ, ਇੱਕ ਮੌਸਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਵਿੱਚ ਸਭ ਤੋਂ ਘੱਟ ਸਮਝੇ ਜਾਣ ਵਾਲੇ ਤੱਤਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ। ਇਸਦੀ ਇੱਕ ਮਿਆਰੀ ਪਰਿਭਾਸ਼ਾ ਹੈ: "ਵਰਖਾ ਦੀ ਸੰਭਾਵਨਾ ਨਿਰਧਾਰਿਤ ਸਮੇਂ ਦੀ ਮਿਆਦ ਵਿੱਚ ਦਿੱਤੇ ਗਏ ਪੂਰਵ ਅਨੁਮਾਨ ਖੇਤਰ ਵਿੱਚ ਦਿੱਤੇ ਗਏ ਖੇਤਰ ਵਿੱਚ 0.01″ ਇੰਚ [sic] ਤੋਂ ਜ਼ਿਆਦਾ ਵਰਖਾ ਦੀ ਇੱਕ ਅੰਕੜਾਤਮਕ ਸੰਭਾਵਨਾ ਹੈ।" "ਦਿੱਤਾ ਖੇਤਰ" ਪੂਰਵ ਅਨੁਮਾਨ ਖੇਤਰ ਹੈ, ਜਾਂ ਬੀroadਕਾਸਟ ਖੇਤਰ. ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਵਰਖਾ ਦੀ ਅਧਿਕਾਰਤ ਸੰਭਾਵਨਾ ਇਸ ਭਰੋਸੇ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਕਿ ਇਹ ਖੇਤਰ ਵਿੱਚ ਕਿਤੇ ਮੀਂਹ ਪਵੇਗਾ ਅਤੇ ਖੇਤਰ ਦਾ ਪ੍ਰਤੀਸ਼ਤ ਗਿੱਲਾ ਹੋ ਜਾਵੇਗਾ। ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਜੇਕਰ ਮੌਸਮ ਵਿਗਿਆਨੀ ਨੂੰ ਭਰੋਸਾ ਹੈ ਕਿ ਇਹ ਪੂਰਵ ਅਨੁਮਾਨ ਖੇਤਰ (ਵਿਸ਼ਵਾਸ = 100%) ਵਿੱਚ ਮੀਂਹ ਪੈਣ ਵਾਲਾ ਹੈ, ਤਾਂ PoP ਉਸ ਖੇਤਰ ਦੇ ਹਿੱਸੇ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਮੀਂਹ ਪਵੇਗਾ।  

ਪੈਰਿਸ ਸਟ੍ਰੀਟ; ਮੀਂਹ ਵਾਲਾ ਦਿਨ,ਗੁਸਤਾਵ ਕੈਲੇਬੋਟ (1848-1894) ਸ਼ਿਕਾਗੋ ਆਰਟ ਇੰਸਟੀਚਿਊਟ ਪਬਲਿਕ ਡੋਮੇਨ

ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ ਭਰੋਸੇ ਅਤੇ ਖੇਤਰ ਦੋਵਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ। ਮੈਨੂੰ ਇਹ ਨਹੀਂ ਪਤਾ ਸੀ। ਮੈਨੂੰ ਸ਼ੱਕ ਹੈ ਕਿ ਹੋਰ ਲੋਕ ਵੀ ਇਹ ਨਹੀਂ ਜਾਣਦੇ ਹਨ। ਲਗਭਗ 75% ਆਬਾਦੀ ਸਹੀ ਢੰਗ ਨਾਲ ਇਹ ਨਹੀਂ ਸਮਝਦੀ ਕਿ PoP ਦੀ ਗਣਨਾ ਕਿਵੇਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜਾਂ ਇਸਦਾ ਮਤਲਬ ਕੀ ਹੈ। ਇਸ ਲਈ, ਕੀ ਸਾਨੂੰ ਮੂਰਖ ਬਣਾਇਆ ਜਾ ਰਿਹਾ ਹੈ, ਜਾਂ, ਕੀ ਇਹ ਧਾਰਨਾ ਦੀ ਸਮੱਸਿਆ ਹੈ। ਚਲੋ ਇਸਨੂੰ ਵਰਖਾ ਧਾਰਨਾ ਕਹਿੰਦੇ ਹਾਂ। ਕੀ ਅਸੀਂ ਮੌਸਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਵਾਲੇ ਨੂੰ ਦੋਸ਼ੀ ਠਹਿਰਾਉਂਦੇ ਹਾਂ? ਨਿਰਪੱਖ ਹੋਣ ਲਈ, ਕੁਝ ਹੈ ਉਲਝਣ ਮੌਸਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਵਾਲਿਆਂ ਵਿੱਚ ਵੀ। ਇੱਕ ਵਿੱਚ ਸਰਵੇਖਣ, ਸਰਵੇਖਣ ਕੀਤੇ ਗਏ ਮੌਸਮ ਵਿਗਿਆਨੀਆਂ ਵਿੱਚੋਂ 43% ਨੇ ਕਿਹਾ ਕਿ ਪੀਓਪੀ ਦੀ ਪਰਿਭਾਸ਼ਾ ਵਿੱਚ ਬਹੁਤ ਘੱਟ ਇਕਸਾਰਤਾ ਹੈ।

ਵਿਸ਼ਲੇਸ਼ਣ ਖੁਦ ਹੀ ਪੱਖਪਾਤੀ ਹੈ

ਪੰਜਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਨ ਵਾਲੇ ਕਾਰਕਾਂ ਵਿੱਚੋਂ, ਵਿਸ਼ਲੇਸ਼ਣ ਆਪਣੇ ਆਪ ਵਿੱਚ ਸਭ ਤੋਂ ਹੈਰਾਨੀਜਨਕ ਹੋ ਸਕਦਾ ਹੈ। ਵਿਗਿਆਨਕ ਖੋਜ ਵਿੱਚ ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਇੱਕ ਸਮੀਖਿਆ ਕੀਤੀ ਪੇਪਰ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਆਮ ਤੌਰ 'ਤੇ ਇੱਕ ਸਿਧਾਂਤ ਦੀ ਕਲਪਨਾ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਪਰਿਕਲਪਨਾ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਤਰੀਕਿਆਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਡੇਟਾ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਫਿਰ ਡੇਟਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਕਿਸਮ ਜੋ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ ਇਹ ਕਿਵੇਂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਇਸ ਗੱਲ ਵਿੱਚ ਘੱਟ ਪ੍ਰਸ਼ੰਸਾ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਕਿ ਇਹ ਸਿੱਟਿਆਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦਾ ਹੈ। ਵਿੱਚ ਇੱਕ ਕਾਗਜ਼ ਇਸ ਸਾਲ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਪ੍ਰਕਾਸ਼ਿਤ (ਜਨਵਰੀ 2022), ਕੈਂਸਰ ਦੇ ਇੰਟਰਨੈਸ਼ਨਲ ਜਰਨਲ ਵਿੱਚ, ਲੇਖਕਾਂ ਨੇ ਮੁਲਾਂਕਣ ਕੀਤਾ ਕਿ ਕੀ ਬੇਤਰਤੀਬੇ ਨਿਯੰਤਰਿਤ ਅਜ਼ਮਾਇਸ਼ਾਂ ਅਤੇ ਪੂਰਵ-ਅਨੁਸਾਰੀ ਅਧਿਐਨਾਂ ਦੇ ਨਤੀਜੇ ਹਨ। ਉਨ੍ਹਾਂ ਦੀਆਂ ਖੋਜਾਂ ਨੇ ਸਿੱਟਾ ਕੱਢਿਆ ਕਿ,

ਤੁਲਨਾਤਮਕ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਖੋਜ ਵਿੱਚ ਵੱਖੋ-ਵੱਖਰੇ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਵਿਕਲਪਾਂ ਦੁਆਰਾ, ਅਸੀਂ ਉਲਟ ਨਤੀਜੇ ਪੈਦਾ ਕੀਤੇ। ਸਾਡੇ ਨਤੀਜੇ ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ ਕਿ ਕੁਝ ਪਿਛਾਖੜੀ ਨਿਰੀਖਣ ਅਧਿਐਨਾਂ ਵਿੱਚ ਇੱਕ ਇਲਾਜ ਦਾ ਪਤਾ ਲੱਗ ਸਕਦਾ ਹੈ ਜੋ ਮਰੀਜ਼ਾਂ ਲਈ ਨਤੀਜਿਆਂ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਇੱਕ ਹੋਰ ਸਮਾਨ ਅਧਿਐਨ ਇਹ ਨਹੀਂ ਲੱਭ ਸਕਦਾ ਹੈ, ਸਿਰਫ਼ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਵਿਕਲਪਾਂ ਦੇ ਅਧਾਰ ਤੇ।

ਅਤੀਤ ਵਿੱਚ, ਇੱਕ ਵਿਗਿਆਨਕ ਜਰਨਲ ਲੇਖ ਨੂੰ ਪੜ੍ਹਦੇ ਸਮੇਂ, ਜੇ ਤੁਸੀਂ ਮੇਰੇ ਵਰਗੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਸ਼ਾਇਦ ਸੋਚਿਆ ਹੋਵੇਗਾ ਕਿ ਨਤੀਜੇ ਜਾਂ ਸਿੱਟੇ ਸਾਰੇ ਡੇਟਾ ਬਾਰੇ ਹਨ। ਹੁਣ, ਇਹ ਜਾਪਦਾ ਹੈ ਕਿ ਨਤੀਜੇ, ਜਾਂ ਕੀ ਸ਼ੁਰੂਆਤੀ ਪਰਿਕਲਪਨਾ ਦੀ ਪੁਸ਼ਟੀ ਕੀਤੀ ਗਈ ਹੈ ਜਾਂ ਰੱਦ ਕੀਤੀ ਗਈ ਹੈ, ਇਹ ਵੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਵਿਧੀ 'ਤੇ ਨਿਰਭਰ ਹੋ ਸਕਦਾ ਹੈ।

ਹੋਰ ਦਾ ਅਧਿਐਨ ਸਮਾਨ ਨਤੀਜੇ ਮਿਲੇ ਹਨ। ਲੇਖ, ਬਹੁਤ ਸਾਰੇ ਵਿਸ਼ਲੇਸ਼ਕ, ਇੱਕ ਡੇਟਾ ਸੈਟ: ਪਾਰਦਰਸ਼ੀ ਬਣਾਉਣਾ ਕਿ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਚੋਣਾਂ ਵਿੱਚ ਭਿੰਨਤਾਵਾਂ ਨਤੀਜਿਆਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦੀਆਂ ਹਨ, ਵਰਣਨ ਕਰਦਾ ਹੈ ਕਿ ਉਹਨਾਂ ਨੇ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ 29 ਵੱਖ-ਵੱਖ ਟੀਮਾਂ ਨੂੰ ਇੱਕੋ ਡੇਟਾ ਸੈੱਟ ਕਿਵੇਂ ਦਿੱਤਾ। ਡੇਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਅਕਸਰ ਇੱਕ ਸਖਤ, ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਰਿਭਾਸ਼ਿਤ ਪ੍ਰਕਿਰਿਆ ਵਜੋਂ ਦੇਖਿਆ ਜਾਂਦਾ ਹੈ ਜੋ ਇੱਕ ਸਿੱਟੇ 'ਤੇ ਪਹੁੰਚਦਾ ਹੈ।  

ਵਿਧੀ-ਵਿਗਿਆਨੀਆਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨਾਂ ਦੇ ਬਾਵਜੂਦ, ਇਸ ਤੱਥ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨਾ ਆਸਾਨ ਹੈ ਕਿ ਨਤੀਜੇ ਚੁਣੀ ਗਈ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਰਣਨੀਤੀ 'ਤੇ ਨਿਰਭਰ ਹੋ ਸਕਦੇ ਹਨ, ਜੋ ਆਪਣੇ ਆਪ ਵਿੱਚ ਸਿਧਾਂਤ, ਧਾਰਨਾਵਾਂ ਅਤੇ ਚੋਣ ਬਿੰਦੂਆਂ ਨਾਲ ਰੰਗੀ ਹੋਈ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਖੋਜ ਸਵਾਲ 'ਤੇ ਸਹਿਣ ਵਾਲੇ ਡੇਟਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਬਹੁਤ ਸਾਰੇ ਵਾਜਬ (ਅਤੇ ਬਹੁਤ ਸਾਰੇ ਗੈਰ-ਵਾਜਬ) ਪਹੁੰਚ ਹਨ।

ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਡੇਟਾ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਭੀੜ-ਸ੍ਰੋਤ ਕੀਤਾ ਅਤੇ ਇਸ ਸਿੱਟੇ 'ਤੇ ਪਹੁੰਚੇ ਕਿ ਸਾਰੀਆਂ ਖੋਜਾਂ ਵਿੱਚ ਵਿਅਕਤੀਗਤ ਫੈਸਲੇ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ - ਜਿਸ ਵਿੱਚ ਕਿਸ ਕਿਸਮ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਹੈ - ਜੋ ਅਧਿਐਨ ਦੇ ਅੰਤਮ ਨਤੀਜਿਆਂ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰ ਸਕਦੀ ਹੈ।

ਕਿਸੇ ਹੋਰ ਦੀ ਸਿਫਾਰਸ਼ ਖੋਜਕਾਰ ਉਪਰੋਕਤ ਅਧਿਐਨ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਾਲੇ ਨੂੰ ਫੈਸਲੇ ਲੈਣ ਜਾਂ ਸਿੱਟੇ ਕੱਢਣ ਲਈ ਇੱਕ ਪੇਪਰ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਸਮੇਂ ਸਾਵਧਾਨ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ।

ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਪੱਖਪਾਤ ਨੂੰ ਸੰਬੋਧਨ ਕਰਨਾ

ਇਹ ਸਿਰਫ਼ ਇੱਕ ਸਾਵਧਾਨੀ ਵਾਲੀ ਕਹਾਣੀ ਹੈ। ਗਿਆਨ ਸਾਨੂੰ ਘੁਟਾਲਿਆਂ ਵਿੱਚ ਫਸਣ ਤੋਂ ਬਚਾ ਸਕਦਾ ਹੈ। ਇੱਕ ਸਕੈਨਰ ਸਾਨੂੰ ਮੂਰਖ ਬਣਾਉਣ ਲਈ ਜਿੰਨਾ ਸੰਭਾਵੀ ਤਰੀਕਿਆਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ, ਉਸ ਤੋਂ ਵੱਧ ਜਾਣੂ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ, ਸਾਨੂੰ ਇੱਕ ਪਾਕੇਟ ਦੀ ਗਲਤ ਦਿਸ਼ਾ, ਜਾਂ ਇੱਕ ਪੋਂਜ਼ੀ ਖੇਡ ਦੀ ਨਿਰਵਿਘਨ ਗੱਲਬਾਤ ਵਿੱਚ ਲਏ ਜਾਣ ਦੀ ਘੱਟ ਸੰਭਾਵਨਾ ਹੈ। ਇਸ ਲਈ ਇਹ ਸੰਭਾਵੀ ਪੱਖਪਾਤਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਪਛਾਣਨ ਦੇ ਨਾਲ ਹੈ ਜੋ ਸਾਡੇ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ। ਜੇਕਰ ਅਸੀਂ ਸੰਭਾਵੀ ਪ੍ਰਭਾਵਾਂ ਤੋਂ ਜਾਣੂ ਹਾਂ, ਤਾਂ ਅਸੀਂ ਕਹਾਣੀ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਪੇਸ਼ ਕਰਨ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹਾਂ ਅਤੇ ਅੰਤ ਵਿੱਚ ਬਿਹਤਰ ਫੈਸਲੇ ਲੈ ਸਕਦੇ ਹਾਂ।  

BI/ਵਿਸ਼ਲੇਸ਼ਣਇਤਾਹਾਸ
ਮਾਈਕ੍ਰੋਸਾੱਫਟ ਐਕਸਲ #1 ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲ ਕਿਉਂ ਹੈ
ਐਕਸਲ #1 ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲ ਕਿਉਂ ਹੈ?

ਐਕਸਲ #1 ਵਿਸ਼ਲੇਸ਼ਣ ਟੂਲ ਕਿਉਂ ਹੈ?

  ਇਹ ਸਸਤਾ ਅਤੇ ਆਸਾਨ ਹੈ। ਮਾਈਕ੍ਰੋਸਾੱਫਟ ਐਕਸਲ ਸਪ੍ਰੈਡਸ਼ੀਟ ਸੌਫਟਵੇਅਰ ਸ਼ਾਇਦ ਪਹਿਲਾਂ ਹੀ ਵਪਾਰਕ ਉਪਭੋਗਤਾ ਦੇ ਕੰਪਿਊਟਰ 'ਤੇ ਸਥਾਪਤ ਹੈ। ਅਤੇ ਅੱਜ ਬਹੁਤ ਸਾਰੇ ਉਪਭੋਗਤਾ ਹਾਈ ਸਕੂਲ ਜਾਂ ਇਸ ਤੋਂ ਵੀ ਪਹਿਲਾਂ ਤੋਂ Microsoft Office ਸੌਫਟਵੇਅਰ ਦੇ ਸੰਪਰਕ ਵਿੱਚ ਆਏ ਹਨ। ਇਹ ਗੋਡੇ-ਝਟਕੇ ਵਾਲੇ ਜਵਾਬ ਵਜੋਂ ...

ਹੋਰ ਪੜ੍ਹੋ

BI/ਵਿਸ਼ਲੇਸ਼ਣਇਤਾਹਾਸ
ਆਪਣੀ ਇਨਸਾਈਟਸ ਨੂੰ ਅਨਕਲਟਰ ਕਰੋ: ਵਿਸ਼ਲੇਸ਼ਣ ਸਪਰਿੰਗ ਕਲੀਨਿੰਗ ਲਈ ਇੱਕ ਗਾਈਡ

ਆਪਣੀ ਇਨਸਾਈਟਸ ਨੂੰ ਅਨਕਲਟਰ ਕਰੋ: ਵਿਸ਼ਲੇਸ਼ਣ ਸਪਰਿੰਗ ਕਲੀਨਿੰਗ ਲਈ ਇੱਕ ਗਾਈਡ

ਆਪਣੀ ਇਨਸਾਈਟਸ ਨੂੰ ਅਨਕਲਟਰ ਕਰੋ ਵਿਸ਼ਲੇਸ਼ਣ ਸਪਰਿੰਗ ਕਲੀਨਿੰਗ ਲਈ ਇੱਕ ਗਾਈਡ ਨਵਾਂ ਸਾਲ ਇੱਕ ਧਮਾਕੇ ਨਾਲ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ; ਸਾਲ-ਅੰਤ ਦੀਆਂ ਰਿਪੋਰਟਾਂ ਬਣਾਈਆਂ ਜਾਂਦੀਆਂ ਹਨ ਅਤੇ ਉਹਨਾਂ ਦੀ ਜਾਂਚ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਅਤੇ ਫਿਰ ਹਰ ਕੋਈ ਇਕਸਾਰ ਕੰਮ ਦੇ ਅਨੁਸੂਚੀ ਵਿੱਚ ਸੈਟਲ ਹੋ ਜਾਂਦਾ ਹੈ। ਜਿਵੇਂ-ਜਿਵੇਂ ਦਿਨ ਲੰਬੇ ਹੁੰਦੇ ਜਾਂਦੇ ਹਨ ਅਤੇ ਰੁੱਖ ਅਤੇ ਫੁੱਲ ਖਿੜਦੇ ਜਾਂਦੇ ਹਨ,...

ਹੋਰ ਪੜ੍ਹੋ

BI/ਵਿਸ਼ਲੇਸ਼ਣਇਤਾਹਾਸ
NY ਸਟਾਈਲ ਬਨਾਮ ਸ਼ਿਕਾਗੋ ਸਟਾਈਲ ਪੀਜ਼ਾ: ਇੱਕ ਸੁਆਦੀ ਬਹਿਸ

NY ਸਟਾਈਲ ਬਨਾਮ ਸ਼ਿਕਾਗੋ ਸਟਾਈਲ ਪੀਜ਼ਾ: ਇੱਕ ਸੁਆਦੀ ਬਹਿਸ

ਸਾਡੀਆਂ ਲਾਲਸਾਵਾਂ ਨੂੰ ਸੰਤੁਸ਼ਟ ਕਰਦੇ ਸਮੇਂ, ਕੁਝ ਚੀਜ਼ਾਂ ਪੀਜ਼ਾ ਦੇ ਗਰਮ ਟੁਕੜੇ ਦੀ ਖੁਸ਼ੀ ਦਾ ਮੁਕਾਬਲਾ ਕਰ ਸਕਦੀਆਂ ਹਨ। ਨਿਊਯਾਰਕ-ਸ਼ੈਲੀ ਅਤੇ ਸ਼ਿਕਾਗੋ-ਸ਼ੈਲੀ ਦੇ ਪੀਜ਼ਾ ਵਿਚਕਾਰ ਬਹਿਸ ਨੇ ਦਹਾਕਿਆਂ ਤੋਂ ਭਾਵੁਕ ਚਰਚਾ ਛੇੜ ਦਿੱਤੀ ਹੈ। ਹਰ ਸ਼ੈਲੀ ਦੀਆਂ ਆਪਣੀਆਂ ਵਿਲੱਖਣ ਵਿਸ਼ੇਸ਼ਤਾਵਾਂ ਅਤੇ ਸਮਰਪਿਤ ਪ੍ਰਸ਼ੰਸਕ ਹੁੰਦੇ ਹਨ ....

ਹੋਰ ਪੜ੍ਹੋ

BI/ਵਿਸ਼ਲੇਸ਼ਣਕੋਗਨੋਸ ਵਿਸ਼ਲੇਸ਼ਣ
ਕੋਗਨੋਸ ਕਿਊਰੀ ਸਟੂਡੀਓ
ਤੁਹਾਡੇ ਉਪਭੋਗਤਾ ਉਹਨਾਂ ਦੀ ਪੁੱਛਗਿੱਛ ਸਟੂਡੀਓ ਚਾਹੁੰਦੇ ਹਨ

ਤੁਹਾਡੇ ਉਪਭੋਗਤਾ ਉਹਨਾਂ ਦੀ ਪੁੱਛਗਿੱਛ ਸਟੂਡੀਓ ਚਾਹੁੰਦੇ ਹਨ

IBM Cognos Analytics 12 ਦੇ ਜਾਰੀ ਹੋਣ ਦੇ ਨਾਲ, Query Studio ਅਤੇ Analysis Studio ਦੇ ਲੰਬੇ ਸਮੇਂ ਤੋਂ ਐਲਾਨੇ ਬਰਤਰਫ਼ ਨੂੰ ਅੰਤ ਵਿੱਚ ਉਹਨਾਂ ਸਟੂਡੀਓ ਨੂੰ ਘਟਾ ਕੇ Cognos Analytics ਦੇ ਇੱਕ ਸੰਸਕਰਣ ਦੇ ਨਾਲ ਪ੍ਰਦਾਨ ਕੀਤਾ ਗਿਆ ਸੀ। ਹਾਲਾਂਕਿ ਇਸ ਵਿੱਚ ਲੱਗੇ ਜ਼ਿਆਦਾਤਰ ਲੋਕਾਂ ਲਈ ਇਹ ਹੈਰਾਨੀ ਦੀ ਗੱਲ ਨਹੀਂ ਹੋਣੀ ਚਾਹੀਦੀ ...

ਹੋਰ ਪੜ੍ਹੋ

BI/ਵਿਸ਼ਲੇਸ਼ਣਇਤਾਹਾਸ
ਕੀ ਟੇਲਰ ਸਵਿਫਟ ਪ੍ਰਭਾਵ ਅਸਲੀ ਹੈ?

ਕੀ ਟੇਲਰ ਸਵਿਫਟ ਪ੍ਰਭਾਵ ਅਸਲੀ ਹੈ?

ਕੁਝ ਆਲੋਚਕ ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ ਕਿ ਉਹ ਸੁਪਰ ਬਾਊਲ ਟਿਕਟ ਦੀਆਂ ਕੀਮਤਾਂ ਵਧਾ ਰਹੀ ਹੈ ਇਸ ਹਫਤੇ ਦੇ ਸੁਪਰ ਬਾਊਲ ਦੇ ਟੈਲੀਵਿਜ਼ਨ ਇਤਿਹਾਸ ਵਿੱਚ ਚੋਟੀ ਦੇ 3 ਸਭ ਤੋਂ ਵੱਧ ਦੇਖੇ ਜਾਣ ਵਾਲੇ ਸਮਾਗਮਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੋਣ ਦੀ ਉਮੀਦ ਹੈ। ਸ਼ਾਇਦ ਪਿਛਲੇ ਸਾਲ ਦੇ ਰਿਕਾਰਡ-ਸੈਟਿੰਗ ਨੰਬਰਾਂ ਨਾਲੋਂ ਵੱਧ ਅਤੇ ਸ਼ਾਇਦ 1969 ਦੇ ਚੰਦਰਮਾ ਤੋਂ ਵੀ ਵੱਧ...

ਹੋਰ ਪੜ੍ਹੋ

BI/ਵਿਸ਼ਲੇਸ਼ਣ
ਵਿਸ਼ਲੇਸ਼ਣ ਕੈਟਾਲਾਗ - ਵਿਸ਼ਲੇਸ਼ਣ ਈਕੋਸਿਸਟਮ ਵਿੱਚ ਇੱਕ ਉਭਰਦਾ ਤਾਰਾ

ਵਿਸ਼ਲੇਸ਼ਣ ਕੈਟਾਲਾਗ - ਵਿਸ਼ਲੇਸ਼ਣ ਈਕੋਸਿਸਟਮ ਵਿੱਚ ਇੱਕ ਉਭਰਦਾ ਤਾਰਾ

ਜਾਣ-ਪਛਾਣ ਇੱਕ ਚੀਫ ਟੈਕਨਾਲੋਜੀ ਅਫਸਰ (ਸੀਟੀਓ) ਦੇ ਤੌਰ 'ਤੇ, ਮੈਂ ਹਮੇਸ਼ਾ ਉਭਰਦੀਆਂ ਤਕਨੀਕਾਂ ਦੀ ਭਾਲ ਵਿੱਚ ਰਹਿੰਦਾ ਹਾਂ ਜੋ ਸਾਡੇ ਵਿਸ਼ਲੇਸ਼ਣ ਤੱਕ ਪਹੁੰਚਣ ਦੇ ਤਰੀਕੇ ਨੂੰ ਬਦਲਦੀਆਂ ਹਨ। ਇੱਕ ਅਜਿਹੀ ਤਕਨਾਲੋਜੀ ਜਿਸਨੇ ਪਿਛਲੇ ਕੁਝ ਸਾਲਾਂ ਵਿੱਚ ਮੇਰਾ ਧਿਆਨ ਖਿੱਚਿਆ ਹੈ ਅਤੇ ਬਹੁਤ ਵੱਡਾ ਵਾਅਦਾ ਰੱਖਦਾ ਹੈ ਉਹ ਹੈ ਵਿਸ਼ਲੇਸ਼ਣ...

ਹੋਰ ਪੜ੍ਹੋ