ਵਿਸ਼ਲੇਸ਼ਣ ਝੂਠ
ਵਿਸ਼ਲੇਸ਼ਣ ਦਾ ਪੱਖਪਾਤ
ਮਾਰਕ ਟਵੇਨ ਨੇ ਬਹਿਸਬਾਜ਼ੀ ਨਾਲ ਕੁਝ ਅਜਿਹਾ ਕਿਹਾ, "ਇੱਥੇ ਤਿੰਨ ਕਿਸਮ ਦੇ ਝੂਠ ਹਨ: ਝੂਠ, ਬਦਨਾਮ ਝੂਠ ਅਤੇ ਵਿਸ਼ਲੇਸ਼ਣ. "
ਅਸੀਂ ਇਹ ਮੰਨਦੇ ਹਾਂ ਕਿ ਵਿਸ਼ਲੇਸ਼ਣ ਸਾਨੂੰ ਉਪਯੋਗੀ, ਕਾਰਵਾਈਯੋਗ ਸੂਝ ਪ੍ਰਦਾਨ ਕਰਦਾ ਹੈ। ਸਾਨੂੰ ਅਕਸਰ ਇਹ ਅਹਿਸਾਸ ਨਹੀਂ ਹੁੰਦਾ ਕਿ ਸਾਡੇ ਆਪਣੇ ਅਤੇ ਦੂਜਿਆਂ ਦੇ ਪੱਖਪਾਤ ਉਹਨਾਂ ਜਵਾਬਾਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦੇ ਹਨ ਜੋ ਅਸੀਂ ਸਭ ਤੋਂ ਵਧੀਆ ਸੌਫਟਵੇਅਰ ਅਤੇ ਪ੍ਰਣਾਲੀਆਂ ਦੁਆਰਾ ਦਿੱਤੇ ਜਾਂਦੇ ਹਾਂ। ਕਦੇ-ਕਦੇ, ਸਾਡੇ ਨਾਲ ਬੇਈਮਾਨੀ ਨਾਲ ਹੇਰਾਫੇਰੀ ਕੀਤੀ ਜਾ ਸਕਦੀ ਹੈ, ਪਰ, ਆਮ ਤੌਰ 'ਤੇ, ਇਹ ਸੂਖਮ ਅਤੇ ਅਚੇਤ ਪੱਖਪਾਤ ਹੋ ਸਕਦੇ ਹਨ ਜੋ ਸਾਡੇ ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਘੁਸ ਜਾਂਦੇ ਹਨ। ਪੱਖਪਾਤੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੇ ਪਿੱਛੇ ਪ੍ਰੇਰਣਾ ਕਈ ਗੁਣਾ ਹੈ। ਕਈ ਵਾਰ ਅਸੀਂ ਵਿਗਿਆਨ ਤੋਂ ਨਿਰਪੱਖ ਨਤੀਜਿਆਂ ਦੀ ਉਮੀਦ ਕਰਦੇ ਹਾਂ 1) ਡੇਟਾ ਨੂੰ ਕਿਵੇਂ ਪੇਸ਼ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਇਸ ਵਿੱਚ ਸੂਖਮ ਵਿਕਲਪ, 2) ਅਸੰਗਤ ਜਾਂ ਗੈਰ-ਪ੍ਰਤੀਨਿਧੀ ਡੇਟਾ, 3) AI ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਕਿਵੇਂ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ, 4) ਖੋਜਕਰਤਾਵਾਂ ਦੀ ਅਗਿਆਨਤਾ, ਅਯੋਗਤਾ ਜਾਂ ਹੋਰ ਕੋਸ਼ਿਸ਼ ਕਰ ਰਹੇ ਹਨ ਕਹਾਣੀ ਦੱਸਣ ਲਈ, 5) ਵਿਸ਼ਲੇਸ਼ਣ ਖੁਦ।
ਪੇਸ਼ਕਾਰੀ ਪੱਖਪਾਤੀ ਹੈ
ਕੁਝ ਝੂਠਾਂ ਨੂੰ ਦੂਜਿਆਂ ਨਾਲੋਂ ਲੱਭਣਾ ਆਸਾਨ ਹੁੰਦਾ ਹੈ। ਜਦੋਂ ਤੁਸੀਂ ਜਾਣਦੇ ਹੋ ਕਿ ਕੀ ਲੱਭਣਾ ਹੈ ਤਾਂ ਤੁਸੀਂ ਵਧੇਰੇ ਆਸਾਨੀ ਨਾਲ ਸੰਭਾਵੀ ਤੌਰ 'ਤੇ ਖੋਜ ਕਰ ਸਕਦੇ ਹੋ ਗੁੰਮਰਾਹਕੁੰਨ ਗ੍ਰਾਫ ਅਤੇ ਚਾਰਟ.
ਉਥੇ ਘੱਟੋ ਘੱਟ ਹਨ ਗੁੰਮਰਾਹਕੁੰਨ ਢੰਗ ਨਾਲ ਡੇਟਾ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨ ਦੇ ਪੰਜ ਤਰੀਕੇ: 1) ਇੱਕ ਸੀਮਤ ਡੇਟਾ ਸੈੱਟ ਦਿਖਾਓ, 2). ਗੈਰ-ਸੰਬੰਧਿਤ ਸਬੰਧ ਦਿਖਾਓ, 3) ਡੇਟਾ ਨੂੰ ਗਲਤ ਦਿਖਾਓ, 4) ਗੈਰ-ਰਵਾਇਤੀ ਤੌਰ 'ਤੇ ਡੇਟਾ ਦਿਖਾਓ, ਜਾਂ 5)। ਜ਼ਿਆਦਾ ਸਰਲ ਡਾਟਾ ਦਿਖਾਓ।
ਇੱਕ ਸੀਮਤ ਡਾਟਾ ਸੈੱਟ ਦਿਖਾਓ
ਡੇਟਾ ਨੂੰ ਸੀਮਿਤ ਕਰਨਾ, ਜਾਂ ਡੇਟਾ ਦੇ ਇੱਕ ਗੈਰ-ਬੇਤਰਤੀਬ ਭਾਗ ਦੀ ਚੋਣ ਕਰਨਾ ਅਕਸਰ ਇੱਕ ਕਹਾਣੀ ਦੱਸ ਸਕਦਾ ਹੈ ਜੋ ਵੱਡੀ ਤਸਵੀਰ ਦੇ ਨਾਲ ਇਕਸਾਰ ਨਹੀਂ ਹੈ। ਖਰਾਬ ਨਮੂਨਾ, ਜਾਂ ਚੈਰੀ ਚੁੱਕਣਾ, ਉਦੋਂ ਹੁੰਦਾ ਹੈ ਜਦੋਂ ਵਿਸ਼ਲੇਸ਼ਕ ਇੱਕ ਵੱਡੇ ਸਮੂਹ ਨੂੰ ਦਰਸਾਉਣ ਲਈ ਗੈਰ-ਪ੍ਰਤੀਨਿਧੀ ਨਮੂਨੇ ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ।
ਮਾਰਚ 2020 ਵਿੱਚ, ਜਾਰਜੀਆ ਦੇ ਪਬਲਿਕ ਹੈਲਥ ਵਿਭਾਗ ਇਸ ਚਾਰਟ ਨੂੰ ਆਪਣੀ ਰੋਜ਼ਾਨਾ ਸਥਿਤੀ ਰਿਪੋਰਟ ਦੇ ਹਿੱਸੇ ਵਜੋਂ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ। ਇਹ ਅਸਲ ਵਿੱਚ ਇਸਦੇ ਜਵਾਬਾਂ ਨਾਲੋਂ ਵੱਧ ਸਵਾਲ ਉਠਾਉਂਦਾ ਹੈ।
ਇੱਕ ਚੀਜ਼ ਜੋ ਗੁੰਮ ਹੈ ਉਹ ਪ੍ਰਸੰਗ ਹੈ। ਉਦਾਹਰਨ ਲਈ, ਇਹ ਜਾਣਨਾ ਮਦਦਗਾਰ ਹੋਵੇਗਾ ਕਿ ਹਰੇਕ ਉਮਰ ਸਮੂਹ ਲਈ ਆਬਾਦੀ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਕਿੰਨੀ ਹੈ। ਸਧਾਰਨ ਦਿੱਖ ਵਾਲੇ ਪਾਈ ਚਾਰਟ ਦੇ ਨਾਲ ਇੱਕ ਹੋਰ ਮੁੱਦਾ ਅਸਮਾਨ ਉਮਰ ਸਮੂਹ ਹੈ। 0-17 ਵਿੱਚ 18 ਸਾਲ ਹਨ, 18-59 ਵਿੱਚ 42, 60+ ਓਪਨ-ਐਂਡ ਹੈ, ਪਰ ਲਗਭਗ 40 ਸਾਲ ਹਨ। ਇਕੱਲੇ ਇਸ ਚਾਰਟ ਤੋਂ ਸਿੱਟਾ ਇਹ ਨਿਕਲਦਾ ਹੈ ਕਿ ਜ਼ਿਆਦਾਤਰ ਕੇਸ 18-59 ਸਾਲ ਦੀ ਉਮਰ ਦੇ ਹਨ। 60+ ਸਾਲ ਦੀ ਉਮਰ ਵਰਗ ਕੋਵਿਡ ਦੇ ਕੇਸਾਂ ਤੋਂ ਘੱਟ ਪ੍ਰਭਾਵਿਤ ਹੋਇਆ ਜਾਪਦਾ ਹੈ। ਪਰ ਇਹ ਸਾਰੀ ਕਹਾਣੀ ਨਹੀਂ ਹੈ।
ਤੁਲਨਾ ਲਈ, 'ਤੇ ਇਹ ਵੱਖਰਾ ਡਾਟਾ ਸੈੱਟ ਕੀਤਾ ਗਿਆ ਹੈ ਸੀਡੀਸੀ ਵੈੱਬ ਸਾਈਟ ਯੂਐਸ ਆਬਾਦੀ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ 'ਤੇ ਵਾਧੂ ਡੇਟਾ ਦੇ ਨਾਲ ਉਮਰ ਸਮੂਹ ਦੁਆਰਾ COVID ਕੇਸਾਂ ਨੂੰ ਚਾਰਟ ਕਰਦਾ ਹੈ ਜੋ ਹਰੇਕ ਉਮਰ ਸੀਮਾ ਵਿੱਚ ਹੈ।
ਇਹ ਬਿਹਤਰ ਹੈ। ਸਾਡੇ ਕੋਲ ਹੋਰ ਪ੍ਰਸੰਗ ਹੈ। ਅਸੀਂ ਦੇਖ ਸਕਦੇ ਹਾਂ ਕਿ 18-29, 30-39, 40-49 ਉਮਰ ਸਮੂਹਾਂ ਵਿੱਚ ਆਬਾਦੀ ਵਿੱਚ ਉਮਰ ਸਮੂਹ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਨਾਲੋਂ ਕੇਸਾਂ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਵੱਧ ਹੈ। ਅਜੇ ਵੀ ਕੁਝ ਅਸਮਾਨ ਉਮਰ ਸਮੂਹ ਹਨ। 16-17 ਇੱਕ ਵੱਖਰਾ ਉਮਰ ਸਮੂਹ ਕਿਉਂ ਹੈ? ਫਿਰ ਵੀ ਇਹ ਸਾਰੀ ਕਹਾਣੀ ਨਹੀਂ ਹੈ, ਪਰ ਪੰਡਤਾਂ ਨੇ ਇਸ ਤੋਂ ਘੱਟ ਬਾਰੇ ਕਾਲਮ ਲਿਖੇ ਹਨ, ਭਵਿੱਖਬਾਣੀਆਂ ਕੀਤੀਆਂ ਹਨ ਅਤੇ ਆਦੇਸ਼ ਦਿੱਤੇ ਹਨ। ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ, ਕੋਵਿਡ ਦੇ ਨਾਲ, ਉਮਰ ਦੇ ਨਾਲ-ਨਾਲ ਬਹੁਤ ਸਾਰੇ ਵੇਰੀਏਬਲ ਹਨ ਜੋ ਸਕਾਰਾਤਮਕ ਕੇਸ ਵਜੋਂ ਗਿਣੇ ਜਾਣ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰਦੇ ਹਨ: ਟੀਕਾਕਰਨ ਸਥਿਤੀ, ਟੈਸਟਾਂ ਦੀ ਉਪਲਬਧਤਾ, ਟੈਸਟ ਕੀਤੇ ਜਾਣ ਦੀ ਗਿਣਤੀ, ਸਹਿਜਤਾ, ਅਤੇ ਹੋਰ ਬਹੁਤ ਸਾਰੇ। ਕੇਸਾਂ ਦੀ ਗਿਣਤੀ, ਆਪਣੇ ਆਪ ਵਿੱਚ, ਇੱਕ ਅਧੂਰੀ ਤਸਵੀਰ ਪ੍ਰਦਾਨ ਕਰਦੀ ਹੈ. ਬਹੁਤੇ ਮਾਹਰ ਮੌਤਾਂ ਦੀ ਸੰਖਿਆ, ਜਾਂ ਪ੍ਰਤੀ 100,000 ਆਬਾਦੀ ਦੀ ਮੌਤ ਦੀ ਪ੍ਰਤੀਸ਼ਤਤਾ, ਜਾਂ ਕੇਸ-ਮੌਤ ਨੂੰ ਇਹ ਵੇਖਣ ਲਈ ਵੀ ਦੇਖਦੇ ਹਨ ਕਿ ਕੋਵਿਡ ਹਰੇਕ ਉਮਰ ਸਮੂਹ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦਾ ਹੈ।
ਗੈਰ-ਸੰਬੰਧਿਤ ਸਬੰਧ ਦਿਖਾਓ
ਸਪੱਸ਼ਟ ਹੈ ਕਿ, ਏ ਮਜ਼ਬੂਤ ਸਬੰਧ ਵਿਗਿਆਨ, ਪੁਲਾੜ ਅਤੇ ਤਕਨਾਲੋਜੀ 'ਤੇ ਅਮਰੀਕਾ ਦੇ ਖਰਚੇ ਅਤੇ ਫਾਂਸੀ, ਗਲਾ ਘੁੱਟਣ ਅਤੇ ਦਮ ਘੁੱਟ ਕੇ ਖੁਦਕੁਸ਼ੀਆਂ ਦੀ ਗਿਣਤੀ ਦੇ ਵਿਚਕਾਰ। ਸਬੰਧ 99.79% ਹੈ, ਲਗਭਗ ਇੱਕ ਸੰਪੂਰਨ ਮੈਚ।
ਹਾਲਾਂਕਿ, ਕੌਣ ਇਹ ਕੇਸ ਬਣਾਵੇਗਾ ਕਿ ਇਹ ਕਿਸੇ ਤਰ੍ਹਾਂ ਨਾਲ ਸਬੰਧਤ ਹਨ, ਜਾਂ ਇੱਕ ਦੂਜੇ ਦਾ ਕਾਰਨ ਬਣਦਾ ਹੈ? ਹੋਰ ਵੀ ਘੱਟ ਅਤਿ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਹਨ, ਪਰ ਕੋਈ ਘੱਟ ਜਾਅਲੀ ਨਹੀਂ ਹਨ। ਸਕ੍ਰਿਪਸ ਨੈਸ਼ਨਲ ਸਪੈਲਿੰਗ ਬੀ ਦੇ ਵਿਨਿੰਗ ਵਰਡ ਅਤੇ ਵੇਨੋਮਸ ਸਪਾਈਡਰਸ ਦੁਆਰਾ ਮਾਰੇ ਗਏ ਲੋਕਾਂ ਦੀ ਸੰਖਿਆ ਵਿੱਚ ਅੱਖਰਾਂ ਵਿੱਚ ਇੱਕ ਸਮਾਨ ਮਜ਼ਬੂਤ ਸਬੰਧ ਹੈ। ਇਤਫ਼ਾਕ? ਤੁਸੀਂ ਫੈਸਲਾ ਕਰੋ.
ਇਸ ਡੇਟਾ ਨੂੰ ਚਾਰਟ ਕਰਨ ਦਾ ਇੱਕ ਹੋਰ ਤਰੀਕਾ ਜੋ ਘੱਟ ਗੁੰਮਰਾਹਕੁੰਨ ਹੋ ਸਕਦਾ ਹੈ, ਦੋਵੇਂ Y-ਧੁਰਿਆਂ 'ਤੇ ਜ਼ੀਰੋ ਸ਼ਾਮਲ ਕਰਨਾ ਹੋਵੇਗਾ।
ਡਾਟਾ ਗਲਤ ਦਿਖਾਓ
ਤੋਂ ਡੇਟਾ ਨੂੰ ਬੁਰੀ ਤਰ੍ਹਾਂ ਕਿਵੇਂ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਨਾ ਹੈ, ਅਮਰੀਕਾ ਦੇ ਜਾਰਜੀਆ ਰਾਜ ਨੇ ਪੁਸ਼ਟੀ ਕੀਤੀ COVID-5 ਕੇਸਾਂ ਦੀ ਸਭ ਤੋਂ ਵੱਡੀ ਸੰਖਿਆ ਦੇ ਨਾਲ ਚੋਟੀ ਦੀਆਂ 19 ਕਾਉਂਟੀਆਂ ਪੇਸ਼ ਕੀਤੀਆਂ।
ਜਾਇਜ਼ ਲੱਗਦਾ ਹੈ, ਠੀਕ ਹੈ? ਕੋਵਿਡ-19 ਦੇ ਪੁਸ਼ਟੀ ਕੀਤੇ ਕੇਸਾਂ ਦਾ ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ ਹੇਠਾਂ ਵੱਲ ਰੁਝਾਨ ਹੈ। ਕੀ ਤੁਸੀਂ ਐਕਸ-ਐਕਸਿਸ ਨੂੰ ਪੜ੍ਹ ਸਕਦੇ ਹੋ? X-ਧੁਰਾ ਸਮੇਂ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ। ਆਮ ਤੌਰ 'ਤੇ, ਤਾਰੀਖਾਂ ਖੱਬੇ ਤੋਂ ਸੱਜੇ ਵਧਣਗੀਆਂ। ਇੱਥੇ, ਅਸੀਂ X-ਧੁਰੇ 'ਤੇ ਥੋੜਾ ਜਿਹਾ ਸਮਾਂ ਯਾਤਰਾ ਦੇਖਦੇ ਹਾਂ:
4/28/2020
4/27/2020
4/29/2020
5/1/2020
4/30/2020
5/4/2020
5/6/2020
5/5/2020
5/2/22020 ...
ਉਡੀਕ ਕਰੋ? ਕੀ? X-ਧੁਰੇ ਨੂੰ ਕਾਲਕ੍ਰਮ ਅਨੁਸਾਰ ਕ੍ਰਮਬੱਧ ਨਹੀਂ ਕੀਤਾ ਗਿਆ ਹੈ। ਇਸ ਲਈ, ਰੁਝਾਨ ਜਿੰਨਾ ਵਧੀਆ ਲੱਗ ਸਕਦਾ ਹੈ, ਅਸੀਂ ਕੋਈ ਸਿੱਟਾ ਨਹੀਂ ਕੱਢ ਸਕਦੇ। ਜੇਕਰ ਤਾਰੀਖਾਂ ਦਾ ਆਦੇਸ਼ ਦਿੱਤਾ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਕੇਸਾਂ ਦੀ ਗਿਣਤੀ ਲਈ ਬਾਰ ਕਿਸੇ ਵੀ ਕਿਸਮ ਦੇ ਰੁਝਾਨ ਨਾਲੋਂ ਆਰਾ-ਟੂਥ ਪੈਟਰਨ ਨੂੰ ਜ਼ਿਆਦਾ ਦਿਖਾਉਂਦਾ ਹੈ।
ਇੱਥੇ ਆਸਾਨ ਫਿਕਸ ਤਰੀਕਾਂ ਨੂੰ ਕੈਲੰਡਰ ਦੇ ਤਰੀਕੇ ਨਾਲ ਕ੍ਰਮਬੱਧ ਕਰਨਾ ਹੈ।
ਗੈਰ-ਰਵਾਇਤੀ ਤੌਰ 'ਤੇ ਡਾਟਾ ਦਿਖਾਓ
ਅਸੀਂ ਸਾਰੇ ਰੁੱਝੇ ਹੋਏ ਹਾਂ। ਸਾਡੇ ਦਿਮਾਗਾਂ ਨੇ ਸਾਨੂੰ ਉਨ੍ਹਾਂ ਧਾਰਨਾਵਾਂ ਦੇ ਆਧਾਰ 'ਤੇ ਜਲਦੀ ਨਿਰਣਾ ਕਰਨਾ ਸਿਖਾਇਆ ਹੈ ਜੋ ਸਾਡੀ ਦੁਨੀਆ ਵਿਚ ਇਕਸਾਰ ਹਨ। ਉਦਾਹਰਨ ਲਈ, ਹਰ ਗ੍ਰਾਫ਼ ਜੋ ਮੈਂ ਕਦੇ ਦੇਖਿਆ ਹੈ, x- ਅਤੇ y- ਅਕਸ਼ਾਂ ਨੂੰ ਜ਼ੀਰੋ, ਜਾਂ ਸਭ ਤੋਂ ਘੱਟ ਮੁੱਲਾਂ 'ਤੇ ਮਿਲਦੇ ਹੋਏ ਦਿਖਾਉਂਦਾ ਹੈ। ਇਸ ਚਾਰਟ ਨੂੰ ਸੰਖੇਪ ਵਿੱਚ ਦੇਖਦੇ ਹੋਏ, ਤੁਸੀਂ ਫਲੋਰੀਡਾ ਦੇ ਪ੍ਰਭਾਵ ਬਾਰੇ ਕੀ ਸਿੱਟਾ ਕੱਢ ਸਕਦੇ ਹੋ “ਆਪਣੇ ਜ਼ਮੀਨੀ ਕਾਨੂੰਨ ਨੂੰ ਕਾਇਮ ਰੱਖੋ।"? ਮੈਂ ਇਸਨੂੰ ਸਵੀਕਾਰ ਕਰਨ ਵਿੱਚ ਸ਼ਰਮ ਮਹਿਸੂਸ ਕਰਦਾ ਹਾਂ, ਪਰ ਇਸ ਗ੍ਰਾਫ ਨੇ ਮੈਨੂੰ ਪਹਿਲਾਂ ਮੂਰਖ ਬਣਾਇਆ. ਤੁਹਾਡੀ ਅੱਖ ਆਸਾਨੀ ਨਾਲ ਗ੍ਰਾਫਿਕ ਦੇ ਮੱਧ ਵਿੱਚ ਟੈਕਸਟ ਅਤੇ ਤੀਰ ਵੱਲ ਖਿੱਚੀ ਜਾਂਦੀ ਹੈ। ਇਸ ਗ੍ਰਾਫ ਵਿੱਚ ਹੇਠਾਂ ਉੱਪਰ ਹੈ। ਇਹ ਝੂਠ ਨਹੀਂ ਹੋ ਸਕਦਾ - ਡੇਟਾ ਉੱਥੇ ਸਭ ਕੁਝ ਠੀਕ ਹੈ। ਪਰ, ਮੈਨੂੰ ਇਹ ਸੋਚਣਾ ਪਏਗਾ ਕਿ ਇਹ ਧੋਖਾ ਦੇਣ ਲਈ ਹੈ. ਜੇਕਰ ਤੁਸੀਂ ਇਸਨੂੰ ਅਜੇ ਤੱਕ ਨਹੀਂ ਦੇਖਿਆ ਹੈ, ਤਾਂ y-ਧੁਰੇ 'ਤੇ ਜ਼ੀਰੋ ਸਿਖਰ 'ਤੇ ਹੈ। ਇਸ ਲਈ, ਜਿਵੇਂ ਕਿ ਡੇਟਾ ਦਾ ਰੁਝਾਨ ਘਟਦਾ ਹੈ, ਇਸਦਾ ਅਰਥ ਹੈ ਹੋਰ ਮੌਤਾਂ. ਇਹ ਚਾਰਟ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਹਥਿਆਰਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਕਤਲਾਂ ਦੀ ਗਿਣਤੀ ਵਾਧਾ ਹੋਇਆ 2005 ਤੋਂ ਬਾਅਦ, ਚੱਲ ਰਹੇ ਰੁਝਾਨ ਦੁਆਰਾ ਦਰਸਾਏ ਗਏ ਥੱਲੇ.
ਡਾਟਾ ਓਵਰ-ਸਰਲੀਕ੍ਰਿਤ ਦਿਖਾਓ
ਡੇਟਾ ਦੇ ਓਵਰ-ਸਰਲੀਕਰਨ ਦੀ ਇੱਕ ਉਦਾਹਰਣ ਦੇਖੀ ਜਾ ਸਕਦੀ ਹੈ ਜਦੋਂ ਵਿਸ਼ਲੇਸ਼ਕ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ ਦਾ ਫਾਇਦਾ ਉਠਾਉਂਦੇ ਹਨ। ਇਹ ਇੱਕ ਅਜਿਹਾ ਵਰਤਾਰਾ ਹੈ ਜੋ ਉਦੋਂ ਵਾਪਰਦਾ ਹੈ ਜਦੋਂ ਸਮੁੱਚਾ ਡੇਟਾ ਸਬਸੈਟਾਂ ਵਿੱਚ ਵੱਖ ਕੀਤੇ ਜਾਣ ਨਾਲੋਂ ਇੱਕ ਵੱਖਰੇ ਸਿੱਟੇ ਨੂੰ ਪ੍ਰਦਰਸ਼ਿਤ ਕਰਦਾ ਹੈ। ਉੱਚ-ਪੱਧਰੀ ਸਮੁੱਚੀ ਪ੍ਰਤੀਸ਼ਤਤਾ ਨੂੰ ਦੇਖਦੇ ਹੋਏ ਇਸ ਜਾਲ ਵਿੱਚ ਫਸਣਾ ਆਸਾਨ ਹੈ। ਕੰਮ 'ਤੇ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ ਦੇ ਸਪੱਸ਼ਟ ਦ੍ਰਿਸ਼ਟਾਂਤ ਵਿੱਚੋਂ ਇੱਕ ਨਾਲ ਸਬੰਧਤ ਹੈ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ.
ਇੱਥੇ ਅਸੀਂ ਦੇਖਦੇ ਹਾਂ ਕਿ ਡੇਰੇਕ ਜੇਟਰ ਦੀ 1995 ਅਤੇ 1996 ਸੀਜ਼ਨਾਂ ਲਈ ਡੇਵਿਡ ਜਸਟਿਸ ਨਾਲੋਂ ਉੱਚੀ ਓਵਰਆਲ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ ਹੈ। ਵਿਰੋਧਾਭਾਸ ਉਦੋਂ ਆਉਂਦਾ ਹੈ ਜਦੋਂ ਸਾਨੂੰ ਇਹ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਜਸਟਿਸ ਨੇ ਉਨ੍ਹਾਂ ਦੋਵਾਂ ਸਾਲਾਂ ਦੀ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ ਵਿੱਚ ਜੇਟਰ ਨੂੰ ਸਰਵੋਤਮ ਕੀਤਾ। ਜੇ ਤੁਸੀਂ ਧਿਆਨ ਨਾਲ ਦੇਖਦੇ ਹੋ, ਤਾਂ ਇਹ ਸਮਝ ਵਿੱਚ ਆਉਂਦਾ ਹੈ ਜਦੋਂ ਤੁਹਾਨੂੰ ਇਹ ਅਹਿਸਾਸ ਹੁੰਦਾ ਹੈ ਕਿ ਜੇਟਰ ਕੋਲ 4 ਵਿੱਚ .1996 ਘੱਟ ਔਸਤ ਨਾਲ 007 ਵਿੱਚ ਲਗਭਗ 1996 ਗੁਣਾ ਜ਼ਿਆਦਾ ਐਟ-ਬੈਟਸ (ਭਾਰ) ਸੀ। 10 ਵਿੱਚ 003 ਉੱਚ ਔਸਤ.
ਪੇਸ਼ਕਾਰੀ ਸਿੱਧੀ ਜਾਪਦੀ ਹੈ, ਪਰ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ, ਜਾਣ-ਬੁੱਝ ਕੇ ਜਾਂ ਅਣਜਾਣੇ ਵਿੱਚ, ਗਲਤ ਸਿੱਟੇ ਕੱਢੇ ਹਨ। ਹਾਲ ਹੀ ਵਿੱਚ, ਟੀਕਿਆਂ ਅਤੇ ਕੋਵਿਡ ਮੌਤ ਦਰ ਨਾਲ ਸਬੰਧਤ ਖਬਰਾਂ ਅਤੇ ਸੋਸ਼ਲ ਮੀਡੀਆ ਵਿੱਚ ਸਿਮਪਸਨ ਦੇ ਪੈਰਾਡੌਕਸ ਦੀਆਂ ਉਦਾਹਰਣਾਂ ਸਾਹਮਣੇ ਆਈਆਂ ਹਨ। ਇੱਕ ਚਾਰਟ 10-59 ਸਾਲ ਦੀ ਉਮਰ ਦੇ ਲੋਕਾਂ ਲਈ ਟੀਕਾਕਰਨ ਅਤੇ ਅਣ-ਟੀਕਾਕਰਨ ਦੇ ਵਿਚਕਾਰ ਮੌਤ ਦਰਾਂ ਦੀ ਤੁਲਨਾ ਕਰਨ ਵਾਲਾ ਇੱਕ ਲਾਈਨ ਗ੍ਰਾਫ ਦਿਖਾਉਂਦਾ ਹੈ। ਚਾਰਟ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ ਟੀਕਾਕਰਨ ਨਾ ਕੀਤੇ ਗਏ ਲੋਕਾਂ ਦੀ ਮੌਤ ਦਰ ਲਗਾਤਾਰ ਘੱਟ ਹੁੰਦੀ ਹੈ। ਇੱਥੇ ਕੀ ਹੋ ਰਿਹਾ ਹੈ?
ਇਹ ਮੁੱਦਾ ਉਸੇ ਤਰ੍ਹਾਂ ਦਾ ਹੈ ਜੋ ਅਸੀਂ ਬੱਲੇਬਾਜ਼ੀ ਔਸਤ ਨਾਲ ਦੇਖਦੇ ਹਾਂ। ਇਸ ਕੇਸ ਵਿੱਚ ਹਰ ਉਮਰ ਸਮੂਹ ਦੇ ਵਿਅਕਤੀਆਂ ਦੀ ਸੰਖਿਆ ਹੈ। ਗ੍ਰਾਫ ਉਹਨਾਂ ਸਮੂਹਾਂ ਨੂੰ ਜੋੜਦਾ ਹੈ ਜਿਨ੍ਹਾਂ ਦੇ ਵੱਖ-ਵੱਖ ਨਤੀਜੇ ਹੁੰਦੇ ਹਨ। ਜੇ ਅਸੀਂ ਬਜ਼ੁਰਗ ਉਮਰ ਸਮੂਹ, 50-59, ਨੂੰ ਵੱਖਰੇ ਤੌਰ 'ਤੇ ਦੇਖਦੇ ਹਾਂ, ਤਾਂ ਅਸੀਂ ਦੇਖਦੇ ਹਾਂ ਕਿ ਟੀਕਾਕਰਨ ਦਾ ਕਿਰਾਇਆ ਬਿਹਤਰ ਹੈ। ਇਸੇ ਤਰ੍ਹਾਂ, ਜੇ ਅਸੀਂ 10-49 ਨੂੰ ਵੇਖੀਏ, ਤਾਂ ਅਸੀਂ ਇਹ ਵੀ ਦੇਖਦੇ ਹਾਂ ਕਿ ਟੀਕਾ ਲਗਾਇਆ ਗਿਆ ਕਿਰਾਇਆ ਬਿਹਤਰ ਹੈ. ਵਿਰੋਧਾਭਾਸੀ ਤੌਰ 'ਤੇ, ਜਦੋਂ ਸੰਯੁਕਤ ਸੈੱਟ ਨੂੰ ਦੇਖਦੇ ਹੋਏ, ਅਣਵਿਆਸੀ ਦਾ ਇੱਕ ਬੁਰਾ ਨਤੀਜਾ ਦਿਖਾਈ ਦਿੰਦਾ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ, ਤੁਸੀਂ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਹੋਏ ਉਲਟ ਦਲੀਲਾਂ ਲਈ ਕੇਸ ਬਣਾਉਣ ਦੇ ਯੋਗ ਹੋ.
ਡੇਟਾ ਪੱਖਪਾਤੀ ਹੈ
ਡਾਟਾ ਹਮੇਸ਼ਾ ਭਰੋਸੇਯੋਗ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਇੱਥੋਂ ਤੱਕ ਕਿ ਵਿਗਿਆਨਕ ਭਾਈਚਾਰੇ ਵਿੱਚ, ਇੱਕ ਤਿਹਾਈ ਤੋਂ ਵੱਧ ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਮੰਨਿਆ "ਸੰਦੇਹਯੋਗ ਖੋਜ ਅਭਿਆਸ." ਹੋਰ ਰਿਸਰਚ ਫਰਾਡ ਜਾਸੂਸ ਕਹਿੰਦਾ ਹੈ, "ਡਾਟਾ - ਟੇਬਲ, ਲਾਈਨ ਗ੍ਰਾਫ, ਸੀਕੁਏਂਸਿੰਗ ਡੇਟਾ [- ਜਿੰਨਾ ਅਸੀਂ ਅਸਲ ਵਿੱਚ ਖੋਜ ਰਹੇ ਹਾਂ] ਵਿੱਚ ਬਹੁਤ ਜ਼ਿਆਦਾ ਧੋਖਾਧੜੀ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ। ਆਪਣੀ ਰਸੋਈ ਦੇ ਮੇਜ਼ 'ਤੇ ਬੈਠਾ ਕੋਈ ਵੀ ਵਿਅਕਤੀ ਸਪ੍ਰੈਡਸ਼ੀਟ ਵਿੱਚ ਕੁਝ ਨੰਬਰ ਪਾ ਸਕਦਾ ਹੈ ਅਤੇ ਇੱਕ ਲਾਈਨ ਗ੍ਰਾਫ ਬਣਾ ਸਕਦਾ ਹੈ ਜੋ ਯਕੀਨਨ ਲੱਗਦਾ ਹੈ।
ਇਹ ਪਹਿਲਾ ਉਦਾਹਰਨ ਇੰਝ ਜਾਪਦਾ ਹੈ ਕਿ ਕਿਸੇ ਨੇ ਅਜਿਹਾ ਕੀਤਾ ਹੈ। ਮੈਂ ਇਹ ਨਹੀਂ ਕਹਿ ਰਿਹਾ ਹਾਂ ਕਿ ਇਹ ਧੋਖਾਧੜੀ ਹੈ, ਪਰ ਇੱਕ ਸਰਵੇਖਣ ਦੇ ਤੌਰ 'ਤੇ, ਇਹ ਸਿਰਫ਼ ਕੋਈ ਵੀ ਡੇਟਾ ਤਿਆਰ ਨਹੀਂ ਕਰਦਾ ਹੈ ਜੋ ਇੱਕ ਸੂਚਿਤ ਫੈਸਲੇ ਵਿੱਚ ਯੋਗਦਾਨ ਪਾਉਂਦਾ ਹੈ। ਅਜਿਹਾ ਲਗਦਾ ਹੈ ਕਿ ਸਰਵੇਖਣ ਨੇ ਉੱਤਰਦਾਤਾਵਾਂ ਨੂੰ ਗੈਸ ਸਟੇਸ਼ਨ ਕੌਫੀ, ਜਾਂ ਕਿਸੇ ਹੋਰ ਸੰਬੰਧਿਤ ਮੌਜੂਦਾ ਘਟਨਾ ਬਾਰੇ ਉਹਨਾਂ ਦੀ ਰਾਏ ਬਾਰੇ ਪੁੱਛਿਆ ਹੈ।
- ਸ਼ਾਨਦਾਰ
- ਮਹਾਨ
- ਬਹੁਤ ਅੱਛਾ
ਮੈਂ ਦੋਸ਼ੀ ਧਿਰ ਦੇ ਸੰਦਰਭਾਂ ਨੂੰ ਹਟਾਉਣ ਲਈ ਟਵਿੱਟਰ ਪੋਸਟ ਨੂੰ ਕੱਟਿਆ ਹੈ, ਪਰ ਇਹ ਸਰਵੇਖਣ ਦੇ ਅੰਤਮ ਨਤੀਜਿਆਂ ਦਾ ਅਸਲ ਪੂਰਾ ਚਾਰਟ ਹੈ। ਇਸ ਤਰ੍ਹਾਂ ਦੇ ਸਰਵੇਖਣ ਅਸਧਾਰਨ ਨਹੀਂ ਹਨ। ਸਪੱਸ਼ਟ ਤੌਰ 'ਤੇ, ਜਵਾਬਾਂ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਡੇਟਾ ਤੋਂ ਬਣਾਇਆ ਗਿਆ ਕੋਈ ਵੀ ਚਾਰਟ ਦਰਸਾਏਗਾ ਕਿ ਪ੍ਰਸ਼ਨ ਵਿੱਚ ਕੌਫੀ ਨੂੰ ਖੁੰਝਾਇਆ ਨਹੀਂ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ।
ਸਮੱਸਿਆ ਇਹ ਹੈ ਕਿ ਜੇਕਰ ਤੁਹਾਨੂੰ ਇਹ ਸਰਵੇਖਣ ਦਿੱਤਾ ਗਿਆ ਸੀ ਅਤੇ ਤੁਹਾਡੀ ਸੋਚ ਦੇ ਅਨੁਕੂਲ ਕੋਈ ਜਵਾਬ ਨਹੀਂ ਮਿਲਿਆ, ਤਾਂ ਤੁਸੀਂ ਸਰਵੇਖਣ ਨੂੰ ਛੱਡ ਦਿੰਦੇ। ਇਹ ਇੱਕ ਅਤਿ ਉਦਾਹਰਨ ਹੋ ਸਕਦਾ ਹੈ ਕਿ ਕਿਵੇਂ ਭਰੋਸੇਮੰਦ ਡੇਟਾ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ। ਮਾੜੀ ਸਰਵੇਖਣ ਡਿਜ਼ਾਈਨ, ਹਾਲਾਂਕਿ, ਘੱਟ ਜਵਾਬਾਂ ਦੀ ਅਗਵਾਈ ਕਰ ਸਕਦਾ ਹੈ ਅਤੇ ਜੋ ਜਵਾਬ ਦਿੰਦੇ ਹਨ ਉਹਨਾਂ ਦੀ ਸਿਰਫ ਇੱਕ ਰਾਏ ਹੈ, ਇਹ ਸਿਰਫ ਡਿਗਰੀ ਦੀ ਗੱਲ ਹੈ। ਡੇਟਾ ਪੱਖਪਾਤੀ ਹੈ।
ਡੇਟਾ ਪੱਖਪਾਤ ਦੀ ਇਹ ਦੂਜੀ ਉਦਾਹਰਨ "" ਦੀਆਂ ਫਾਈਲਾਂ ਤੋਂ ਹੈਸਭ ਤੋਂ ਭੈੜੇ ਕੋਵਿਡ 19 ਗੁੰਮਰਾਹਕੁੰਨ ਗ੍ਰਾਫ਼. "
ਦੁਬਾਰਾ ਫਿਰ, ਇਹ ਸੂਖਮ ਹੈ ਅਤੇ ਪੂਰੀ ਤਰ੍ਹਾਂ ਸਪੱਸ਼ਟ ਨਹੀਂ ਹੈ. ਬਾਰ ਗ੍ਰਾਫ ਫਲੋਰੀਡਾ ਵਿੱਚ ਇੱਕ ਕਾਉਂਟੀ ਲਈ ਸਮੇਂ ਦੇ ਨਾਲ ਸਕਾਰਾਤਮਕ COVID-19 ਕੇਸਾਂ ਦੀ ਪ੍ਰਤੀਸ਼ਤ ਵਿੱਚ ਇੱਕ ਨਿਰਵਿਘਨ - ਲਗਭਗ ਬਹੁਤ ਹੀ ਨਿਰਵਿਘਨ - ਗਿਰਾਵਟ ਦਿਖਾਉਂਦਾ ਹੈ। ਤੁਸੀਂ ਆਸਾਨੀ ਨਾਲ ਇਹ ਸਿੱਟਾ ਕੱਢ ਸਕਦੇ ਹੋ ਕਿ ਕੇਸ ਘਟ ਰਹੇ ਹਨ। ਇਹ ਬਹੁਤ ਵਧੀਆ ਹੈ, ਵਿਜ਼ੂਅਲਾਈਜ਼ੇਸ਼ਨ ਡੇਟਾ ਨੂੰ ਸਹੀ ਰੂਪ ਵਿੱਚ ਦਰਸਾਉਂਦੀ ਹੈ। ਸਮੱਸਿਆ ਡੇਟਾ ਵਿੱਚ ਹੈ। ਇਸ ਲਈ, ਇਹ ਇੱਕ ਹੋਰ ਧੋਖੇਬਾਜ਼ ਪੱਖਪਾਤ ਹੈ ਕਿਉਂਕਿ ਤੁਸੀਂ ਇਸਨੂੰ ਨਹੀਂ ਦੇਖ ਸਕਦੇ. ਇਹ ਡਾਟਾ ਵਿੱਚ ਬੇਕ ਹੈ. ਉਹ ਸਵਾਲ ਜੋ ਤੁਹਾਨੂੰ ਪੁੱਛਣ ਦੀ ਲੋੜ ਹੈ, ਸ਼ਾਮਲ ਕਰੋ, ਕਿਸ ਦੀ ਜਾਂਚ ਕੀਤੀ ਜਾ ਰਹੀ ਹੈ? ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਭਾਅ ਕੀ ਹੈ, ਜਾਂ ਜਨਸੰਖਿਆ ਜਿਸਦਾ ਅਸੀਂ ਪ੍ਰਤੀਸ਼ਤ ਦੇਖ ਰਹੇ ਹਾਂ। ਧਾਰਨਾ ਇਹ ਹੈ ਕਿ ਇਹ ਸਮੁੱਚੀ ਆਬਾਦੀ, ਜਾਂ ਘੱਟੋ ਘੱਟ, ਇੱਕ ਪ੍ਰਤੀਨਿਧੀ ਨਮੂਨਾ ਹੈ।
ਹਾਲਾਂਕਿ, ਇਸ ਮਿਆਦ ਦੇ ਦੌਰਾਨ, ਇਸ ਕਾਉਂਟੀ ਵਿੱਚ, ਟੈਸਟ ਸਿਰਫ ਸੀਮਤ ਗਿਣਤੀ ਵਿੱਚ ਲੋਕਾਂ ਨੂੰ ਦਿੱਤੇ ਗਏ ਸਨ। ਉਹਨਾਂ ਕੋਲ ਕੋਵਿਡ ਵਰਗੇ ਲੱਛਣ ਹੋਣੇ ਸਨ, ਜਾਂ ਉਹਨਾਂ ਨੇ ਹਾਲ ਹੀ ਵਿੱਚ ਗਰਮ ਸਥਾਨਾਂ ਦੀ ਸੂਚੀ ਵਿੱਚ ਕਿਸੇ ਦੇਸ਼ ਦੀ ਯਾਤਰਾ ਕੀਤੀ ਸੀ। ਇਸ ਤੋਂ ਇਲਾਵਾ ਨਤੀਜਿਆਂ ਨੂੰ ਉਲਝਾਉਣਾ ਇਹ ਤੱਥ ਹੈ ਕਿ ਹਰੇਕ ਸਕਾਰਾਤਮਕ ਟੈਸਟ ਗਿਣਿਆ ਗਿਆ ਅਤੇ ਹਰੇਕ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਗਿਣਿਆ ਗਿਆ। ਆਮ ਤੌਰ 'ਤੇ, ਜਦੋਂ ਕੋਈ ਵਿਅਕਤੀ ਸਕਾਰਾਤਮਕ ਟੈਸਟ ਕਰਦਾ ਹੈ, ਤਾਂ ਉਹ ਦੁਬਾਰਾ ਟੈਸਟ ਕਰਨਗੇ ਜਦੋਂ ਵਾਇਰਸ ਆਪਣਾ ਕੋਰਸ ਚਲਾ ਗਿਆ ਸੀ ਅਤੇ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਕਰੇਗਾ। ਇਸ ਲਈ, ਇੱਕ ਅਰਥ ਵਿੱਚ, ਹਰੇਕ ਸਕਾਰਾਤਮਕ ਕੇਸ ਲਈ, ਇੱਕ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਕੇਸ ਹੁੰਦਾ ਹੈ ਜੋ ਇਸਨੂੰ ਰੱਦ ਕਰਦਾ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਟੈਸਟ ਨਕਾਰਾਤਮਕ ਹੁੰਦੇ ਹਨ ਅਤੇ ਹਰੇਕ ਵਿਅਕਤੀ ਦੇ ਨਕਾਰਾਤਮਕ ਟੈਸਟ ਗਿਣੇ ਜਾਂਦੇ ਹਨ। ਤੁਸੀਂ ਦੇਖ ਸਕਦੇ ਹੋ ਕਿ ਡੇਟਾ ਕਿਵੇਂ ਪੱਖਪਾਤੀ ਹੈ ਅਤੇ ਫੈਸਲੇ ਲੈਣ ਲਈ ਖਾਸ ਤੌਰ 'ਤੇ ਉਪਯੋਗੀ ਨਹੀਂ ਹੈ।
AI ਇਨਪੁਟ ਅਤੇ ਸਿਖਲਾਈ ਪੱਖਪਾਤੀ ਹੈ
ਘੱਟੋ-ਘੱਟ ਦੋ ਤਰੀਕੇ ਹਨ ਜਿਨ੍ਹਾਂ ਵਿੱਚ AI ਪੱਖਪਾਤੀ ਨਤੀਜੇ ਲਿਆ ਸਕਦਾ ਹੈ: ਪੱਖਪਾਤੀ ਡੇਟਾ ਨਾਲ ਸ਼ੁਰੂ ਕਰਨਾ, ਜਾਂ ਵੈਧ ਡੇਟਾ ਦੀ ਪ੍ਰਕਿਰਿਆ ਕਰਨ ਲਈ ਪੱਖਪਾਤੀ ਐਲਗੋਰਿਦਮ ਦੀ ਵਰਤੋਂ ਕਰਨਾ।
ਪੱਖਪਾਤੀ ਇਨਪੁਟ
ਸਾਡੇ ਵਿੱਚੋਂ ਬਹੁਤ ਸਾਰੇ ਇਸ ਪ੍ਰਭਾਵ ਦੇ ਅਧੀਨ ਹਨ ਕਿ AI 'ਤੇ ਸੰਖਿਆਵਾਂ ਨੂੰ ਘਟਾਉਣ, ਇਸਦੇ ਐਲਗੋਰਿਦਮ ਨੂੰ ਲਾਗੂ ਕਰਨ, ਅਤੇ ਡੇਟਾ ਦੇ ਭਰੋਸੇਯੋਗ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਥੁੱਕਣ ਲਈ ਭਰੋਸਾ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਆਰਟੀਫੀਸ਼ੀਅਲ ਇੰਟੈਲੀਜੈਂਸ ਸਿਰਫ ਓਨੀ ਹੀ ਚੁਸਤ ਹੋ ਸਕਦੀ ਹੈ ਜਿੰਨੀ ਇਸਨੂੰ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ। ਜੇਕਰ ਉਹ ਡੇਟਾ ਜਿਸ 'ਤੇ ਇਸ ਨੂੰ ਸਿਖਲਾਈ ਦਿੱਤੀ ਜਾਂਦੀ ਹੈ ਅਪੂਰਣ ਹੈ, ਤਾਂ ਨਤੀਜਿਆਂ ਜਾਂ ਸਿੱਟਿਆਂ 'ਤੇ ਵੀ ਭਰੋਸਾ ਨਹੀਂ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ। ਸਰਵੇਖਣ ਪੱਖਪਾਤ ਦੇ ਉਪਰੋਕਤ ਕੇਸ ਵਾਂਗ, ਇੱਥੇ ਬਹੁਤ ਸਾਰੇ ਤਰੀਕੇ ਹਨ ਜਿਨ੍ਹਾਂ ਵਿੱਚ ਡੇਟਾ ਹੋ ਸਕਦਾ ਹੈ ਪੱਖਪਾਤੀ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਵਿੱਚ:.
- ਨਮੂਨਾ ਪੱਖਪਾਤ - ਸਿਖਲਾਈ ਡੇਟਾਸੈਟ ਪੂਰੀ ਆਬਾਦੀ ਦਾ ਪ੍ਰਤੀਨਿਧ ਨਹੀਂ ਹੈ।
- ਬੇਦਖਲੀ ਪੱਖਪਾਤ - ਕਈ ਵਾਰ ਜੋ ਬਾਹਰੀ ਜਾਪਦਾ ਹੈ ਉਹ ਅਸਲ ਵਿੱਚ ਵੈਧ ਹੁੰਦਾ ਹੈ, ਜਾਂ, ਜਿੱਥੇ ਅਸੀਂ ਇਸ ਬਾਰੇ ਲਾਈਨ ਖਿੱਚਦੇ ਹਾਂ ਕਿ ਕੀ ਸ਼ਾਮਲ ਕਰਨਾ ਹੈ (ਜ਼ਿਪ ਕੋਡ, ਮਿਤੀਆਂ, ਆਦਿ)।
- ਮਾਪ ਪੱਖਪਾਤ - ਸੰਮੇਲਨ ਹਮੇਸ਼ਾ ਮੇਨਿਸਕਸ ਦੇ ਕੇਂਦਰ ਅਤੇ ਹੇਠਾਂ ਤੋਂ ਮਾਪਣਾ ਹੈ, ਉਦਾਹਰਨ ਲਈ, ਜਦੋਂ ਵੋਲਯੂਮੈਟ੍ਰਿਕ ਫਲਾਸਕ ਜਾਂ ਟੈਸਟ ਟਿਊਬਾਂ (ਪਾਰਾ ਨੂੰ ਛੱਡ ਕੇ) ਵਿੱਚ ਤਰਲ ਪਦਾਰਥਾਂ ਨੂੰ ਮਾਪਦੇ ਹੋ।
- ਪੱਖਪਾਤ ਨੂੰ ਯਾਦ ਕਰੋ - ਜਦੋਂ ਖੋਜ ਭਾਗੀਦਾਰਾਂ ਦੀ ਯਾਦਾਸ਼ਤ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ।
- ਨਿਰੀਖਕ ਪੱਖਪਾਤ - ਵਿਗਿਆਨੀ, ਸਾਰੇ ਮਨੁੱਖਾਂ ਵਾਂਗ, ਇਹ ਦੇਖਣ ਲਈ ਵਧੇਰੇ ਝੁਕਾਅ ਰੱਖਦੇ ਹਨ ਕਿ ਉਹ ਕੀ ਦੇਖਣ ਦੀ ਉਮੀਦ ਕਰਦੇ ਹਨ।
- ਲਿੰਗਵਾਦੀ ਅਤੇ ਨਸਲਵਾਦੀ ਪੱਖਪਾਤ - ਲਿੰਗ ਜਾਂ ਨਸਲ ਨੂੰ ਵੱਧ ਜਾਂ ਘੱਟ-ਪ੍ਰਤੀਨਿਧਿਤ ਕੀਤਾ ਜਾ ਸਕਦਾ ਹੈ।
- ਐਸੋਸੀਏਸ਼ਨ ਪੱਖਪਾਤ - ਡੇਟਾ ਸਟੀਰੀਓਟਾਈਪਾਂ ਨੂੰ ਮਜ਼ਬੂਤ ਕਰਦਾ ਹੈ
AI ਨੂੰ ਭਰੋਸੇਯੋਗ ਨਤੀਜੇ ਦੇਣ ਲਈ, ਇਸਦੇ ਸਿਖਲਾਈ ਡੇਟਾ ਨੂੰ ਅਸਲ ਸੰਸਾਰ ਨੂੰ ਦਰਸਾਉਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ। ਜਿਵੇਂ ਕਿ ਅਸੀਂ ਪਿਛਲੇ ਬਲੌਗ ਲੇਖ ਵਿੱਚ ਚਰਚਾ ਕੀਤੀ ਹੈ, ਡੇਟਾ ਦੀ ਤਿਆਰੀ ਮਹੱਤਵਪੂਰਨ ਹੈ ਅਤੇ ਕਿਸੇ ਵੀ ਹੋਰ ਡੇਟਾ ਪ੍ਰੋਜੈਕਟ ਦੀ ਤਰ੍ਹਾਂ. ਭਰੋਸੇਮੰਦ ਡੇਟਾ ਮਸ਼ੀਨ ਸਿਖਲਾਈ ਪ੍ਰਣਾਲੀਆਂ ਨੂੰ ਗਲਤ ਸਬਕ ਸਿਖਾ ਸਕਦਾ ਹੈ ਅਤੇ ਨਤੀਜੇ ਵਜੋਂ ਗਲਤ ਸਿੱਟੇ ਨਿਕਲਣਗੇ। ਉਸ ਨੇ ਕਿਹਾ, “ਸਾਰਾ ਡੇਟਾ ਪੱਖਪਾਤੀ ਹੈ। ਇਹ ਪਾਗਲਪਣ ਨਹੀਂ ਹੈ। ਇਹ ਤੱਥ ਹੈ।” - ਡਾ: ਸੰਜੀਵ ਐਮ. ਨਰਾਇਣ, ਸਟੈਨਫੋਰਡ ਯੂਨੀਵਰਸਿਟੀ ਸਕੂਲ ਆਫ਼ ਮੈਡੀਸਨ।
ਸਿਖਲਾਈ ਲਈ ਪੱਖਪਾਤੀ ਡੇਟਾ ਦੀ ਵਰਤੋਂ ਕਰਨ ਨਾਲ ਬਹੁਤ ਸਾਰੀਆਂ ਮਹੱਤਵਪੂਰਨ AI ਅਸਫਲਤਾਵਾਂ ਹੋਈਆਂ ਹਨ। (ਉਦਾਹਰਨਾਂ ਇਥੇ ਅਤੇ ਇਥੇ, ਖੋਜ ਇਥੇ..)
ਪੱਖਪਾਤੀ ਐਲਗੋਰਿਦਮ
ਇੱਕ ਐਲਗੋਰਿਦਮ ਨਿਯਮਾਂ ਦਾ ਇੱਕ ਸਮੂਹ ਹੈ ਜੋ ਇੱਕ ਇੰਪੁੱਟ ਨੂੰ ਸਵੀਕਾਰ ਕਰਦਾ ਹੈ ਅਤੇ ਇੱਕ ਵਪਾਰਕ ਸਮੱਸਿਆ ਦਾ ਜਵਾਬ ਦੇਣ ਲਈ ਆਉਟਪੁੱਟ ਬਣਾਉਂਦਾ ਹੈ। ਉਹ ਅਕਸਰ ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਰਿਭਾਸ਼ਿਤ ਫੈਸਲੇ ਦੇ ਰੁੱਖ ਹੁੰਦੇ ਹਨ। ਐਲਗੋਰਿਦਮ ਬਲੈਕ ਬਾਕਸ ਵਾਂਗ ਮਹਿਸੂਸ ਕਰਦੇ ਹਨ। ਕੋਈ ਵੀ ਯਕੀਨੀ ਨਹੀਂ ਹੁੰਦਾ ਕਿ ਉਹ ਕਿਵੇਂ ਕੰਮ ਕਰਦੇ ਹਨ, ਅਕਸਰ, ਇੱਥੋਂ ਤੱਕ ਕਿ ਨਹੀਂ ਕੰਪਨੀਆਂ ਜੋ ਇਹਨਾਂ ਦੀ ਵਰਤੋਂ ਕਰਦੀਆਂ ਹਨ. ਓਹ, ਅਤੇ ਉਹ ਅਕਸਰ ਮਲਕੀਅਤ ਹੁੰਦੇ ਹਨ. ਉਹਨਾਂ ਦਾ ਰਹੱਸਮਈ ਅਤੇ ਗੁੰਝਲਦਾਰ ਸੁਭਾਅ ਇੱਕ ਕਾਰਨ ਹੈ ਕਿ ਪੱਖਪਾਤੀ ਐਲਗੋਰਿਦਮ ਇੰਨੇ ਧੋਖੇਬਾਜ਼ ਹਨ। .
ਦਵਾਈ, ਐਚਆਰ ਜਾਂ ਵਿੱਤ ਵਿੱਚ AI ਐਲਗੋਰਿਦਮ 'ਤੇ ਵਿਚਾਰ ਕਰੋ ਜੋ ਦੌੜ ਨੂੰ ਧਿਆਨ ਵਿੱਚ ਰੱਖਦੇ ਹਨ। ਜੇਕਰ ਨਸਲ ਇੱਕ ਕਾਰਕ ਹੈ, ਤਾਂ ਐਲਗੋਰਿਦਮ ਨਸਲੀ ਤੌਰ 'ਤੇ ਅੰਨ੍ਹਾ ਨਹੀਂ ਹੋ ਸਕਦਾ। ਇਹ ਸਿਧਾਂਤਕ ਨਹੀਂ ਹੈ। AI in ਦੀ ਵਰਤੋਂ ਕਰਕੇ ਅਸਲ ਸੰਸਾਰ ਵਿੱਚ ਇਸ ਤਰ੍ਹਾਂ ਦੀਆਂ ਸਮੱਸਿਆਵਾਂ ਲੱਭੀਆਂ ਗਈਆਂ ਹਨ ਮਜੂਰੀ, ਰਾਈਡ-ਸ਼ੇਅਰ, ਕਰਜ਼ਾ ਅਰਜ਼ੀs, ਅਤੇ ਗੁਰਦੇ ਟ੍ਰਾਂਸਪਲਾਂਟ.
ਤਲ ਲਾਈਨ ਇਹ ਹੈ ਕਿ ਜੇ ਤੁਹਾਡਾ ਡੇਟਾ ਜਾਂ ਐਲਗੋਰਿਦਮ ਖਰਾਬ ਹਨ, ਬੇਕਾਰ ਤੋਂ ਵੀ ਮਾੜੇ ਹਨ, ਤਾਂ ਉਹ ਖਤਰਨਾਕ ਹੋ ਸਕਦੇ ਹਨ. ਇੱਕ ਅਜਿਹੀ ਚੀਜ਼ ਹੈ ਜਿਵੇਂ "ਐਲਗੋਰਿਦਮਿਕ ਆਡਿਟ" ਟੀਚਾ ਐਲਗੋਰਿਦਮ ਨਾਲ ਸਬੰਧਤ ਸੰਭਾਵੀ ਖਤਰਿਆਂ ਦੀ ਪਛਾਣ ਕਰਨ ਵਿੱਚ ਸੰਸਥਾਵਾਂ ਦੀ ਮਦਦ ਕਰਨਾ ਹੈ ਕਿਉਂਕਿ ਇਹ ਨਿਰਪੱਖਤਾ, ਪੱਖਪਾਤ ਅਤੇ ਵਿਤਕਰੇ ਨਾਲ ਸਬੰਧਤ ਹੈ। ਕਿਤੇ ਹੋਰ, ਫੇਸਬੁੱਕ AI ਵਿੱਚ ਪੱਖਪਾਤ ਨਾਲ ਲੜਨ ਲਈ AI ਦੀ ਵਰਤੋਂ ਕਰ ਰਿਹਾ ਹੈ।
ਲੋਕ ਪੱਖਪਾਤੀ ਹਨ
ਸਾਡੇ ਕੋਲ ਸਮੀਕਰਨ ਦੇ ਦੋਵੇਂ ਪਾਸੇ ਲੋਕ ਹਨ। ਲੋਕ ਵਿਸ਼ਲੇਸ਼ਣ ਤਿਆਰ ਕਰ ਰਹੇ ਹਨ ਅਤੇ ਲੋਕ ਜਾਣਕਾਰੀ ਪ੍ਰਾਪਤ ਕਰ ਰਹੇ ਹਨ। ਖੋਜੀ ਹਨ ਅਤੇ ਪਾਠਕ ਹਨ। ਕਿਸੇ ਵੀ ਸੰਚਾਰ ਵਿੱਚ, ਪ੍ਰਸਾਰਣ ਜਾਂ ਰਿਸੈਪਸ਼ਨ ਵਿੱਚ ਸਮੱਸਿਆਵਾਂ ਹੋ ਸਕਦੀਆਂ ਹਨ.
ਉਦਾਹਰਨ ਲਈ, ਮੌਸਮ ਲਓ। "ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ" ਦਾ ਕੀ ਮਤਲਬ ਹੈ? ਪਹਿਲਾਂ, ਮੌਸਮ ਵਿਗਿਆਨੀਆਂ ਦਾ ਕੀ ਮਤਲਬ ਹੈ ਜਦੋਂ ਉਹ ਕਹਿੰਦੇ ਹਨ ਕਿ ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ ਹੈ? ਅਮਰੀਕੀ ਸਰਕਾਰ ਦੇ ਅਨੁਸਾਰ ਰਾਸ਼ਟਰੀ ਮੌਸਮ ਸੇਵਾ, ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ, ਜਾਂ ਜਿਸਨੂੰ ਉਹ ਪ੍ਰੌਬੇਬਿਲਟੀ ਆਫ਼ ਪ੍ਰਿਸੀਪੀਟੇਸ਼ਨ (PoP) ਕਹਿੰਦੇ ਹਨ, ਇੱਕ ਮੌਸਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਵਿੱਚ ਸਭ ਤੋਂ ਘੱਟ ਸਮਝੇ ਜਾਣ ਵਾਲੇ ਤੱਤਾਂ ਵਿੱਚੋਂ ਇੱਕ ਹੈ। ਇਸਦੀ ਇੱਕ ਮਿਆਰੀ ਪਰਿਭਾਸ਼ਾ ਹੈ: "ਵਰਖਾ ਦੀ ਸੰਭਾਵਨਾ ਨਿਰਧਾਰਿਤ ਸਮੇਂ ਦੀ ਮਿਆਦ ਵਿੱਚ ਦਿੱਤੇ ਗਏ ਪੂਰਵ ਅਨੁਮਾਨ ਖੇਤਰ ਵਿੱਚ ਦਿੱਤੇ ਗਏ ਖੇਤਰ ਵਿੱਚ 0.01″ ਇੰਚ [sic] ਤੋਂ ਜ਼ਿਆਦਾ ਵਰਖਾ ਦੀ ਇੱਕ ਅੰਕੜਾਤਮਕ ਸੰਭਾਵਨਾ ਹੈ।" "ਦਿੱਤਾ ਖੇਤਰ" ਪੂਰਵ ਅਨੁਮਾਨ ਖੇਤਰ ਹੈ, ਜਾਂ ਬੀroadਕਾਸਟ ਖੇਤਰ. ਇਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਵਰਖਾ ਦੀ ਅਧਿਕਾਰਤ ਸੰਭਾਵਨਾ ਇਸ ਭਰੋਸੇ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ ਕਿ ਇਹ ਖੇਤਰ ਵਿੱਚ ਕਿਤੇ ਮੀਂਹ ਪਵੇਗਾ ਅਤੇ ਖੇਤਰ ਦਾ ਪ੍ਰਤੀਸ਼ਤ ਗਿੱਲਾ ਹੋ ਜਾਵੇਗਾ। ਦੂਜੇ ਸ਼ਬਦਾਂ ਵਿੱਚ, ਜੇਕਰ ਮੌਸਮ ਵਿਗਿਆਨੀ ਨੂੰ ਭਰੋਸਾ ਹੈ ਕਿ ਇਹ ਪੂਰਵ ਅਨੁਮਾਨ ਖੇਤਰ (ਵਿਸ਼ਵਾਸ = 100%) ਵਿੱਚ ਮੀਂਹ ਪੈਣ ਵਾਲਾ ਹੈ, ਤਾਂ PoP ਉਸ ਖੇਤਰ ਦੇ ਹਿੱਸੇ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ ਜਿਸ ਵਿੱਚ ਮੀਂਹ ਪਵੇਗਾ।
ਪੈਰਿਸ ਸਟ੍ਰੀਟ; ਮੀਂਹ ਵਾਲਾ ਦਿਨ,ਗੁਸਤਾਵ ਕੈਲੇਬੋਟ (1848-1894) ਸ਼ਿਕਾਗੋ ਆਰਟ ਇੰਸਟੀਚਿਊਟ ਪਬਲਿਕ ਡੋਮੇਨ
ਮੀਂਹ ਦੀ ਸੰਭਾਵਨਾ ਭਰੋਸੇ ਅਤੇ ਖੇਤਰ ਦੋਵਾਂ 'ਤੇ ਨਿਰਭਰ ਕਰਦੀ ਹੈ। ਮੈਨੂੰ ਇਹ ਨਹੀਂ ਪਤਾ ਸੀ। ਮੈਨੂੰ ਸ਼ੱਕ ਹੈ ਕਿ ਹੋਰ ਲੋਕ ਵੀ ਇਹ ਨਹੀਂ ਜਾਣਦੇ ਹਨ। ਲਗਭਗ 75% ਆਬਾਦੀ ਸਹੀ ਢੰਗ ਨਾਲ ਇਹ ਨਹੀਂ ਸਮਝਦੀ ਕਿ PoP ਦੀ ਗਣਨਾ ਕਿਵੇਂ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਜਾਂ ਇਸਦਾ ਮਤਲਬ ਕੀ ਹੈ। ਇਸ ਲਈ, ਕੀ ਸਾਨੂੰ ਮੂਰਖ ਬਣਾਇਆ ਜਾ ਰਿਹਾ ਹੈ, ਜਾਂ, ਕੀ ਇਹ ਧਾਰਨਾ ਦੀ ਸਮੱਸਿਆ ਹੈ। ਚਲੋ ਇਸਨੂੰ ਵਰਖਾ ਧਾਰਨਾ ਕਹਿੰਦੇ ਹਾਂ। ਕੀ ਅਸੀਂ ਮੌਸਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਵਾਲੇ ਨੂੰ ਦੋਸ਼ੀ ਠਹਿਰਾਉਂਦੇ ਹਾਂ? ਨਿਰਪੱਖ ਹੋਣ ਲਈ, ਕੁਝ ਹੈ ਉਲਝਣ ਮੌਸਮ ਦੀ ਭਵਿੱਖਬਾਣੀ ਕਰਨ ਵਾਲਿਆਂ ਵਿੱਚ ਵੀ। ਇੱਕ ਵਿੱਚ ਸਰਵੇਖਣ, ਸਰਵੇਖਣ ਕੀਤੇ ਗਏ ਮੌਸਮ ਵਿਗਿਆਨੀਆਂ ਵਿੱਚੋਂ 43% ਨੇ ਕਿਹਾ ਕਿ ਪੀਓਪੀ ਦੀ ਪਰਿਭਾਸ਼ਾ ਵਿੱਚ ਬਹੁਤ ਘੱਟ ਇਕਸਾਰਤਾ ਹੈ।
ਵਿਸ਼ਲੇਸ਼ਣ ਖੁਦ ਹੀ ਪੱਖਪਾਤੀ ਹੈ
ਪੰਜਾਂ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਨ ਵਾਲੇ ਕਾਰਕਾਂ ਵਿੱਚੋਂ, ਵਿਸ਼ਲੇਸ਼ਣ ਆਪਣੇ ਆਪ ਵਿੱਚ ਸਭ ਤੋਂ ਹੈਰਾਨੀਜਨਕ ਹੋ ਸਕਦਾ ਹੈ। ਵਿਗਿਆਨਕ ਖੋਜ ਵਿੱਚ ਜਿਸ ਦੇ ਨਤੀਜੇ ਵਜੋਂ ਇੱਕ ਸਮੀਖਿਆ ਕੀਤੀ ਪੇਪਰ ਪ੍ਰਕਾਸ਼ਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਆਮ ਤੌਰ 'ਤੇ ਇੱਕ ਸਿਧਾਂਤ ਦੀ ਕਲਪਨਾ ਕੀਤੀ ਜਾਂਦੀ ਹੈ, ਪਰਿਕਲਪਨਾ ਦੀ ਜਾਂਚ ਕਰਨ ਲਈ ਤਰੀਕਿਆਂ ਨੂੰ ਪਰਿਭਾਸ਼ਿਤ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਡੇਟਾ ਇਕੱਠਾ ਕੀਤਾ ਜਾਂਦਾ ਹੈ, ਫਿਰ ਡੇਟਾ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕੀਤਾ ਜਾਂਦਾ ਹੈ। ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਕਿਸਮ ਜੋ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਅਤੇ ਇਹ ਕਿਵੇਂ ਕੀਤਾ ਜਾਂਦਾ ਹੈ ਇਸ ਗੱਲ ਵਿੱਚ ਘੱਟ ਪ੍ਰਸ਼ੰਸਾ ਕੀਤੀ ਜਾਂਦੀ ਹੈ ਕਿ ਇਹ ਸਿੱਟਿਆਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦਾ ਹੈ। ਵਿੱਚ ਇੱਕ ਕਾਗਜ਼ ਇਸ ਸਾਲ ਦੇ ਸ਼ੁਰੂ ਵਿੱਚ ਪ੍ਰਕਾਸ਼ਿਤ (ਜਨਵਰੀ 2022), ਕੈਂਸਰ ਦੇ ਇੰਟਰਨੈਸ਼ਨਲ ਜਰਨਲ ਵਿੱਚ, ਲੇਖਕਾਂ ਨੇ ਮੁਲਾਂਕਣ ਕੀਤਾ ਕਿ ਕੀ ਬੇਤਰਤੀਬੇ ਨਿਯੰਤਰਿਤ ਅਜ਼ਮਾਇਸ਼ਾਂ ਅਤੇ ਪੂਰਵ-ਅਨੁਸਾਰੀ ਅਧਿਐਨਾਂ ਦੇ ਨਤੀਜੇ ਹਨ। ਉਨ੍ਹਾਂ ਦੀਆਂ ਖੋਜਾਂ ਨੇ ਸਿੱਟਾ ਕੱਢਿਆ ਕਿ,
ਤੁਲਨਾਤਮਕ ਪ੍ਰਭਾਵਸ਼ੀਲਤਾ ਖੋਜ ਵਿੱਚ ਵੱਖੋ-ਵੱਖਰੇ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਵਿਕਲਪਾਂ ਦੁਆਰਾ, ਅਸੀਂ ਉਲਟ ਨਤੀਜੇ ਪੈਦਾ ਕੀਤੇ। ਸਾਡੇ ਨਤੀਜੇ ਸੁਝਾਅ ਦਿੰਦੇ ਹਨ ਕਿ ਕੁਝ ਪਿਛਾਖੜੀ ਨਿਰੀਖਣ ਅਧਿਐਨਾਂ ਵਿੱਚ ਇੱਕ ਇਲਾਜ ਦਾ ਪਤਾ ਲੱਗ ਸਕਦਾ ਹੈ ਜੋ ਮਰੀਜ਼ਾਂ ਲਈ ਨਤੀਜਿਆਂ ਵਿੱਚ ਸੁਧਾਰ ਕਰਦਾ ਹੈ, ਜਦੋਂ ਕਿ ਇੱਕ ਹੋਰ ਸਮਾਨ ਅਧਿਐਨ ਇਹ ਨਹੀਂ ਲੱਭ ਸਕਦਾ ਹੈ, ਸਿਰਫ਼ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਵਿਕਲਪਾਂ ਦੇ ਅਧਾਰ ਤੇ।
ਅਤੀਤ ਵਿੱਚ, ਇੱਕ ਵਿਗਿਆਨਕ ਜਰਨਲ ਲੇਖ ਨੂੰ ਪੜ੍ਹਦੇ ਸਮੇਂ, ਜੇ ਤੁਸੀਂ ਮੇਰੇ ਵਰਗੇ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਸ਼ਾਇਦ ਸੋਚਿਆ ਹੋਵੇਗਾ ਕਿ ਨਤੀਜੇ ਜਾਂ ਸਿੱਟੇ ਸਾਰੇ ਡੇਟਾ ਬਾਰੇ ਹਨ। ਹੁਣ, ਇਹ ਜਾਪਦਾ ਹੈ ਕਿ ਨਤੀਜੇ, ਜਾਂ ਕੀ ਸ਼ੁਰੂਆਤੀ ਪਰਿਕਲਪਨਾ ਦੀ ਪੁਸ਼ਟੀ ਕੀਤੀ ਗਈ ਹੈ ਜਾਂ ਰੱਦ ਕੀਤੀ ਗਈ ਹੈ, ਇਹ ਵੀ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਵਿਧੀ 'ਤੇ ਨਿਰਭਰ ਹੋ ਸਕਦਾ ਹੈ।
ਹੋਰ ਦਾ ਅਧਿਐਨ ਸਮਾਨ ਨਤੀਜੇ ਮਿਲੇ ਹਨ। ਲੇਖ, ਬਹੁਤ ਸਾਰੇ ਵਿਸ਼ਲੇਸ਼ਕ, ਇੱਕ ਡੇਟਾ ਸੈਟ: ਪਾਰਦਰਸ਼ੀ ਬਣਾਉਣਾ ਕਿ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਚੋਣਾਂ ਵਿੱਚ ਭਿੰਨਤਾਵਾਂ ਨਤੀਜਿਆਂ ਨੂੰ ਕਿਵੇਂ ਪ੍ਰਭਾਵਤ ਕਰਦੀਆਂ ਹਨ, ਵਰਣਨ ਕਰਦਾ ਹੈ ਕਿ ਉਹਨਾਂ ਨੇ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਲਈ 29 ਵੱਖ-ਵੱਖ ਟੀਮਾਂ ਨੂੰ ਇੱਕੋ ਡੇਟਾ ਸੈੱਟ ਕਿਵੇਂ ਦਿੱਤਾ। ਡੇਟਾ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਅਕਸਰ ਇੱਕ ਸਖਤ, ਚੰਗੀ ਤਰ੍ਹਾਂ ਪਰਿਭਾਸ਼ਿਤ ਪ੍ਰਕਿਰਿਆ ਵਜੋਂ ਦੇਖਿਆ ਜਾਂਦਾ ਹੈ ਜੋ ਇੱਕ ਸਿੱਟੇ 'ਤੇ ਪਹੁੰਚਦਾ ਹੈ।
ਵਿਧੀ-ਵਿਗਿਆਨੀਆਂ ਦੇ ਪ੍ਰਦਰਸ਼ਨਾਂ ਦੇ ਬਾਵਜੂਦ, ਇਸ ਤੱਥ ਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨਾ ਆਸਾਨ ਹੈ ਕਿ ਨਤੀਜੇ ਚੁਣੀ ਗਈ ਵਿਸ਼ਲੇਸ਼ਣਾਤਮਕ ਰਣਨੀਤੀ 'ਤੇ ਨਿਰਭਰ ਹੋ ਸਕਦੇ ਹਨ, ਜੋ ਆਪਣੇ ਆਪ ਵਿੱਚ ਸਿਧਾਂਤ, ਧਾਰਨਾਵਾਂ ਅਤੇ ਚੋਣ ਬਿੰਦੂਆਂ ਨਾਲ ਰੰਗੀ ਹੋਈ ਹੈ। ਬਹੁਤ ਸਾਰੇ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਖੋਜ ਸਵਾਲ 'ਤੇ ਸਹਿਣ ਵਾਲੇ ਡੇਟਾ ਦਾ ਮੁਲਾਂਕਣ ਕਰਨ ਲਈ ਬਹੁਤ ਸਾਰੇ ਵਾਜਬ (ਅਤੇ ਬਹੁਤ ਸਾਰੇ ਗੈਰ-ਵਾਜਬ) ਪਹੁੰਚ ਹਨ।
ਖੋਜਕਰਤਾਵਾਂ ਨੇ ਡੇਟਾ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਭੀੜ-ਸ੍ਰੋਤ ਕੀਤਾ ਅਤੇ ਇਸ ਸਿੱਟੇ 'ਤੇ ਪਹੁੰਚੇ ਕਿ ਸਾਰੀਆਂ ਖੋਜਾਂ ਵਿੱਚ ਵਿਅਕਤੀਗਤ ਫੈਸਲੇ ਸ਼ਾਮਲ ਹੁੰਦੇ ਹਨ - ਜਿਸ ਵਿੱਚ ਕਿਸ ਕਿਸਮ ਦੇ ਵਿਸ਼ਲੇਸ਼ਣ ਦੀ ਵਰਤੋਂ ਕਰਨੀ ਹੈ - ਜੋ ਅਧਿਐਨ ਦੇ ਅੰਤਮ ਨਤੀਜਿਆਂ ਨੂੰ ਪ੍ਰਭਾਵਤ ਕਰ ਸਕਦੀ ਹੈ।
ਕਿਸੇ ਹੋਰ ਦੀ ਸਿਫਾਰਸ਼ ਖੋਜਕਾਰ ਉਪਰੋਕਤ ਅਧਿਐਨ ਦਾ ਵਿਸ਼ਲੇਸ਼ਣ ਕਰਨ ਵਾਲੇ ਨੂੰ ਫੈਸਲੇ ਲੈਣ ਜਾਂ ਸਿੱਟੇ ਕੱਢਣ ਲਈ ਇੱਕ ਪੇਪਰ ਦੀ ਵਰਤੋਂ ਕਰਦੇ ਸਮੇਂ ਸਾਵਧਾਨ ਰਹਿਣਾ ਚਾਹੀਦਾ ਹੈ।
ਵਿਸ਼ਲੇਸ਼ਣ ਵਿੱਚ ਪੱਖਪਾਤ ਨੂੰ ਸੰਬੋਧਨ ਕਰਨਾ
ਇਹ ਸਿਰਫ਼ ਇੱਕ ਸਾਵਧਾਨੀ ਵਾਲੀ ਕਹਾਣੀ ਹੈ। ਗਿਆਨ ਸਾਨੂੰ ਘੁਟਾਲਿਆਂ ਵਿੱਚ ਫਸਣ ਤੋਂ ਬਚਾ ਸਕਦਾ ਹੈ। ਇੱਕ ਸਕੈਨਰ ਸਾਨੂੰ ਮੂਰਖ ਬਣਾਉਣ ਲਈ ਜਿੰਨਾ ਸੰਭਾਵੀ ਤਰੀਕਿਆਂ ਦੀ ਵਰਤੋਂ ਕਰ ਸਕਦਾ ਹੈ, ਉਸ ਤੋਂ ਵੱਧ ਜਾਣੂ ਹੋਣ ਦੀ ਸੰਭਾਵਨਾ ਹੈ, ਸਾਨੂੰ ਇੱਕ ਪਾਕੇਟ ਦੀ ਗਲਤ ਦਿਸ਼ਾ, ਜਾਂ ਇੱਕ ਪੋਂਜ਼ੀ ਖੇਡ ਦੀ ਨਿਰਵਿਘਨ ਗੱਲਬਾਤ ਵਿੱਚ ਲਏ ਜਾਣ ਦੀ ਘੱਟ ਸੰਭਾਵਨਾ ਹੈ। ਇਸ ਲਈ ਇਹ ਸੰਭਾਵੀ ਪੱਖਪਾਤਾਂ ਨੂੰ ਸਮਝਣ ਅਤੇ ਪਛਾਣਨ ਦੇ ਨਾਲ ਹੈ ਜੋ ਸਾਡੇ ਵਿਸ਼ਲੇਸ਼ਣ ਨੂੰ ਪ੍ਰਭਾਵਿਤ ਕਰਦੇ ਹਨ। ਜੇਕਰ ਅਸੀਂ ਸੰਭਾਵੀ ਪ੍ਰਭਾਵਾਂ ਤੋਂ ਜਾਣੂ ਹਾਂ, ਤਾਂ ਅਸੀਂ ਕਹਾਣੀ ਨੂੰ ਬਿਹਤਰ ਢੰਗ ਨਾਲ ਪੇਸ਼ ਕਰਨ ਦੇ ਯੋਗ ਹੋ ਸਕਦੇ ਹਾਂ ਅਤੇ ਅੰਤ ਵਿੱਚ ਬਿਹਤਰ ਫੈਸਲੇ ਲੈ ਸਕਦੇ ਹਾਂ।