સ્ટાન્ડર્ડ વિચલન અને સ્ટાન્ડર્ડ એરર વચ્ચે તફાવત

Anonim

પરિચય

ધોરણ ડી ઉત્ક્રાંતિ (એસડી) અને એસ ધોરણ > ઇ રરર (એસઈ) મોટે ભાગે સમાન પરિભાષાઓ છે; જો કે, તેઓ કલ્પનાત્મક રીતે એટલી વૈવિધ્યસભર છે કે તેઓ આંકડાશાસ્ત્રમાં લગભગ એકબીજાના બદલે ઉપયોગમાં લેવાય છે. બંને શબ્દો સામાન્ય રીતે વત્તા-બાદ ચિહ્ન (+/-) દ્વારા અનુસરાય છે, જે હકીકતનું સૂચક છે કે તેઓ સપ્રમાણ મૂલ્યને વ્યાખ્યાયિત કરે છે અથવા મૂલ્યોની શ્રેણીનું પ્રતિનિધિત્વ કરે છે. નિશ્ચિતપણે, બન્ને શબ્દો સરેરાશ મૂલ્યોના સરેરાશ (સરેરાશ) સાથે દેખાય છે.

રસપ્રદ રીતે, એક SE નો ધોરણો, ભૂલો સાથે અથવા વૈજ્ઞાનિક ડેટાના સંચાર સાથે કરવાનું કંઈ નથી.

મૂળ અને એસ.ડી. અને એસ.ઇ.ના ખુલાસા અંગે વિગતવાર દેખાવ ઉઘાડો કરશે, શા માટે વ્યાવસાયિક આંકડાશાસ્ત્રીઓ અને જેઓ તેનો ઉપયોગ કર્સુલી રીતે કરે છે, બંને ભૂલભરેલી છે.

ધોરણ વિચલન (એસડી)

એક SD એક

વર્ણનાત્મક વિતરણના પ્રસારને વર્ણવતા આંકડાઓ છે. એક મેટ્રિક તરીકે, તે ઉપયોગી છે જ્યારે ડેટા સામાન્ય રીતે વિતરણ કરવામાં આવે છે. જો કે, તે ઓછી ઉપયોગી છે જ્યારે ડેટા અત્યંત સ્ક્યુડ અથવા બાયમોડલ છે કારણ કે તે વિતરણનો આકાર ખૂબ જ સારી રીતે વર્ણવતો નથી. લાક્ષણિક રીતે, અમે સેમ્પલના લાક્ષણિકતાઓની જાણ કરતી વખતે એસડીનો ઉપયોગ કરીએ છીએ, કારણ કે અમારું ઈરાદો વર્ણન કરો આનો અર્થ એ છે કે સરેરાશ ડેટા કેટલો મોટો છે. ડેટાના ફેલાવોનું વર્ણન કરવા માટેના અન્ય ઉપયોગી આંકડા ઇન્ટર-ક્વૉટાઇલ રેન્જ, 25 મી અને 75 મા ટકા અને ડેટાની રેંજ છે.

આકૃતિ 1. એસ.ડી એ ડેટાના પ્રસારનો એક માપ છે. જ્યારે ડેટા સામાન્ય રીતે વિતરિત વિતરણમાંથી એક નમૂનો હોય, ત્યારે એક એવી અપેક્ષા રાખે છે કે ડેટાના બે-તૃતીયાંશ લોકો સરેરાશ 1 સ્ટાન્ડર્ડ વિચલનમાં આવે.

ભિન્નતા એક

વર્ણનાત્મક આંકડાઓને પણ છે, અને તે પ્રમાણભૂત વિચલનના વર્ગ તરીકે વ્યાખ્યાયિત થયેલ છે. તે પરિણામોનું વર્ણન કરતી વખતે સામાન્ય રીતે જાણ કરવામાં આવતી નથી, પરંતુ તે વધુ ગાણિતિક રીતે સંલગ્ન સૂત્ર છે (આંકડા મુજબ સ્ક્વેર્ડ વિચલનોનો સરવાળો) અને આંકડાઓની ગણતરીમાં ભૂમિકા ભજવે છે. ઉદાહરણ તરીકે, જો આપણી પાસે બે આંકડાઓ

P

અને Q જાણીતા અંતર સાથે var (પી) & < વાર (ક્યૂ) , પછી સરવાળોનો અવરોધો પી + ક્યૂ સમાનતાઓના સરવાળા જેટલો છે: var (પી) + > વાર (સ) . હવે તે સ્પષ્ટ છે કે આંકડાશાસ્ત્રીઓ અંતર્ગત વાત કરવા માગે છે. પરંતુ પ્રમાણભૂત વિચલનો સ્પ્રેડ માટે અગત્યનો અર્થ કરે છે, ખાસ કરીને જ્યારે ડેટા સામાન્ય રીતે વહેંચવામાં આવે છે: અંતરાલનો અર્થ +/- 1 એસ.ડી. નમૂનાના 2/3 કેપ્ચર, અને અંતરાલ સરેરાશ + - 2 એસ.ડી.

નમૂનાનો 95% હિસ્સો મેળવવાની અપેક્ષા રાખી શકાય છે. એસડી એ એક સંકેત આપે છે કે પ્રશ્નના વ્યક્તિગત પ્રતિસાદ અલગ અલગ છે અથવા સરેરાશથી "ચલિત થવું" છેએસ.ડી. સંશોધકને જણાવે છે કે પ્રત્યુત્તરો કેવી રીતે ફેલાય છે - શું તેઓ મધ્યમ, અથવા વિખેરાયેલા દૂરના ભાગમાં ધ્યાન કેન્દ્રિત કરે છે? શું તમારા બધા પ્રતિવાદીઓ તમારા ઉત્પાદનને તમારા સ્કેલના મધ્યમાં દર્શાવે છે, અથવા કેટલાકએ તેને મંજૂર કર્યું છે અને કેટલાક તેને નકાર્યું છે? એક એવા પ્રયોગ પર વિચાર કરો કે ઉત્તરદાતાઓને 5-પોઇન્ટ સ્કેલ પર શ્રેણીબદ્ધ લક્ષણો પર ઉત્પાદનને રેટ કરવા માટે કહેવામાં આવે છે. "પૈસા માટે સારી કિંમત" માટે દસ ઉત્તરદાતાઓ (નીચે 'એ' મારફતે લેબલ 'એ') માટેનો અર્થ એ હતો કે 3. 0 ની એસ.ડી. સાથે. 4 અને "ઉત્પાદન વિશ્વસનીયતા" માટેનો અર્થ 3. 4 2 ની એસ.ડી. સાથે. 1. પ્રથમ નજરમાં (ફક્ત અર્થ તરફ જોવું) એવું જણાય છે કે વિશ્વસનીયતા મૂલ્ય કરતા વધારે રેટ કરવામાં આવી હતી. પરંતુ વિશ્વસનીયતા માટેનો ઊંચો SD સૂચવે છે (નીચે વિતરણમાં દર્શાવ્યા પ્રમાણે) તે પ્રતિભાવો ખૂબ ધ્રુવીકરણ હતા, જ્યાં મોટાભાગના પ્રતિવાદીઓ પાસે કોઈ વિશ્વસનીયતાના મુદ્દાઓ (કોઈ વિશેષતા "5") નથી, પરંતુ ઉત્તરદાતાઓના એક નાનો પરંતુ મહત્વનો સેગમેન્ટ વિશ્વસનીયતા સમસ્યા અને લક્ષણ "1" ને રેટ કર્યું સરેરાશ એકલાને જોતા વાર્તાનો માત્ર ભાગ જ કહે છે, જો કે, વધુ વખત ન કરતાં, આ જ સંશોધકો ધ્યાન કેન્દ્રિત કરે છે. પ્રતિસાદોનું વિતરણ ધ્યાનમાં લેવાનું મહત્વપૂર્ણ છે અને એસડી તેના મૂલ્યવાન વર્ણનાત્મક માપને પૂરું પાડે છે. પ્રતિસાદ

પૈસા માટે સારા ભાવ

ઉત્પાદન વિશ્વસનીયતા

3 1 બી
3 1 C
3 < 1 ડી 3
1 4
5 એફ 4
5 જી 3
5 એચ 3
5 હું 3
5 જે 3
5 સરેરાશ 3 2
3 4 ધો. દેવ 0 4
2 1 પ્રથમ સર્વે: 5-બિંદુના સ્કેલ પર પ્રોડક્ટને રેટિંગ આપનારા ઉત્તરદાતાઓએ 5-બિંદુ રેટિંગ સ્કેલના પ્રતિ પ્રત્યુત્તરોના બે જુદા જુદા ડિસ્ટ્રીબ્યુશન સમાન અર્થ મેળવી શકે છે. બે અલગ અલગ રેટિંગ્સ માટે પ્રતિસાદ મૂલ્યો દર્શાવતા નીચેના ઉદાહરણનો વિચાર કરો.
પ્રથમ ઉદાહરણમાં (રેટિંગ "એ"), એસડી શૂન્ય છે કારણ કે બધા જવાબો બરાબર સરેરાશ મૂલ્ય છે. વ્યક્તિગત પ્રતિસાદો એ સરેરાશથી બધાને ચલિત થતાં નથી. રેટિંગ "બી" માં, તેમ છતાં જૂથનો અર્થ એ જ (3. 0) પ્રથમ વિતરણ તરીકે છે, સ્ટાન્ડર્ડ વિચલન વધારે છે. 1. 15 ના સ્ટાન્ડર્ડ વિચલન બતાવે છે કે વ્યક્તિગત પ્રતિસાદ, સરેરાશ * પર, મધ્યમથી થોડો વધારે 1 પોઇન્ટ દૂર હતા. પ્રતિસાદ

રેટિંગ "એ"

રેટિંગ "બી"

3

1 બી 3
2 સી 3
2 ડી 3
3 3
3 એફ 3
3 જી 3 > 3
એચ 3 4
હું 3 4
જે 3 5
સરેરાશ 3 0 3 0
ધો. દેવ 0 00 1 15
બીજું સર્વેઃ ઉત્તરદાતાઓ 5 પોઈન્ટના સ્કેલ પરના ઉત્પાદનને રેટિંગ આપે છે. સીપીમાં જોવાની અન્ય રીત એ છે કે વિતરણની પ્રતિક્રિયાઓના હિસ્ટોગ્રામ તરીકે કાવતરું છે. નીચા એસડી સાથેનું વિતરણ ઊંચું સાંકડી આકાર તરીકે દર્શાવશે, જ્યારે વિશાળ એસડીને વિશાળ આકાર દ્વારા સૂચવવામાં આવશે. એસડી સામાન્ય રીતે "સાચું કે ખોટું" અથવા "વધુ સારું કે ખરાબ" સૂચવતું નથી - એક નીચલું એસડી જરૂરી વધુ ઇચ્છનીય નથી. તેનો સ્પષ્ટ વર્ણનાત્મક આંકડા તરીકે ઉપયોગ થાય છે. તે સરેરાશ સંબંધમાં વિતરણનું વર્ણન કરે છે. ટી
એસડી સાથે સંકળાયેલો ઇકોનિકલ ડિસ્ક્લેમર એસડીને "સરેરાશ વિચલન" તરીકે સમજવું એ તેનો અર્થ સમજવા માટે એક ઉત્તમ રીત છે. જો કે, તે વાસ્તવમાં સરેરાશ તરીકે ગણવામાં આવતો નથી (જો તે હોય, તો અમે તેને "સરેરાશ વિચલન" કહીશું). તેના બદલે, તે "પ્રમાણિત" છે, ચોરસનાં સરવાળાનો ઉપયોગ કરીને મૂલ્યની ગણતરી કરવા માટેની કેટલીક જટિલ પદ્ધતિ. વ્યાવહારિક હેતુઓ માટે, ગણતરી મહત્વપૂર્ણ નથી મોટા ભાગના કોષ્ટક કાર્યક્રમો, સ્પ્રેડશીટ્સ અથવા અન્ય ડેટા મેનેજમેન્ટ સાધનો તમારા માટે SD ની ગણતરી કરશે. વધુ મહત્વનું છે તે સમજવા માટે આંકડા શું વહન.

સ્ટાન્ડર્ડ એરર

પ્રમાણભૂત ભૂલ એ

અનુમાનિત

આંકડાઓ છે જે સમગ્ર વસતીમાં નમૂનાના સરેરાશ (સરેરાશ) ની તુલના કરતી વખતે વપરાય છે. નમૂના માપનો ચોકસાઇ

તે માપનો છે નમૂનોનો અર્થ એ છે કે તે માહિતીમાંથી મેળવેલ આંકડાઓને અંતર્ગત વિતરણ હોય છે. આપણે તેને એક જ પ્રયોગ કર્યો છે અને માત્ર એક જ મૂલ્ય ધરાવે છે, કારણ કે અમે તેને માહિતીની જેમ જ વિઝ્યુઅલાઈઝ કરી શકતા નથી. આંકડાશાસ્ત્રીય સિદ્ધાંત જણાવે છે કે નમૂનાનો અર્થ (મોટા "પર્યાપ્ત" નમૂના માટે અને અમુક નિયમિત શરતો હેઠળ) લગભગ સામાન્ય રીતે વિતરણ કરવામાં આવે છે. આ સામાન્ય વિતરણના પ્રમાણભૂત વિચલન તે છે જેને આપણે પ્રમાણભૂત ભૂલ કહીએ છીએ.

આકૃતિ 2.

તળિયે વિતરણ નીચે

ડેટાના વિતરણને સંતુલિત કરે છે, જ્યારે ટોચની વિતરણ એ નમૂના અર્થના સૈદ્ધાંતિક વિતરણ છે. 20 ની એસ.ડી. ડેટાના પ્રસારનો એક માપદંડ છે, જ્યારે 5 ના SE એ નમૂના સરેરાશની આસપાસ અનિશ્ચિતતાની માપ છે. જ્યારે આપણે સારવાર એ વિરુદ્ધ સારવાર બીના બે-નમૂનાના પ્રયોગમાંથી પરિણામના સાધનોની સરખામણી કરવા માગીએ છીએ, ત્યારે અમારે અંદાજ કાઢવો જરૂરી છે કે આપણે કેવી રીતે માપોની માપણી કરી છે. વાસ્તવમાં, અમે રસ ધરાવીએ છીએ કેવી રીતે અમે બે અર્થ વચ્ચે તફાવત માપવામાં આવ્યા છે. અમે આ માપ તફાવત પ્રમાણભૂત ભૂલ માપવા કહી. તમે જાણવાથી આશ્ચર્ય ન થશો કે નમૂનામાં તફાવતના પ્રમાણભૂત ભૂલ એટલે અર્થોના પ્રમાણભૂત ભૂલોનું કાર્ય છે: હવે તમે સમજી ગયા છો કે સરેરાશ (એસઇ) અને તે પ્રમાણભૂત ભૂલ વિતરણના પ્રમાણભૂત વિચલન (એસડી) બે અલગ અલગ પ્રાણી છે, તમે આશ્ચર્ય પામી રહ્યા હોઈ શકે છે કે તેઓ પ્રથમ સ્થાને મૂંઝવણ કેવી રીતે મેળવ્યાં. જ્યારે તેઓ કલ્પનાત્મક રીતે અલગ પડે છે, તેઓ પાસે ગાણિતિક રીતે સરળ સંબંધ છે: , જ્યાં n એ ડેટા બિર્સની સંખ્યા છે

નોંધ લો કે પ્રમાણભૂત ભૂલ બે ઘટકો પર આધારિત છે: નમૂનાનું પ્રમાણભૂત વિચલન, અને નમૂનાનું કદ n . આનો અંતઃપ્રેરિત અર્થ છે: નમૂનાના પ્રમાણભૂત વિચલન મોટા, અમે સાચા અર્થના અમારા અંદાજ વિશે ઓછા ચોક્કસ હોઈ શકીએ છીએ.

વધુમાં, મોટા નમૂનાનો કદ, વસ્તી વિશે અમારી પાસે વધુ માહિતી છે અને વધુ ચોક્કસપણે અમે સાચા અર્થનો અંદાજ મેળવી શકીએ છીએ.

એસઇ સરેરાશની વિશ્વસનીયતાનું સૂચક છે. એક નાનો એસઈ એ સંકેત આપે છે કે નમૂના અર્થ એ છે કે વાસ્તવિક વસ્તીનો વધુ સચોટ પ્રતિબિંબ છે.એક મોટું નમૂનાનું કદ સામાન્ય રીતે નાના એસ.ઇ. (જયારે એસ.ડી.નું નમૂનાનું કદ સીધું અસર થતું નથી) પરિણમે છે.

મોટાભાગના મોજણી સંશોધનમાં વસ્તીના નમૂનાનું ચિત્ર દોરવાનો સમાવેશ થાય છે. પછી અમે તે નમૂના પરથી મેળવેલા પરિણામોમાંથી વસ્તી વિશેની માહિતી બનાવીએ છીએ. જો બીજો નમૂનો દોરવામાં આવ્યો હોય તો પરિણામો કદાચ પ્રથમ નમૂના સાથે બરાબર મેળ ખાશે નહીં. જો રેટિંગ એટ્રીબ્યુટ માટે સરેરાશ મૂલ્ય 3 હતું. એક નમૂના માટે 2, તે 3 હોઇ શકે. 4 એ જ કદના બીજા નમૂના માટે. જો આપણે આપણી વસ્તીમાંથી અનંત સંખ્યાના નમૂનાઓ (સમાન કદના) નું નિર્માણ કરવાના હતા, તો અમે વિતરણ તરીકે અવલોકનના અર્થને પ્રદર્શિત કરી શકીએ છીએ. અમે પછી અમારા નમૂના અર્થ બધા સરેરાશ ગણતરી કરી શકે છે. આનો અર્થ સાચી વસ્તીનો અર્થ બરાબર થાય. અમે નમૂના અર્થના વિતરણના SD નું પણ ગણતરી કરી શકીએ છીએ. નમૂનાનો આ વિતરણનો એસ.ડી એનો અર્થ એ છે કે દરેક વ્યક્તિગત નમૂનાનું સરેરાશ એટલે સરેરાશ.

આમ, અમારું સૌથી વધુ મહત્વનું અવલોકન છે:

એસઇ એ વસતીના સરેરાશનો એસડી છે નમૂના સરેરાશ

પ્રથમ

3 2

2ND

3 4 ત્રીજી

3. 3 4 થી
3 2 5 મી
3 1 ….
…. ….
…. ….
…. ….
…. ….
…. સરેરાશ
3 3 ધો. દેવ
0 13 એસ.ડી. અને એસઇ વચ્ચેનો સંબંધ દર્શાવતો કોષ્ટક હવે સ્પષ્ટ છે કે જો આ વિતરણના SD એ સમજવા માટે મદદ કરે છે કે સાચા વસતીના અર્થના નમૂનાનો અર્થ કેટલી છે, તો આપણે તેનો ઉપયોગ કેવી રીતે કરવો તે સમજવા માટે કરી શકીએ છીએ. સચોટ કોઈપણ વ્યક્તિગત નમૂનાનો અર્થ સાચું અર્થના સંબંધમાં છે. તે SE નો સાર છે.
વાસ્તવિકતામાં, અમે ફક્ત અમારી વસતીમાંથી એક જ નમૂનો દોર્યો છે, પરંતુ અમે આ પરિણામનો ઉપયોગ અમારા સબ્જેક્ટ નમૂના અર્થના વિશ્વસનીયતાના અનુમાન માટે કરી શકીએ છીએ.
હકીકતમાં, એસઇ અમને જણાવે છે કે આપણે 95 ટકા વિશ્વાસ ધરાવી શકીએ છીએ કે અમારા સેમ્પલનો સરેરાશ અર્થ વત્તા અથવા ઓછા આશરે 2 છે (વાસ્તવમાં 1. 96) વસ્તીના અર્થથી સ્ટાન્ડર્ડ એરર્સ. નીચે આપેલ કોષ્ટક અમારા સંશોધન માટે ઉપયોગમાં લેવાયેલી અમારા પ્રથમ (અને ફક્ત) નમૂનામાંથી પ્રતિસાદોનું વિતરણ દર્શાવે છે. 0. 13 ના સે, પ્રમાણમાં નાની છે, તે અમને સંકેત આપે છે કે અમારો અર્થ અમારી એકંદર વસ્તીના સાચા અર્થના પ્રમાણમાં નજીક છે. અમારા અર્થ માટે (આશરે 95% આત્મવિશ્વાસ પર) ગાળો (આશરે) બે વાર તે મૂલ્ય (+/- 0. 26), એ સાચું અર્થ એ છે કે 2. 94 અને 3 વચ્ચેની સંભાવના છે. 46.
પ્રતિસાદદા

રેટિંગ

3

બી

3

C

3
ડી 3
4
એફ 4
જી 3
એચ 3
હું 3
જે 3
મીન > 3 2 ધો. ભૂલ
0 13
સારાંશ ઘણા સંશોધકો પ્રમાણભૂત વિચલન અને સ્ટાન્ડર્ડ એરર વચ્ચેના ભેદને સમજવામાં નિષ્ફળ જાય છે, ભલે તેઓ સામાન્ય રીતે ડેટા વિશ્લેષણમાં સમાવિષ્ટ હોય. જ્યારે સ્ટાન્ડર્ડ વિચલન અને સ્ટાન્ડર્ડ એરર માટે વાસ્તવિક ગણતરીઓ ખૂબ જ સમાન દેખાય છે, તેઓ બે અત્યંત અલગ, પરંતુ પૂરક, પગલાંનું પ્રતિનિધિત્વ કરે છે. એસડી અમને અમારા વિતરણના આકાર વિશે જણાવે છે, વ્યક્તિગત ડેટા કિંમતો સરેરાશ મૂલ્યમાંથી કેટલી નજીક છે એસઇ અમને જણાવે છે કે એકંદર વસતીના સાચા અર્થમાં અમારો નમૂનાનો અર્થ કેટલી નજીક છે.એકસાથે, તેઓ અમને કહી શકે છે એકલા સરેરાશ કરતાં વધુ સંપૂર્ણ ચિત્ર પૂરી કરવામાં મદદ કરે છે.