મધ્ય વલણ અને વિક્ષેપ વચ્ચેનો તફાવત

Anonim

સેન્ટ્રલ વલણ વિ ભંગાણ

વર્ણનાત્મક અને અનુમાનિત આંકડામાં, કેટલાંક સૂચકાંકોનો ઉપયોગ તેના કેન્દ્રિય અનુરૂપ ડેટ્સનું વર્ણન કરવા માટે કરવામાં આવે છે. વલણ, વિખેર, અને અસ્થિરતા: ત્રણ સૌથી મહત્વની મિલકતો કે જે માહિતી સમૂહના વિતરણના સંબંધિત આકાર નક્કી કરે છે.

કેન્દ્રીય વલણ શું છે?

કેન્દ્રિય વલણ મૂલ્યોના વિતરણના કેન્દ્રનો ઉલ્લેખ કરે છે અને તેનું સ્થાન લઈ લે છે. ડેટા સેટની કેન્દ્રીય વલણના વર્ણનમાં સરેરાશ, મોડ અને મધ્ય એ સૌથી વધુ ઉપયોગમાં લેવાતા સૂચકાંકો છે. જો ડેટા સમૂહ સમપ્રમાણ હોય તો, સરેરાશ અને સરેરાશ સમૂહ બંને એકબીજા સાથે સંબંધ ધરાવે છે.

ડેટા સેટને જોતાં, સરેરાશ તમામ ડેટા મૂલ્યોનો સરવાળો લઈને અને પછી ડેટાની સંખ્યા દ્વારા તેને વિભાજિત કરીને ગણતરી કરવામાં આવે છે. ઉદાહરણ તરીકે, 10 લોકો (વજનમાં કિલોગ્રામ) ના વજન 70, 62, 65, 72, 80, 70, 63, 72, 77 અને 79 જેટલા માપવામાં આવે છે. પછી દસ લોકો (કિલોગ્રામમાં) ના સરેરાશ વજન હોઈ શકે છે નીચે પ્રમાણે ગણતરી. વજનની રકમ 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710 છે. સરેરાશ = (રકમ) / (માહિતીની સંખ્યા) = 710/10 = 71 (કિલોગ્રામ માં). તે સમજી શકાય છે કે outliers (સામાન્ય રીતે વલણ માંથી ચલિત થતા માહિતી બિંદુઓ) સરેરાશ અસર કરે છે. આ રીતે, આઉટલેઅર્સની હાજરીમાં એકલા ડેટા સમૂહના કેન્દ્ર વિશે યોગ્ય ચિત્ર આપતું નથી.

મધ્ય ડેટા ડેટાના ચોક્કસ મધ્યમાં મળેલો ડેટા બિંદુ છે. સરેરાશ ગણતરી કરવાની એક રીત એ છે કે ડેટા ક્રમાનુસાર ચડતા ક્રમમાં, અને પછી મધ્યમાં ડેટા બિંદુને સ્થિત કરો. ઉદાહરણ તરીકે, જો એકવાર અગાઉના ડેટા સેટને 62, 63, 65, 70, 70, 72, 72, 77, 79, 80 જેવો દેખાય છે. તેથી, (70 + 72) / 2 = 71 એ મધ્યમાં છે આમાંથી, એવું જણાય છે કે મધ્યસ્થ ડેટા સેટમાં હોવું જરૂરી નથી. આઉટલિયરની હાજરીથી મધ્યસ્થ પ્રભાવિત નથી. તેથી, માધ્યમ આઉટલિયરની હાજરીમાં કેન્દ્રીય વલણના વધુ સારા માપદંડ તરીકે સેવા આપશે.

આ મોડ એ ડેટાના સેટમાં સૌથી વધુ વાર આવતું મૂલ્ય છે. પાછલા ઉદાહરણમાં, 70 અને 72 બન્ને વખત બમણો થાય છે અને આમ, બન્ને મોડ્સ છે. આ બતાવે છે કે, કેટલાક વિતરણોમાં, ત્યાં એક કરતાં વધુ મોડલ મૂલ્ય છે. જો ત્યાં માત્ર એક જ સ્થિતિ હોય, તો ડેટા સેટને બિનઆયોજન હોવાનું કહેવાય છે, આ કિસ્સામાં, ડેટા સેટ બાયમોડલ છે.

ફેલાવો શું છે?

વિક્ષેપ વિતરણના કેન્દ્ર વિશેના ડેટાના ફેલાવોનો જથ્થો છે. રેન્જ અને પ્રમાણભૂત વિચલન એ વિખેરાનો સૌથી સામાન્ય રીતે ઉપયોગમાં લેવાતા ઉપાય છે.

આ રેંજ ફક્ત સૌથી વધુ મૂલ્ય બાદબાકી સૌથી ઓછું મૂલ્ય છે. પહેલાંના ઉદાહરણમાં, સૌથી વધુ મૂલ્ય 80 છે અને સૌથી ઓછું મૂલ્ય 62 છે, તેથી રેન્જ 80-62 = 18 છે. પરંતુ શ્રેણી ફેલાવો વિશે પૂરતા પ્રમાણમાં ચિત્ર પૂરું પાડતું નથી.

પ્રમાણભૂત વિચલનની ગણતરી કરવા માટે, પહેલા અર્થથી ડેટા મૂલ્યોના ફેરફારોનું ગણતરી કરવામાં આવે છે. વિચલનોનો રૂટ ચોરસનો અર્થ પ્રમાણભૂત વિચલન તરીકે ઓળખાય છે. પહેલાનાં ઉદાહરણમાં, સરેરાશ (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 અને (79 - 71) = 8. ની રકમ વિચલનના વર્ગ (-1) 2 + (-9) 2 + (-6) 2 + 1 2 +9 2 + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. પ્રમાણભૂત વિચલન √ (366/10) = 6. 05 (કિલોગ્રામમાં) છે. જ્યાં સુધી ડેટા સેટ મોટા પ્રમાણમાં નબળી છે, તેમાંથી તે તારણ કાઢે છે કે મોટાભાગની માહિતી અંતરાલ 71 ± 6 માં છે. 05, અને તે ખરેખર આ ચોક્કસ ઉદાહરણમાં છે.

કેન્દ્રીય વલણ અને વિખેર વચ્ચે શું તફાવત છે?

• સેન્ટ્રલ વલણ, મૂલ્યોના વિતરણના કેન્દ્રનો ઉલ્લેખ કરે છે અને તેનું લક્ષ્ય રાખે છે

• વિક્ષેપ માહિતી સમૂહના કેન્દ્ર વિશેના ડેટાના પ્રસારની રકમ છે.