B.Sc. BOTANY (C.G.)
Third Year – Second Question Paper
इकाई 5
दीर्घ एवं लघु उत्तरीय प्रश्न
1. निम्नलिखित पर टिप्पणी लिखिए—
(a) जैव सांख्यिकी क्या है? प्रमुख जैव-सांख्यिकी विधियों का वर्णन कीजिए।
(b) जैव सांख्यिकी की श्रेणियाँ।
(c) आयत चित्र या हिस्टोग्राम।
(d) दण्ड चित्र (Bar diagram)।
(e) वृत्त आरेख।
(f) खण्डित तथा अखण्डित (सतत) चर।
(g) संचयी बारंबारता।
(a) जैव सांख्यिकी क्या है? प्रमुख जैव-सांख्यिकी विधियों का वर्णन कीजिए।
जैव सांख्यिकी जीवविज्ञान, चिकित्सा और कृषि में सांख्यिकीय विधियों का उपयोग है, जो जैविक आंकड़ों का संग्रहण, विश्लेषण और व्याख्या करती है। यह आबादी की विभिन्नता, आवृत्ति वितरण और निष्कर्ष निकालने में सहायक है।
प्रमुख विधियाँ:
वर्णनात्मक सांख्यिकी: औसत (mean), मध्यिका (median), प्रमाणांक (mode), विविधता (variance)।
अनुमान सांख्यिकी: विश्वास अंतराल (confidence interval), परिकल्पना परीक्षण (t-test, χ²-test)।
सहसंबंध विश्लेषण: Pearson r, Spearman rank।
रिग्रेशन: रैखिक/गुणात्मक।
(b) जैव सांख्यिकी की श्रेणियाँ।
जैव सांख्यिकी दो मुख्य श्रेणियों में विभाजित है।
वर्णनात्मक (Descriptive): केंद्रीय प्रवणता (mean, median), फैलाव (range, SD), आवृत्ति वितरण।
अनुमानात्मक (Inferential): नमूना से आबादी अनुमान, परिकल्पना परीक्षण, p-value, विश्वास सीमा।
(c) आयत चित्र या हिस्टोग्राम।
आयत चित्र सतत चर (continuous variable) के आवृत्ति वितरण को दर्शाता है, जहाँ लगातार आयतें बिना अंतराल के होती हैं। ऊँचाई आवृत्ति दर्शाती है, चौड़ाई वर्ग अंतराल। उदाहरण: ऊँचाई वर्ग (150-160, 160-170 cm) का वितरण। हिस्टोग्राम वक्र सामान्य वितरण (bell curve) दिखाता है।
(d) दण्ड चित्र (Bar diagram)।
दण्ड चित्र असतत चर (discrete) या वर्गीकृत आंकड़ों के लिए, समान चौड़ाई के दण्डों से आवृत्ति दर्शाता है। दण्डों के बीच अंतराल होता है। उदाहरण: विभिन्न फसलों का उत्पादन (गेहूँ 20 क्विंटल, चावल 15 क्विंटल)। तुलना हेतु उपयुक्त।
(e) वृत्त आरेख।
वृत्त आरेख कुल का प्रतिशत भाग दर्शाता है, जहाँ कोण = (भाग/कुल) × 360°। प्रत्येक खंड वर्ग का प्रतिनिधित्व। उदाहरण: बजट वितरण (शिक्षा 30%, स्वास्थ्य 20%)। अधिकतम 6-7 खंड उपयुक्त।
(f) खण्डित तथा अखण्डित (सतत) चर।
खण्डित चर (Discrete): गणनीय, पूर्णांक मूल्य (जैसे संतान संख्या: 0,1,2)।
अखण्डित/सतत चर (Continuous): अनंत मूल्य, मापा गया (जैसे ऊँचाई 165.5 cm, वजन 65.2 kg)। हिस्टोग्राम सतत के लिए, बार डायग्राम खण्डित के लिए।
(g) संचयी बारंबारता।
संचयी बारंबारता (Cumulative frequency) प्रत्येक वर्ग तक कुल आवृत्ति का योग है (ogive curve)। उदाहरण: 0-10: 5, 10-20: 12 → संचयी 5, 17। उपयोग: मedian/percentile खोज।
2. केन्द्रीय प्रवृत्तियाँ क्या हैं? इनकी परिभाषा तथा गुण-दोषों का वर्णन कीजिए।
केन्द्रीय प्रवृत्तियाँ सांख्यिकीय आंकड़ों के उस एकक प्रतिनिधि मान को कहते हैं जो डेटा समूह का केंद्रीय बिंदु दर्शाता है, अर्थात् जहाँ अधिकांश मान संकेंद्रित होते हैं। ये माध्य (Mean), मध्यिका (Median) और बहुलक (Mode) रूप में व्यक्त होती हैं।
परिभाषाएँ
माध्य (Arithmetic Mean): सभी मानों का योग उनकी संख्या से भाग देने पर प्राप्त औसत मान। सूत्र: Xˉ=N∑X।
मध्यिका (Median): आरोही/अवरोही क्रम में मध्य स्थित मान। सम संख्या में दो मध्य मानों का औसत।
बहुलक (Mode): सबसे अधिक बार आने वाला मान।
गुण-दोष
| माप | गुण | दोष |
|---|---|---|
| माध्य | - सभी मानों पर आधारित। - गणितीय विश्लेषण हेतु उपयुक्त। - परिभाषित सूत्र। | - चरम मानों (outliers) से प्रभावित। - विषम वितरण में भ्रामक। - हमेशा डेटा में नहीं। |
| मध्यिका | - चरम मानों से अप्रभावित। - ग्राफ से ज्ञात। - वास्तविक प्रतिनिधित्व। | - सभी मानों का उपयोग नहीं। - जटिल गणना। - बीजगणितीय उपयोग सीमित। |
| बहुलक | - सामान्य व्यक्ति समझने योग्य। - वर्गीय डेटा हेतु। - चरम मान अप्रभावित। | - एकाधिक/शून्य बहुलक संभव। - गणना जटिल। - सांख्यिकीय उपयोग कम। |
महत्व: तुलना, फैलाव माप, निर्णय लेना। सीमाएँ: विषमता नजरअंदाज।
3. समान्तर माध्य क्या है? इसकी गणना के लिए सूत्र, उदाहरण सहित व्याख्या कर इसके गुण-दोषों का वर्णन कीजिए।
समान्तर माध्य (Arithmetic Mean) केंद्रीय प्रवृत्ति का सबसे महत्वपूर्ण माप है, जो सभी आंकड़ों के योग को उनकी संख्या से भाग देने पर प्राप्त होता है। यह डेटा समूह का औसत प्रतिनिधि मान दर्शाता है।
परिभाषा
समान्तर माध्य वह एकल मान है जो दिए गए पदों के योगफल को पदों की संख्या से विभाजित करने पर प्राप्त होता है। सूत्र:
प्रत्यक्ष विधि: Xˉ=N∑X (जहाँ ∑X = सभी मानों का योग, N = पदों की संख्या)।
लघु विधि (कल्पित माध्य): Xˉ=A+N∑d (A = कल्पित माध्य, d = विचलन)।
पद विचलन विधि (वर्गीकृत): Xˉ=A+N∑fd′×i (d' = पद विचलन, i = वर्गान्तर)।
उदाहरण (प्रत्यक्ष विधि)
मान लीजिए 5 छात्रों के अंक: 45, 50, 55, 60, 70।
Xˉ=545+50+55+60+70=5280=56。
औसत अंक 56 है।
लघु विधि उदाहरण: अंक: 10, 20, 30, 40, 50। कल्पित माध्य A = 30।
d = -20, -10, 0, +10, +20; ∑d=0; Xˉ=30+0=30。
गुण
| गुण | विवरण |
|---|
| गुण | विवरण |
|---|---|
| सरलता | गणना सरल, निश्चित सूत्र। |
| पूर्ण प्रतिनिधित्व | सभी मानों पर आधारित। |
| निश्चितता | एक ही मान सदैव। |
| तुलना आधार | विभिन्न समूहों की तुलना। |
| बीजगणितीय उपयोग | रिग्रेशन, सहसंबंध में उपयोगी। |
दोष
| दोष | विवरण |
|---|---|
| चरम मान प्रभाव | Outliers से विकृत (वेतन: ₹14,000 + ₹3,000 = औसत ₹7,000 भ्रामक)। |
| असमान वितरण | विषम डेटा में गुमराह। |
| गुणात्मक अनुपयुक्त | रंग/नाम पर लागू नहीं। |
| विचित्र परिणाम | 3.5 गाय असंभव। |
| अशुद्ध निष्कर्ष | औसत समान→प्रगति समान धोखा। |
महत्व: सांख्यिकीय विश्लेषण का आधार, फैलाव अध्ययन हेतु। सीमाएँ: एकांकी चित्र की आवश्यकता।
| पुष्पों की संख्या | 0–10 | 10–20 | 20–30 | 30–40 | 40–50 |
|---|---|---|---|---|---|
| पौधों की संख्या | 3 | 13 | 18 | 12 | 5 |
दिए गए डेटा का समान्तर माध्य
दी गई आवृत्ति तालिका:
| पुष्पों की संख्या (वर्ग अंतराल) | पौधों की संख्या (fᵢ) | मध्यबिंदु (xᵢ) | fᵢ × xᵢ |
|---|
| पुष्पों की संख्या (वर्ग अंतराल) | पौधों की संख्या (fᵢ) | मध्यबिंदु (xᵢ) | fᵢ × xᵢ |
|---|---|---|---|
| 0–10 | 3 | 5 | 15 |
| 10–20 | 13 | 15 | 195 |
| 20–30 | 18 | 25 | 450 |
| 30–40 | 12 | 35 | 420 |
| 40–50 | 5 | 45 | 225 |
| कुल | N = 51 | ∑fᵢxᵢ = 1305 |
सूत्र (प्रत्यक्ष विधि): Xˉ=∑fi∑fixi
गणना:
Xˉ=511305=25.588 (लगभग 25.59)।
सत्यापन चरणबद्ध:
विश्लेषण: पुष्पों की औसत संख्या प्रति पौधा लगभग 25.59 है। यह 20-30 वर्ग में अधिक संकेंद्रित है।
5. दिए गए संख्याओं से संक्षिप्त विधि द्वारा समान्तर माध्य की गणना कीजिए—
| प्रतिपाद जड़ों की संख्या | 3–5 | 6–8 | 9–11 | 12–14 | 15–17 | 18–20 |
|---|---|---|---|---|---|---|
| पौधों की संख्या | 2 | 4 | 5 | 3 | 2 | 2 |
दिए गए वर्गीकृत डेटा का समान्तर माध्य (संक्षिप्त विधि/कल्पित माध्य विधि)
दी गई आवृत्ति तालिका:
| प्रतिपाद जड़ों की संख्या (वर्ग अंतराल) | पौधों की संख्या (fᵢ) | मध्यबिंदु (xᵢ) | dᵢ = xᵢ - A | fᵢ × dᵢ |
|---|---|---|---|---|
| 3–5 | 2 | 4 | -3 | -6 |
| 6–8 | 4 | 7 | 0 | 0 |
| 9–11 | 5 | 10 | +3 | +15 |
| 12–14 | 3 | 13 | +6 | +18 |
| 15–17 | 2 | 16 | +9 | +18 |
| 18–20 | 2 | 19 | +12 | +24 |
| कुल | N = 18 | ∑fᵢdᵢ = 69 |
सूत्र (संक्षिप्त विधि): Xˉ=A+N∑fidi
जहाँ:
A = कल्पित माध्य = 10 (9–11 वर्ग का मध्यबिंदु, अधिकांश fᵢ)
dᵢ = xᵢ - A (प्रत्येक मध्यबिंदु से विचलन)
N = कुल आवृत्ति = 18
∑fᵢdᵢ = 69
गणना:
Xˉ=10+1869=10+3.833=13.833
समान्तर माध्य ≈ 13.83 प्रतिपाद जड़ें प्रति पौधा।
चरणबद्ध व्याख्या:
मध्यबिंदु (xᵢ): प्रत्येक वर्ग का मध्य = (निम्न + उच्च सीमा)/2
कल्पित माध्य (A): अधिकतम fᵢ वाले वर्ग का मध्यबिंदु चयनित
विचलन (dᵢ): xᵢ से A घटाया
उत्पाद: fᵢ × dᵢ का योग
माध्य: सूत्र से गणना।
लाभ: गणना सरल, बड़े आंकड़ों हेतु उपयुक्त।
6. दिए गए संख्याओं से समान्तर माध्य की गणना कीजिए—
| बीजों की संख्या | 51–100 | 101–150 | 151–200 | 201–250 | 251–300 |
|---|---|---|---|---|---|
| पैनिकल्स की संख्या | 7 | 9 | 10 | 8 | 5 |
दिए गए वर्गीकृत डेटा का समान्तर माध्य (प्रत्यक्ष विधि)
दी गई आवृत्ति तालिका:
| बीजों की संख्या (वर्ग अंतराल) | पैनिकल्स की संख्या (fᵢ) | मध्यबिंदु (xᵢ) | fᵢ × xᵢ |
|---|---|---|---|
| 51–100 | 7 | 75.5 | 528.5 |
| 101–150 | 9 | 125.5 | 1129.5 |
| 151–200 | 10 | 175.5 | 1755 |
| 201–250 | 8 | 225.5 | 1804 |
| 251–300 | 5 | 275.5 | 1377.5 |
| कुल | N = 39 | ∑fᵢxᵢ = 6594.5 |
सूत्र: Xˉ=N∑fixi
गणना:
Xˉ=396594.5=169.09
समान्तर माध्य = 169.09 बीज प्रति पैनिकल।
चरणबद्ध व्याख्या:
मध्यबिंदु (xᵢ): प्रत्येक वर्ग का मध्य = 2निम्न + उच्च सीमा (उदा. 51+100)/2 = 75.5
उत्पाद: fᵢ × xᵢ का योग = 6594.5
माध्य: कुल योग को कुल आवृत्ति (39) से भाग।
विश्लेषण: औसत बीज संख्या 151-200 वर्ग के निकट है, जहाँ अधिकांश पैनिकल्स (10) हैं।
7. निम्न संख्याओं से पौधों की ऊँचाई का समान्तर माध्य ज्ञात कीजिए—
| पौधों की ऊँचाई (से.मी.) | 21 | 22 | 23 | 24 | 25 | 26 | 27 |
|---|---|---|---|---|---|---|---|
| पौधों की संख्या | 8 | 8 | 6 | 5 | 5 | 3 | 2 |
पौधों की ऊँचाई का समान्तर माध्य (प्रत्यक्ष विधि)
दी गई आवृत्ति तालिका:
| पौधों की ऊँचाई (से.मी.) | पौधों की संख्या (fᵢ) | मध्यबिंदु (xᵢ) | fᵢ × xᵢ |
|---|---|---|---|
| 21 | 8 | 21 | 168 |
| 22 | 8 | 22 | 176 |
| 23 | 6 | 23 | 138 |
| 24 | 5 | 24 | 120 |
| 25 | 5 | 25 | 125 |
| 26 | 3 | 26 | 78 |
| 27 | 2 | 27 | 54 |
| कुल | N = 37 | ∑fᵢxᵢ = 859 |
सूत्र: Xˉ=N∑fixi
गणना:
Xˉ=37859=23.216
समान्तर माध्य = 23.22 से.मी. (लगभग)
चरणबद्ध व्याख्या:
यहाँ प्रत्येक मान अलग-अलग वर्ग है, अतः मध्यबिंदु xᵢ = मान स्वयं।
सभी मानों को उनकी आवृत्तियों से गुणा करना।
योग को कुल पौधों की संख्या (37) से भाग देना।
विश्लेषण: औसत ऊँचाई 23 से.मी. के निकट है, जहाँ अधिकांश पौधे (8+8=16) 21-22 से.मी. की ऊँचाई के हैं।
8. निम्नलिखित आँकड़ों के गणितीय माध्य की गणना कीजिए—
| पौधों की ऊँचाई | 0–10 | 10–20 | 20–30 | 30–40 | 40–50 | 50–60 |
|---|---|---|---|---|---|---|
| पौधों की संख्या | 14 | 23 | 27 | 21 | 15 | 10 |
पौधों की ऊँचाई का समान्तर माध्य (प्रत्यक्ष विधि)
दी गई आवृत्ति तालिका:
| पौधों की ऊँचाई (से.मी.) | पौधों की संख्या (fᵢ) | xᵢ | fᵢ × xᵢ |
|---|---|---|---|
| 0–10 | 14 | 5 | 70 |
| 10–20 | 23 | 15 | 345 |
| 20–30 | 27 | 25 | 675 |
| 30–40 | 21 | 35 | 735 |
| 40–50 | 15 | 45 | 675 |
| 50–60 | 10 | 55 | 550 |
| कुल | N = 110 | ∑fᵢxᵢ = 3050 |
सूत्र: Xˉ=N∑fixi
गणना:
Xˉ=1103050=27.727 से.मी.
समान्तर माध्य = 27.73 से.मी. (लगभग)
चरणबद्ध व्याख्या:
मध्यबिंदु (xᵢ): प्रत्येक वर्ग = 2निम्न + उच्च सीमा (उदा. 0-10 → 5)
उत्पाद: fᵢ × xᵢ = 3050
माध्य: कुल योग को कुल पौधों की संख्या से भाग।
विश्लेषण: औसत ऊँचाई 20-30 से.मी. वर्ग के निकट (27 पौधे), जो सबसे अधिक आवृत्ति वाला है।
9. माध्यिका की परिभाषा दीजिए तथा इसकी गणना के लिए सूत्र उदाहरण सहित लिखिए तथा इसके गुण-दोष भी बताइये।
माध्यिका की परिभाषा
माध्यिका केंद्रीय प्रवृत्ति का वह माप है जो आंकड़ों को आरोही या अवरोही क्रम में लगाने के बाद मध्य स्थित मान दर्शाता है। यह समूह को दो बराबर भागों में विभाजित करती है—आधे मान इससे कम/बराबर, आधे अधिक/बराबर। क्रॉक्स्टन एवं काउडेन के अनुसार: "माध्यिका वह मान है जो श्रेणी को दो समान भागों में बाँटता है।"
गणना के सूत्र एवं उदाहरण
1. असम संख्या (विषम N): मध्य मान
सूत्र: माध्यिका = (2N+1)वां पद
उदाहरण: 7 पौधों की ऊँचाई (सेमी): 18, 20, 22, 24, 26, 28, 30
क्रम: 18, 20, 22, 24, 26, 28, 30
माध्यिका = 4^(वां) पद = 22 सेमी।
2. सम संख्या (सम N): मध्य दो पदों का औसत
सूत्र: माध्यिका = \frac{\text{(N/2)^{वां} + (N/2 + 1)^{वां}}}{2} पदों का औसत
उदाहरण: 6 पौधों की ऊँचाई: 15, 18, 20, 22, 25, 28
क्रम: 15, 18, 20, 22, 25, 28
माध्यिका = 222+25=23.5 सेमी।
3. वर्गीकृत डेटा
सूत्र: माध्यिका = L+f2N−CF×h
(L = निम्न सीमा, CF = संचयी पूर्व आवृत्ति, f = माध्यिका वर्ग आवृत्ति, h = वर्ग चौड़ाई)
उदाहरण: ऊँचाई (सेमी) 20-30: N/2=30, CF=25, f=20, h=10 → माध्यिका ≈ 24.75 सेमी।
गुण
| गुण | विवरण |
|---|---|
| चरम मान अप्रभावित | Outliers से नहीं बदलती। |
| स्थानिक औसत | क्रम पर आधारित, वास्तविक स्थिति दर्शाती। |
| ग्राफ ज्ञात | Ogive से आसानी से। |
| गुणात्मक उपयोग | बुद्धि/सुंदरता मापन हेतु। |
| समझने योग्य | सामान्य व्यक्ति हेतु सरल। |
दोष
| दोष | विवरण |
|---|---|
| अपूर्ण उपयोग | सभी मानों पर आधारित नहीं। |
| बीजगणितीय सीमित | रिग्रेशन में अनुपयुक्त। |
| गणना जटिल | बड़ी श्रेणी में कष्टप्रद। |
| अनुमानित | वास्तविक मान कम संभावित। |
| असमान वितरण | बहुलक विस्थापन संभव। |
महत्व: खुले वितरण, गुणात्मक आंकड़ों हेतु श्रेष्ठ। सीमाएँ: सैद्धांतिक विश्लेषण में कम उपयोगी।
10. निम्नलिखित आँकड़ों की माध्यिका ज्ञात कीजिए—
| पौध ऊँचाई | 0–5, | 5–10, | 10–15, | 15–20, | 20–25 |
|---|---|---|---|---|---|
| पौधों की संख्या | 2 | 3 | 7 | 5 | 3 |
दिए गए वर्गीकृत डेटा की माध्यिका
दी गई आवृत्ति तालिका:
| पौधों की ऊँचाई (से.मी.) | पौधों की संख्या (fᵢ) | संचयी आवृत्ति (CF) |
|---|---|---|
| 0–5 | 2 | 2 |
| 5–10 | 3 | 5 |
| 10–15 | 7 | 12 |
| 15–20 | 5 | 17 |
| 20–25 | 3 | 20 (N) |
सूत्र: माध्यिका = L+(f2N−CF)×h
जहाँ:
N = कुल पौधे = 20
N/2 = 10
L = माध्यिका वर्ग की निम्न सीमा = 10 से.मी. (10-15 वर्ग, क्योंकि CF=5 < 10 ≤ 12)
CF = माध्यिका वर्ग से पूर्व संचयी आवृत्ति = 5
f = माध्यिका वर्ग की आवृत्ति = 7
h = वर्ग चौड़ाई = 5 से.मी.
गणना:
माध्यिका = 10+(710−5)×5
= 10+(75)×5
= 10+3.571
= 13.57 से.मी.
चरणबद्ध व्याख्या:
N/2 = 10 ज्ञात किया
माध्यिका वर्ग = 10-15 (क्योंकि 5 < 10 ≤ 12)
सूत्र में मान डाला: L=10, CF=5, f=7, h=5
गणना द्वारा 13.57 प्राप्त
निष्कर्ष: पौधों की माध्यिका ऊँचाई 13.57 से.मी. है।
11. निम्नलिखित आँकड़ों का माध्यिका निकालिए—
(i) 80, 110, 40, 30, 20, 50, 100, 60, 40, 10, 100, 80, 120, 60, 50, 70
(ii) 51.6, 48.7, 53.3, 49.9, 48.9, 57.6, 52.0, 54.6, 54.0, 53.3
(i) 80, 110, 40, 30, 20, 50, 100, 60, 40, 10, 100, 80, 120, 60, 50, 70
चरण:
कुल आंकड़े N = 16 (सम संख्या)
N/2 = 8वां पद, (N/2 + 1) = 9वां पद
आरोही क्रम: 10, 20, 30, 40, 40, 50, 50, 60, 60, 70, 80, 80, 100, 100, 110, 120
माध्यिका = 28वां+9वां=240+40=40
(ii) 51.6, 48.7, 53.3, 49.9, 48.9, 57.6, 52.0, 54.6, 54.0, 53.3
चरण:
N = 10 (सम संख्या)
N/2 = 5वां पद, (N/2 + 1) = 6वां पद
आरोही क्रम: 48.7, 48.9, 49.9, 51.6, 52.0, 53.3, 53.3, 54.0, 54.6, 57.6
माध्यिका = 251.6+52.0=51.8
निष्कर्ष:
(i) माध्यिका = 40
(ii) माध्यिका = 51.8
12. बहुलक किसे कहते हैं? उदाहरण सहित व्याख्या कर इसके गुण-दोष बताइये।
बहुलक की परिभाषा
बहुलक (Mode) केंद्रीय प्रवृत्ति का वह माप है जो श्रेणी में सबसे अधिक बार दोहराया जाने वाला मान या सर्वाधिक आवृत्ति वाला पद दर्शाता है। यह श्रेणी का सर्वाधिक प्रचलित या सामान्य मान होता है। क्रॉक्सटन एवं काउडेन: "बहुलक वह मूल्य है जिसके चारों ओर श्रेणी की अधिकतम इकाइयाँ केंद्रित होती हैं।"
उदाहरण सहित व्याख्या
उदाहरण 1 (असवर्गीकृत): पौधों की ऊँचाई (सेमी): 20, 22, 22, 24, 25, 22, 26
यहाँ 22 सबसे अधिक बार (3 बार) आया → बहुलक = 22 सेमी।
उदाहरण 2 (वर्गीकृत):
| ऊँचाई (सेमी) | आवृत्ति |
|---|---|
| 10-20 | 5 |
| 20-30 | 12 * |
| 30-40 | 8 |
20-30 वर्ग अधिकतम आवृत्ति (12) → बहुलक वर्ग। सूत्र से: Mode = L+2f1−f0−f2f1−f0×h
गुण
| गुण | विवरण |
|---|---|
| सरल गणना | निरीक्षण/ग्राफ से तत्काल ज्ञात। |
| गुणात्मक उपयोग | रंग, आकार, रोग आदि हेतु उपयुक्त। |
| चरम अप्रभावित | Outliers से अप्रभावित। |
| प्रचलन दर्शक | फैशन/रुचि प्रतिबिंबित। |
| ग्राफ ज्ञात | हिस्टोग्राम से स्पष्ट। |
दोष
| दोष | विवरण |
|---|
| दोष | विवरण |
|---|---|
| अनिश्चितता | सभी समान आवृत्ति → बहुलकरहित। |
| बहु-बहुलक | 2+ बहुलक संभव (Bimodal)। |
| बीजगणितीय सीमित | रिग्रेशन में अनुपयुक्त। |
| अवास्तविक | वास्तविक श्रेणी में अनुपस्थित। |
| नियत नहीं | नमूना परिवर्तन से बदलता। |
महत्व: सामाजिक/बाजार अध्ययन हेतु श्रेष्ठ। सीमाएँ: वैज्ञानिक विश्लेषण में कम उपयोगी।
13. विचरण की परिभाषा, मापन की विधियाँ, इसके उद्देश्य एवं महत्व को समझाइए।
विचरण (Dispersion/Variance) सांख्यिकीय आंकड़ों में व्यक्तियों के बीच भिन्नता या फैलाव की मात्रा को मापता है, जो बताता है कि आंकड़े माध्य से कितने दूर हैं। यह केंद्रीय प्रवृत्ति के पूरक है और डेटा की एकरूपता/विषमता दर्शाता है।
परिभाषा
विचरण आंकड़ों के माध्य से प्रत्येक मान के विचलन का वर्गों का औसत है। सूत्र:
σ² = Σ(X - Xˉ)² / N (जनसंख्या)
s² = Σ(X - Xˉ)² / (N-1) (नमूना)।
मापन की विधियाँ
| विधि | सूत्र | विशेषता |
|---|---|---|
| परास (Range) | R = L - S (L=सर्वाधिक, S=न्यूनतम) | सरल, चरम मान आधारित |
| चतुर्थांश परास (IQR) | Q₃ - Q₁ | मध्य 50% फैलाव |
| माध्य विचलन | MD = Σ|X - Xˉ| / N | औसत विचलन |
| मानक विचलन | σ = √विचरण | माध्य इकाई में |
| विचरण गुणांक | CV = (σ/Xˉ) × 100 | तुलनात्मक (%) |
उदाहरण: ऊँचाई (सेमी): 20,22,24,26 → Xˉ=23, σ=2.45।
उद्देश्य
आंकड़ों की विषमता मापन
विभिन्न समूहों की तुलना (CV से)
विश्वसनीयता जाँच (कम विचरण=विश्वसनीय माध्य)
जीनोटाइप चयन (कृषि में एकरूपता)
गुणवत्ता नियंत्रण
महत्व
कृषि/जैवविज्ञान में:
विविधता संरक्षण (जीन बैंक)
श्रेष्ठ जीनोटाइप चयन (कम CV=उच्च उत्पादक)
पर्यावरण प्रभाव अध्ययन
आनुवंशिक भिन्नता मापन
सांख्यिकीय:
निष्कर्ष: विचरण डेटा की गुणवत्ता का सूचक है; शून्य विचरण असंभव (पूर्ण एकरूपता)।
प्रश्न 14: मानक त्रुटि क्या है? इसके उपयोग को उदाहरण सहित समझाइए।
मानक त्रुटि (Standard Error - SE) नमूना माध्य की अनुमानित सटीकता को दर्शाती है, जो जनसंख्या माध्य के अनुमान की भिन्नता मापती है। यह नमूना मानक विचलन को नमूना आकार के वर्गमूल से भाग देने पर प्राप्त होती है। सूत्र: SE=ns (s = नमूना SD, n = नमूना आकार)।
उपयोग:
नमूना माध्य की विश्वसनीयता जाँच
विश्वास अंतराल निर्माण (95% CI = Xˉ±1.96×SE)
t-परिक्षण में उपयोग
उदाहरण: 25 पौधों का औसत ऊँचाई Xˉ=30 cm, s = 5 cm।
SE=255=1 cm।
95% CI: 30 ± 1.96 = 28.04-31.96 cm। अर्थात् वास्तविक माध्य 95% संभावना से इस अंतराल में।
प्रश्न 15: निम्नलिखित पर टिप्पणी लिखिए
(a) बायोमेट्री (Biometry)
बायोमेट्री जीवविज्ञान में सांख्यिकीय विधियों का अनुप्रयोग है, जो जैविक मापन (ऊँचाई, वजन, फसल उपज) का विश्लेषण करती है। कार्ल पियर्सन ने विकसित। उपयोग: आनुवंशिकता अध्ययन, वनस्पति/प्राणी विविधता।
(b) जैव सांख्यिकी के उपयोगिता एवं कार्य
उपयोगिता: चिकित्सा परीक्षण, महामारी विज्ञान, कृषि सुधार, जीन मैपिंग।
कार्य:
आंकड़ा संग्रह/विश्लेषण
परिकल्पना परीक्षण
पूर्वानुमान मॉडल
जोखिम मूल्यांकन। उदाहरण: COVID वैक्सीन प्रभावशीलता।
प्रश्न 16: चर (Variable) क्या है? इसके प्रकार, मापन विधियाँ तथा महत्व का वर्णन कीजिए।
चर वह गुण/राशि है जो विभिन्न इकाइयों में भिन्न मान धारण कर सकती है।
प्रकार:
गुणात्मक: नाममात्र (लिंग), क्रमिक (रोग तीव्रता)
मात्रात्मक: असतत (संतान संख्या), सतत (ऊँचाई)
मापन विधियाँ (स्तर):
नाममात्र: वर्गीकरण (A/B/O रक्तसमूह)
क्रमिक: क्रम (छोटा/मध्यम/बड़ा)
अंतराल: अंतर मापन (तापमान °C)
अनुपात: शून्य बिंदु (ऊँचाई, वजन)
महत्व: आंकड़ा विश्लेषण आधार, अनुसंधान डिजाइन, सांख्यिकीय परीक्षण चयन।
प्रश्न 17: आँकड़ा (Data) क्या है? इसका वर्गीकरण, आँकड़ों में चरों के माप का स्तर तथा इनके लक्षण को बताइए।
आँकड़ा तथ्यों/राशियों का संग्रह है जो विवरण/तुलना हेतु उपयोगी।
वर्गीकरण:
प्राथमिक: स्वयं संग्रहित (सर्वेक्षण)
द्वितीयक: पहले संग्रहित (सरकारी रिपोर्ट)
चरों के माप स्तर: (ऊपर वर्णित - नाममात्र/क्रमिक/अंतराल/अनुपात)
लक्षण:
| स्तर | लक्षण | उदाहरण |
|---|---|---|
| नाममात्र | वर्गीकरण, क्रम नहीं | लिंग |
| क्रमिक | क्रम, अंतर नहीं | ग्रेड |
| अंतराल | क्रम+अंतर, गुणनखंड नहीं | तापमान |
| अनुपात | पूर्ण, शून्य बिंदु | वजन |
प्रश्न 18: नमूने एवं नमूनों का एकत्रीकरण क्या है? इसकी अनिवार्यता एवं गुण-दोषों पर प्रकाश डालिए।
नमूना जनसंख्या का प्रतिनिधि उपसमूह। एकत्रीकरण: व्यवस्थित चयन प्रक्रिया।
अनिवार्यता:
समय/धन बचत
पूर्ण गणना असंभव
विनाशकारी परीक्षण
गुण:
सस्ता/तेज
पर्याप्त सटीकता
दोष:
नमूना त्रुटि
चयन पूर्वाग्रह
प्रतिनिधित्व समस्या।
प्रश्न 19: नमूनाकरण की विधियाँ (Sampling methods) का वर्णन कीजिए।
| विधि | विवरण |
|---|---|
| यादृच्छिक | लॉटरी/कम्प्यूटर से चयन |
| ** व्यवस्थित** | kᵗʰ इकाई चयन (हर 10ᵃ) |
| समूहज | समूह चयन (गाँव) |
| स्तरीय | जनसंख्या स्तर (उम्र) में अनुपातिक |
| क्लस्टर | निकटतम समूह |
| सुविधा | आसानी से उपलब्ध |
प्रश्न 20: आवृत्ति एवं आवृत्ति वितरण पर टिप्पणी लिखिए।
आवृत्ति: किसी मान/वर्ग की पुनरावृत्ति संख्या।
आवृत्ति वितरण: डेटा को वर्गों में बाँटकर आवृत्ति तालिका।
प्रकार:
साधारण: निरपेक्ष (f), सापेक्ष (%)
संचयी: क्रमिक योग
महत्व:
वितरण पैटर्न दर्शाता
ग्राफ निर्माण आधार
माध्यिका/बहुलक गणना। उदाहरण: ऊँचाई वर्गों की आवृत्ति तालिका।
प्रश्न 21: जैव-सांख्यिकी में कम्प्यूटर की उपयोगिता को समझाइए।
कम्प्यूटर जैव-सांख्यिकी में विशाल आंकड़ों के त्वरित विश्लेषण, जटिल गणनाओं और ग्राफिकल प्रस्तुति हेतु आवश्यक है। यह मैनुअल गणना की त्रुटियों को समाप्त करता है।
उपयोगिता:
आंकड़ा प्रबंधन: Excel/SPSS में लाखों आंकड़े संग्रह/सफाई।
सांख्यिकीय विश्लेषण: t-test, ANOVA, रिग्रेशन स्वतः।
जीनोमिक्स: GWAS, BLAST अनुक्रम तुलना।
विज़ुअलाइज़ेशन: R/Python में हिस्टोग्राम, बॉक्स प्लॉट।
मशीन लर्निंग: कैंसर निदान, फसल पूर्वानुमान।
उदाहरण: 10,000 जीन एक्सप्रेशन डेटा का PCA विश्लेषण मिनटों में।
प्रश्न 22: काई-स्क्वेयर परीक्षण (Chi-Square test) को परिभाषित करते हुए इसकी उपयोगिता, परीक्षण पूर्व आवश्यकताएँ तथा काई-स्क्वेयर मान निर्धारण को उदाहरण सहित समझाइए।
परिभाषा: χ² परीक्षण वर्गीकृत (categorical) आंकड़ों में अवलोकित (O) और अपेक्षित (E) आवृत्तियों के बीच महत्वपूर्ण अंतर जाँचता है। सूत्र: χ2=∑Ei(Oi−Ei)2
उपयोगिता:
स्वतंत्रता जाँच (दवा प्रभाव)
सदृशता परीक्षण (मendel आनुवंशिकी)
अच्छाई परीक्षण (सामान्य वितरण)
पूर्व आवश्यकताएँ:
वर्गीकृत डेटा
अपेक्षित आवृत्ति ≥5 प्रत्येक कक्ष
स्वतंत्र अवलोकन
नमूना यादृच्छिक
उदाहरण (3:1 अनुपात जाँच):
मान लीजिए 160 बीज: 120 गोल (O1), 40 झुर्रीदार (O2)। अपेक्षित E1=120, E2=40।
| वर्ग | O | E | (O-E)²/E |
|---|---|---|---|
| गोल | 120 | 120 | 0 |
| झुर्री | 40 | 40 | 0 |
| कुल | χ²=0 |
निर्धारण:
तालिका बनाएँ
प्रत्येक कक्ष: E(O−E)2
योग = χ²
स्वतंत्रता = (r-1)(c-1)
p-value तालिका से/सॉफ्टवेयर
वास्तविक उदाहरण: O: 130 गोल, 30 झुर्री → χ²=2.5, df=1, p>0.05 → 3:1 अनुपात स्वीकार्य।
निष्कर्ष: χ² जैव-सांख्यिकी में आनुवंशिक/चिकित्सा अनुसंधान का आधार।
23. किसी शोधकर्ता द्वारा मटर के पौधों पर द्विसंकर परीक्षण संकरण किया गया।
F₂ पीढ़ी में निम्नानुसार पौधे प्राप्त हुए—
| लम्बा पौधा पीला बीज, | लम्बा पौधा हरा बीज, | बौना पौधा पीला बीज, | बौना पौधा हरा बीज |
|---|---|---|---|
| 215 | 195 | 220 | 170 |
द्विसंकर संकरण के नियमानुसार डेटा के पदों के बीच 1:1:1:1 का अनुपात होता है या नहीं, χ² परीक्षण की सहायता से ज्ञात कीजिए कि प्राप्त परिणाम टेस्ट क्रॉस के अनुपात का पालन करते हैं अथवा नहीं।
χ² परीक्षण: द्विसंकर टेस्ट क्रॉस (1:1:1:1 अनुपात)
परिकल्पना (H₀): प्राप्त आंकड़े 1:1:1:1 अनुपात का पालन करते हैं।
अवलोकित (O) एवं अपेक्षित (E) आवृत्तियाँ
कुल पौधे = 215 + 195 + 220 + 170 = 800
अपेक्षित अनुपात प्रत्येक = 800/4 = 200
| फेनोटाइप | O (अवलोकित) | E (अपेक्षित) | O-E | (O-E)² | (O-E)²/E |
|---|---|---|---|---|---|
| लम्बा-पीला | 215 | 200 | 15 | 225 | 1.125 |
| लम्बा-हरा | 195 | 200 | -5 | 25 | 0.125 |
| बौना-पीला | 220 | 200 | 20 | 400 | 2.000 |
| बौना-हरा | 170 | 200 | -30 | 900 | 4.500 |
| कुल | 800 | 800 | χ² = 7.75 |
χ² मान = 7.75
स्वतंत्रता गिन्ती (df)
df = (वर्गों की संख्या - 1) = 4 - 1 = 3
χ² तालिका मान (α = 0.05)
| df | χ²₀.₀₅ |
|---|---|
| 3 | 7.815 |
निर्णय: गणितीय χ² = 7.75 < तालिका χ² = 7.815
p > 0.05 → H₀ स्वीकार
निष्कर्ष
प्राप्त परिणाम 1:1:1:1 अनुपात का पालन करते हैं। अंतर संयोगजन्य (chance) है। जीन स्वतंत्र रूप से असॉर्ट हो रहे हैं।
प्रश्न 24: सार्थकता परीक्षण (Test of Significance) की उदाहरण सहित व्याख्या कीजिए।
सार्थकता परीक्षण सांख्यिकीय परिकल्पना परीक्षण है जो यह निर्धारित करता है कि अवलोकित अंतर संयोगजन्य है या वास्तविक प्रभाव। H₀ (null): कोई अंतर नहीं; H₁ (alternative): अंतर सार्थक। p-value < α (0.05) होने पर H₀ अस्वीकार।
चरण:
H₀/H₁ प्रतिपादित
परीक्षण सांख्यिकी गणना
क्रिटिकल मान/p-value
निर्णय
उदाहरण (t-test): नई खाद A: औसत उपज 25 क्विंटल, पुरानी B: 22 क्विंटल (n=30 प्रत्येक)।
t = 2.8, df=58, p<0.01 → नई खाद सार्थक बेहतर।
प्रश्न 25: उपयुक्त उदाहरण में, क्या दवा लेने वाले समूह में रक्तचाप में कमी की दर प्लेसिबो लेने वाले समूह से अधिक है?
उदाहरण डेटा (काल्पनिक लेकिन यथार्थवादी):
| समूह | रोगी संख्या | औसत कमी (mmHg) | मानक विचलन |
|---|---|---|---|
| दवा | 50 | 15.4 | 4.2 |
| प्लेसिबो | 50 | 7.4 | 3.8 |
स्वतंत्र t-test:
t = 9.85, df=98, p < 0.001
हाँ, दवा समूह में कमी सार्थक रूप से अधिक (8 mmHg अंतर)। प्लेसिबो प्रभाव से अधिक वास्तविक औषधीय प्रभाव।
प्रश्न 26: विचरण गुणांक का सविस्तार वर्णन करते हुए इसकी उपयोगिता को लिखिए।
विचरण गुणांक (Coefficient of Variation - CV) फैलाव का सापेक्ष माप है।
सूत्र: CV=(Xˉσ)×100% (σ=मानक विचलन, Xˉ=माध्य)
वर्णन:
माध्य इकाई में SD व्यक्त करता
विभिन्न इकाइयों/माध्यों की तुलना संभव
प्रतिशत रूप (%)
उदाहरण तुलना:
| फसल | उपज (क्विंटल/हेक्टेयर) | SD | CV (%) |
|---|---|---|---|
| गेहूँ A | 30 | 3 | 10 |
| गेहूँ B | 25 | 4 | 16 |
| चावल | 40 | 8 | 20 |
A सबसे एकरूप (कम CV)।
उपयोगिता:
तुलना: विभिन्न माध्य वाली श्रेणियों में
जोखिम मूल्यांकन: कम CV=कम जोखिम (निवेश/कृषि)
गुणवत्ता नियंत्रण: औषधि उत्पादन में एकरूपता
चयन: नस्ल सुधार में स्थिर जीनोटाइप
सामान्यीकरण: माध्य के सापेक्ष फैलाव।
सीमाएँ: ऋणात्मक माध्य, शून्य माध्य पर अनुपयुक्त।



0 टिप्पणियाँ