محاضرات الاحصاء الرياضي 6

(‌أ) خصائص توزيع ستيودنت

E(T) = 0, V(T) = ν/(ν-2) si (ν > 2)

رسم 16 تدرج منحنى ستيودنت حسب درجة الحرية

_§نلاحظ أن منحنى tمتماثل حول المتوسط 0 مما يعني أن لكل نقطة موجبة t نقطة مناظرة لها سالبة حيث المساحة تحت المنحنى على يمين t تساوي المساحة تحت المنحنى علي يسار (–t)، ونكتب t_1-p = - t_p_.

_§بالإضافة إلى ذلك فإن منحنى f(t) يقترب من المنحنى الطبيعي المعياري كلما زادت قيمة ν . وعموما، يعتبر الإحصائيون أن المنحنيان يتطابقان تقريبا عند ν ≥30.

_§في الجداول الاحصائية، تعين نقطة (قيمة المتغيرة) t من خلال νوالمساحة p على يسار t تحت المنحنى
) (p = P(T ≤ t_ν;_p). وأحيانا تحدد النقطة t بدلالة المساحة على يمينها (α = 1 - p) ونكتب : t_p,_ν أو t_α_,_ν_.

2 توزيع فيشر (F)^{^[1]}Distribution F de Fisher-Snédecor

و نقول أن المتغيرة X تتبع توزيع فيشر ب ₁ν و₂ν درجة حرية ونكتب: X ~ F_ν1,_ν2

(‌أ) خصائص توزيع فيشر:

ويظهر من المعادلة تبعية منحنى f(x) بالإضافة ل x إلى كل من ν₁ وν₂ ولذلك تحدد أي نقطة F من خلال ثلاثة معالم: ν₁ وν₂_و p (المساحة تحت المنحنى على يسار النقطة F) ، ونكتب F_p,_ν₁_,_ν2

وفي الغالب تعطي الجداول الإحصائية قيم F عند p = 0.95 وp = 0.99 .

3 خلاصة

يمكن تلخيص أهم ما تضمنه هذا المبحث في الجدول التالي:

التوزيع	المتغيرة العشوائية	أهم ما يجب معرفته عن دالة الكثافة
توزيع ك2 X ~ χ²_ν	إذا كانت Xi متغيرات عشوائية مستقلة كل منها تتبع التوزيع الطبيعي المعياري، و X = X₁^² + X₂^² + . . . + X_ν^² إذن: X ~ χ²_ν	f(x) = 0 si x ≤ 0 E(X) = ν, V(X) = 2ν
توزيع ستيودنت T ~ t_ν	لتكن المتغيرتان العشوائيتان المستقلتان Y وZ حيث Y~ N(0, 1) و χ_ν² Z ~ ؛ إذن: ~ t_ν	E(T) = 0, V(T) = ν/(ν-2) si (ν > 2)
توزيع فيشر X ~ F_ν1,_ν2	إذا كانت لدينا متغيرتان عشوائيتان مستقلتان حيث: X₁~ χ_ν₁² و χ_ν₂² X₂ ~ ، فإن ~ F_ν1,_ν2	f(x) = 0 si x ≤ 0 , ;

المبحث 2. السلوك التقاربي لبعض التوزيعات الاحتمالية

التقارب بين التوزيع الثنائي والتوزيع الطبيعي

الانتقال من متغيرة متقطعة إلى متغيرة مستمرة

التقارب بين التوزيع الثنائي وتوزيع بواسون

نظرية النهاية المركزية

نتناول في هذا المبحث بعض حالات التقارب الذي يحصل بين عدد من التوزيعات الاحتمالية الشهيرة. ونقصد بالتقارب بين توزيعين (الثنائي وبواسون مثلا) أن يعطي التوزيعان نتائج متقاربة بخصوص احتمال معين، مما يعني إمكانية استخدام توزيعين احتماليين (وأحيانا أكثر) لحساب احتمال معين. علما أننا قد تطرقنا من قبل بإيجاز إلى هذا المفهوم عند دراستنا لهذه التوزيعات.

1 التقارب بين التوزيع الثنائي والتوزيع الطبيعي

لندرس السلوك التقاربي لمتغيرة التوزيع الثنائي X~B(n,p) عندما تؤول n إلىأعداد كبيرة جدا.

ليكن X يمثل عدد مرات الحصول على صورة عند رمي قطعة نقدية : مرتين، 4 مرات، 8 مرات، 16 مرات.

2		1		0		Xi
¼		1/2		1/4		P_i
4	3		2		1		0	Xi
1/16	4/16		6/4		4/16		1/16	P_i

8	7	6	5	4	3	2	1	0	Xi
0,004	0,031	0,109	0,219	0,273	0,219	0,109	0,031	0,004	P_i

برسم منحنيات Pi للحالات n = 2 ، n = 4 ، n = 8 ، n =16 يظهر السلوك التقاربي للمتغيرة X .

رسم 19 السلوك التقاربي للتوزيع الثنائي لما p = 0.5

يظهر من مقارنة المنحنيات الأربعة أن زيادة قيمة n تؤدي إلى الحصول على منحنى ذا شكل جرسي ومتماثل حول التوقع µ .

هذه الملاحظة تصدق أيضا في حالة p ≠ 0.5 لكن التحول يكون أكثر بطأ.

من أجل التعميم نعتبر المتغيرة المعيارية z = (x - µ)/σ الملحقة بذات المتغيرة ذات التوزيع الثنائي X . إن السلوك التقاربي لZ الملاجظ في الشكل أسفله هو ما تثبته النظرية التالية:

ونكتبN(0,1) Y ≈.

قاعدة:

في حالةn كبيرة و p غير قريب من 0 يمكن اعتبار التوزيع الثنائي كتقريب جيد للتوزيع الطبيعي. ويعطي التوزيعان نتائج أكثر تقاربا كلما كانت n كبيرة أكثر. ونكتب:

و مما يسرع تقارب التوزيع الثنائي من التوزيع الطبيعي كون p قريب من 0.5 وكقاعدة :

§ عموما نعتبر أن التقريب ملائم عندما np وnq كلاهما أكبر من 5.

§ عدد من الاحصائيين[2] يعتمد قاعدة أخرى هي أن يكون أحد الشرطين التاليين متوفرين:

o npq ≥ 9

o n ≥ 20 , np ≥ 10, nq ≥ 10

في حالة p = 0.5 ، الشرط (1) يتحقق عند n = 36 والثاني عند n = 20.

في حالة p = 0.10 ، الشرطين يتحققان عند n = 100 .

2 الانتقال من متغيرة متقطعة إلى متغيرة متصلة.

لاستخدام التوزيع الطبيعي بدلا من التوزيع الثنائي يعني حساب الاحتمال عن طريق توزيع مستمر بينما المتغيرة متقطعة. من أجل ذلك يتم اعتبار كل قيمة في المتغيرة الأصلية مجالا.

مثال. احتمال 4 نجاحات خلال n تجربة يصاغ كما يلي: P(3.5 ≤ X ≤ 4.5) .

مثال2: نرمي قطعة نقدية 20 مرة. ليكن X عدد مرات الحصول على صورة. أحسب P(X = 8) ثم أدرس إمكانية استخدام نظرية موافر- لابلاس لحساب نفس الاحتمال.

X ~ B(20, 0.5) , P(X = 8) = F(8) – F(7) = 0.2517 – 0.1316 = 0.1201.

لدينا np = 10 >5 وكذلك nq = 10 >5 ، وإذا شئنا استخدام القاعدة الثانية فإننا نجد أيضا أن : n =10، np =10، nq=10، يمكن إذا اعتبار Y = (X-10)/√5 ~ N(0 ,1) . نستخدم المتغيرة المستمرة X* بدلا من X لحساب احتمال المجال المعبر عن القيمة 8 وهو [7.5, 8.5]

3 التقارب بين التوزيع الثنائي وتوزيع بواسون

يعطي توزيع بواسون نتائج قريبة من التوزيع الثنائي لما n ≥ 30 وnp < 5 أو nq < 5

و يستخدم بعض الإحصائيين كشرط لاستعمال قانون بواسون بدلا من القانون الثنائي القاعدة التالية^{^[3]}:

n ≥ 25 و p ≤ 0,1

مثال : 10 %من إنتاج آلة ما يعد تالفا، نأخذ 30 وحدة من انتاج هذه الآلة عشوائيا.

أحسب احتمال أن يكون هناك وحدتان تالفتان.

P(X = 2) = C²₃₀ (0,1²) (0.9²⁸) = 0.22

لدينا n ≥ 25، p ≤ 0.1: لاستعمال توزيع بواسون نحسب أولا قيمة المعلمة (معلمة قانون بواسون)

λ = µ = np =30 * 0,1 = 3

P(2) = λ^x * e ^-^λ/x! = (3² * e ^-3) / 2! = 0.22

4 نظرية النهاية المركزية

لتكن المتغيرات X₁، X₂، . . . . متغيرات عشوائية مستقلة لها نفس التوزيع الاحتمالي بتباين ومتوسط محددين. إذا كانت

S_n = X₁ + X₂ + . . . + X_n(n = 1, 2, . . .),

فإن S_n تتبع التوزيع الطبيعي عندما n →∞ . وبما أن E(S_n) = nµ و σ_Sn = σ√n فإننا تكتب :

في الحقيقة فإن النظرية محققة عندما تكون المتغيرات المستقلة Xi لها نفس المتوسط والتباين حتى ولو لم يكن لها بالضرورة نفس التوزيع، مع العلم أنه توجد صيغ أخرى لهذه النظرية حيث لا يشترط أن يكون للمتغيرات نفس التوزيع الاحتمالي ولا حتى أن تكون مستقلة.

تجدر الإشارة إلى أن نظرية موافر- لابلاس التي تطرقنا إليها سابقا هي حالة خاصة من نظرية النهاية المركزية، ذلك أن متغيرة تتبع القانون B(n, p) يمكن اعتبارها مجموعا لعدد من المتغيرات المستقلة ذات التوزيع البرنولي B(1, p).

5 خلاصة

نظرية النهاية المركزية تنص على أن S_n (متغيرات عشوائية مستقلة لها نفس التوزيع الاحتمالي بتباين ومتوسط محددين ) تتبع التوزيع الطبيعي عندما n →∞ بمتوسط E(S_n) = nµ و σ_Sn = σ√n ونكتب:

الرسم البياني التالي يبين القواعد المستخدمة كشروط للتقريب بين التوزيعات الاحتمالية المذكورة آنفا في المبحث بالإضافة إلى التوزيعات الأخرى التي درست في الفصول السابقة (الرمزcr يعني متغيرة معيارية).

الفصل II. نظرية توزيع المعاينة

مفاهيم إحصائية

توزيعات المعاينة للمتوسطات

توزيع المعينة للنسبة

توزيع المعاينة للفروق و المجاميع

توزيع المعاينة للتباين و توزيع المعاينة لنسبة تباينين

تنتشر في مجتمعاتنا المعاصرة عمليات الاستقصاء، ففي عالم الأعمال تقوم المؤسسات عن طريق مصالح التسويق ومصالح البحوث والتطوير بإجراء استقصاءات للإطلاع على توجهات المستهلكين، وفي وسائل الإعلام لا يمر يوم دون أن يعلن عن نتائج استقصاء أجرته مجلة أو جامعة حول مواضيع سياسية أو اجتماعية متعددة، منها الاستقصاءات المثيرة للجدل حول الأراء السياسية للمواطنين أثناء الحملات الانتخابية. فما هي الأسس النظرية الرياضية التي تستند عليها الاستقصاءات المختلفة ؟ أو كيف يمكن الاستدلال من خلال بيانات عينة على خصائص المجتمع الذي أخذت منه؟ الإجابة على هذه الأسئلة و غيرها تتطلب فهم العلاقات الرياضية بين الخصائص المختلفة للمجتمع مثل المتوسط، التباين وغيرها، والخصائص المناظرة لها في العينة وهو ما سنتناوله في هذا الفصل. في الفصول المقبلة سندرس عددا من التطبيقات لهذه العلاقات الرياضية.

المبحث 1. مفاهيم إحصائية

المجتمع والعينة

العينة النفادية والعينة غير النفادية

العينة العشوائية

معالم مجتمع

إحصائية المعاينة

1 المجتمع والعينة Population et échantillon

نشرح هذين المصطلحين من خلال الأمثلة التالية:

· قد ترغب الإدارة العسكرية في تقدير الوزن المتوسط للجندي، فتقوم أخذ أوزان عينة من 100 جندي من بين مجموع الجنود (المجتمع).

· ترغب هيأة معينة بالبحوث السياسية في تقدير نسبة الناخبين المساندين لمرشح معين في 10 الولايات، فتقوم باستجواب 100 ناخب من كل ولاية. الناخبون في الولايات العشر يمثلون المجتمع بينما ال 1000 ناخب المستجوبون يمثلون العينة.

· من أجل معرفة مدى دقة صنع قطعة نقدية ترمى القطعة 100 مرة ونحسب عدد مرات الحصول على الصورة والكتابة، حجم العينة هنا هو 100.

· لتقدير نسبة الكرات داخل صندوق، التي من لون معين، نقوم عدد من المرات بسحب كرة نسجل لونها ثم نعيدها. عدد الكرات المسحوبة يمثل حجم العينة.

نلاحظ أن مصطلح المجتمع يقصد به القياسات أو القيم وليس الأفراد أو الأشياء التي تم قياسها (مجتمع الأوزان، مجتمع آراء الناخبين..)، كما أن المجتمع قد يكون محدودا أو غير محدود (نتائج رميات قطعة النقد)، أما العينة فهي عادة تكون محدودة، ونرمز عادة لحجم المجتمع ب N، ولحجم العينة ب n.

2 العينة النفادية والعينة غير النفادية Echantillon exhaustif et non exhaustif

عندما يكون السحب بالإرجاع حيث يمكن أن تظهر المفردة أكثر من مرة في العينة، نسمي هذه المعاينة غير نفادية لأن تكرار العملية لا يؤدي إلى تقليص عدد المفردات في المجتمع، والعكس نسمي المعاينة بدون إرجاع معاينة نفادية. هناك فرضيتان تتكرران في عدد من العلاقات الرياضية التي سنراها لاحقا، هما فرضية أن قيم مفردات العينة مستقلة والمجتمع لانهائي. يتحقق شرط الاستقلال إذا كانت المعاينة غير نفادية، وإذا كانت كذلك، يمكن اعتبار المجتمع مجتمعا غير محدود.

3 العينة العشوائية Echantillon aléatoire

من أجل أن تكون العينة ممثلة للمجتمع، أحد الطرق المستخدمة هي العينة العشوائية. نظريا (قد يصعب تحقيق ذلك في الواقع)، نقول عن عينة أنها عشوائية إذا كان لكل مفردة في المجتمع نفس الاحتمال لأن تكون في العينة. تسمى هذه العينة بالعينة العشوائية البسيطة. لإنجاز ذلك إما أن نسحب المفردات بطريقة عشوائية أو نرقم مفردات المجتمع ثم نحدد العينة من خلال مجموعة من الأعداد تؤخذ من الجداول الإحصائية للأعداد العشوائية[4].

4 معالم المجتمع Paramètre d’une population

نقصد بمعالم المجتمع مجموعة من خصائصه مثل المتوسط، التباين، معامل التماثل، ... من خصائص المجتمع أيضا طبيعة توزيعه الاحتمالي f(x) كأن يكون طبيعيا أو غيره.

5 إحصائية المعاينة Statistique de l’échantillonnage

لتقدير معالم المجتمع (متوسط المجتمع µ، تباين المجتمع σ² النسبة p...) ننطلق من بيانات العينة، حيث نحتاج إلى حساب معالم مثل متوسط العينة m ، تباين العينةS² ، النسبة في العينةp’ . بصفة عامة، نسمي كل قيمة تحسب انطلاقا من بيانات العينة من أجل تقدير قيمة معالم المجتمع إحصائية المعاينة. نظريا (رياضيا) إحصائية المعاينة هي كل دالة في المتغيرات العشوائية التي تمثل القيم المحصل عليها في العينة.

المبحث 2. توزيع المعابنة للمتوسطات

متوسط توزيع المعاينة للمتوسطات

تباين توزيع المعاينة للمتوسطات

طبيعة توزيع المعاينة للمتوسطات

1 متوسط توزيع المعاينة للمتوسطات

مسألة: ليكن المجتمع 1، 3، 5، 6، 8. ما هي القيمة المتوقعة لمتوسط عينة مسحوبة بالإرجاع مكونة من مفردتين (m)؟ أحسب متوسط المجتمع µ. قارن بين m وµ. من أجل تحديد ذلك أحسب جميع الحالات الممكنة للمتوسط m_i حسب كل عينة.

العينات الممكنة العينات الممكنة ذات الحجم n = 2 من مجتمع حجمه 5 عددها: 5*5 =25

العينات الممكنة					المتوسطات الممكنة للعينة (معاينة غ نفادية) m_i
(1, 1)	(3, 1)	(5, 1)	(6, 1)	(8, 1)	1	2	3	3,5	4,5
(1, 3)	(3, 3)	(5, 3)	(6, 3)	(8, 3)	2	3	4	4,5	5,5
(1, 5)	(3, 5)	(5, 5)	(6, 5)	(8, 5)	3	4	5	5,5	6,5
(1, 6)	(3, 6)	(5, 6)	(6, 6)	(8, 6)	3,5	4,5	5,5	6	7
(1, 8)	(3, 8)	(5, 8)	(6, 8)	(8, 8)	4,5	5,5	6,5	7	8

القيمة المتوقعة m ل m_i هي متوسط قيمها وهي m = (∑_i m_i) / 25 = 4,6 .

حساب متوسط المجتمع: µ = (1 + 3 + 5 + 6 + 8)/5 = 4.6

مثال2. أوجد نفس مطالب المثال 1. في حالة السحب بدون إرجاع. العينات الممكنة عددها: C²₅ = 10

العينات الممكنة بدون إرجاع				المتوسطات الممكنة للعينة أو توزيع المعاينة للمتوسطات (معاينة نفادية) m_i
(1, 3)				2
(1, 5)	(3, 5)			3	4
(1, 6)	(3, 6)	(5, 6)		3,5	4,5	5,5
(1, 8)	(3, 5)	(5, 8)	(6, 8)	4,5	5,5	6,5	7

القيمة المتوقعة m ل m_i هي متوسط قيمها وهي:

E(m) = µ_m = (∑_i m_i) / 10 = 4,6

متوسط المجتمع : µ = (1 + 3 + 5 + 6 + 8)/5 = 4.6

نظرية 1. إذا كانت م ع تمثل مجتمع ما وm متغيرة ع تمثل متوسط عينة مسحوبة من ذات المجتمع، فإن القيمة المتوقعة لمتوسط العينة E(M) تكتب كما يلي: E(M) = µ_m = µ

البرهان : لنرمز ب Xi لقيم المتغيرة الأصلية X .

2 تباين توزيع المعاينة للمتوسطات

(‌أ) حالة المعاينة بالإرجاع

مثال. أحسب تباين المجتمع في المسألة 1، أحسب التباين (والانحراف المعياري) لتوزيع المعاينة للمتوسطات σ²_m علما أن العينة مسحوبة بالإرجاع (غ نفادية)، قارن بين تباين المجتمع وتباين متوسطات العينات الممكنة (توزيع المعاينة للمتوسطات).

mi
1	2	3	3,5	4,5
2	3	4	4,5	5,5
3	4	5	5,5	6,5
3,5	4,5	5,5	6	7
4,5	5,5	6,5	7	8

σ²_m= [∑_i (m_i– m)² ]/25 = 2.92;

σ² = [∑_i (x_i– µ)² ]/5 = 5.84

2.92 = 5.84 / 2

هذا المثال يمهد للنظرية التالية:

نظرية 2. إذا كانت م ع تمثل مجتمع ما وm_i متغيرة ع تمثل متوسط عينة مسحوبة من ذات المجتمع بالإرجاع، فإن تباين m_i(تباين توزيع المعاينة للمتوسطات) يكتب كما يلي:

حيث n حجم العينة.

البرهان: لنرمز ب Xi لقيم المتغيرة الأصلية X .

(‌ب) حالة المعاينة بدون إرجاع.

مسألة: في المسألة 1 أحسب تباين المتوسطات الممكنة للعينة σ²_mفي حالة المعاينة بدون إرجاع، قارن بين تباين المجتمع وتباين المتوسطات الممكنة للعينة.

المتوسطات الممكنة للعينة أو توزيع المعاينة للمتوسطات (معاينة نفادية) mi
2
3	4
3,5	4,5	5,5
4,5	5,5	6,5	7

تباين المتوسطات الممكنة للعينة:

σ²_m= [∑_i (m_i– m)² ]/10 = 2.19

تباين المجتمع: σ² = [∑_i (x_i– µ)² ]/5 = 5.84

( أو بطريقة ثانية:

σ² = E(X²) – E(X)²

= (1 + 9 + 25 + 36 + 64) / 5 - 4.6² = 5.84)

المقارنة بين تباين متوسط العينة و تباين المجتمع:

هذا يمهد للنظرية التالية:

نظرية 3. إذا كانت X م ع تمثل مجتمع ما حجمه N وm_i متغيرة ع تمثل متوسط عينة حجمها n مسحوبة من ذات المجتمع بدون إرجاع، فإن تباين m_i(تباين توزيع المعاينة للمتوسطات) يكتب كما يلي:

وتسمى النسبة

معامل الإرجاع.

3 طبيعة توزيع m

ندرس طبيعة توزيع متوسط توزيع المعاينة للمتوسطات من خلال النظريات التالية:

نظرية 4. إذا كان المجتمع موزع طبيعيا بمتوسط µ وتباين σ² فإن متوسط العينة المسحوبة منه يتبع أيضا التوزيع الطبيعي بمتوسط µ وتباين σ²/n، ونكتب m ≈ N(µ, σ²/n)

نظرية 5. (نظرية النهاية المركزية): إذا كان المجتمع الذي تسحب منه العينة ذو متوسط µ وتباين σ² لكن ليس بالضرورة طبيعيا فإن المتغيرة المعيارية ل m أي

تؤول إلى التوزيع الطبيعي المعياري عندما يكون n كبيرا (n ≥ 30) ونكتب:

z ≈ N(0, 1).

في حالة المجتمع محدود والمعاينة نفادية نستبدل العبارة σ/√n ب

عمليا يستخدم الإحصائيين هذه الصيغة المعدلة بمعامل الإرجاع للانحراف المعياري عندما n/N ≥ 0.05

مثال: مجتمع حجمه 900 بمتوسط 20= µ وσ =12 . نستخرج كل العينات الممكنة. أحسب المتوسط والانحراف المعياري لتوزيع المعاينة للمتوسطات في حالة: (1) حجم العينة n = 36، (2) n = 64 .

(1) n = 36 : n/N = 36/900 = 0.04 < 0.05 => σ_m = σ/√n = 12/√36 = 2

E(m) = µ = 20

مثال2. باستخدام معطيات المثال السابق (n = 36) أحسب احتمال أن يكون m محصورا بين 18 و22.

أحسب نفس الاحتمال في حالة n = 64.

4 خلاصة

الجدول التالي يبين أهم خصائص توزيع المعينة للمتوسطات.

الخاصية	المعاينة	المجتمع
E(M) = µ_m = µ	سحب بالإرجاع أو بدون إرجاع	مجتمع ما
	سحب بالإرجاع	مجتمع ما
	سحب بدون إرجاع	مجتمع ما حجمه N
m ≈ N(µ, σ²/n)	سحب بالإرجاع أو بدون إرجاع	مجتمع موزع طبيعيا بمتوسط µ وتباين σ²
≈ N(0, 1)	عندما يكون n كبيرا (n ≥ 30)	مجتمع بمتوسط µ وتباين σ² لكن ليس بالضرورة طبيعيا

المبحث 3. توزيع المعاينة للنسبة

النظرية التالية تبين المتوسط، التباين، و طبيعة التوزيع الإحصائية p' : نسبة خاصية ما في العينة.

نظرية 6 : لتكن X م ع تمثل مجتمع ما غير محدود وموزع طبيعيا حيث p نسبة المفردات في المجتمع ذات صفة معينة، ولتكن p’ م ع تمثل نسبة المفردات ذات الصفة المذكورة في العينة المسحوبة من ذات المجتمع، نحصل على توزيع للإحصائية ’p حيث معالمه E(p') و_'σ_p، هذه المعالم تساوي :

عند n ≥ 30 : (p, σ_p') p’ ≈ N

عندما يكون المجتمع محدودا والمعاينة نفاديه نضرب في معامل الإرجاع عند حساب الانحراف المعياري.

مثال[5]. لاحظت إدارة الجامعة أنه في عينة من 100 طالب، 40 حصلوا أخيرا على شهادة. تريد الإدارة تقدير نسبة الطلبة الذين يحصلون على الشهادة داخل مجال يكون احتماله 90 بالمائة.

P(p₁< p’< p₂) = 0.9 ; n ≥ 30,

نفترض أن N كبير بحيث : n/N < 0.05

المبحث 4. توزيع المعاينة للفروق والمجاميع

متوسط و تباين توزيع المعاينة للفروق و المجاميع

طبيعة توزيع المعاينة للفروق و المجاميع

1 المتوسط والتباين

ليكن لدينا مجتمعين نسحب من كل منهما عينة عشوائية، نحسب في كل عينة محسوبة من المجتمع الأول الإحصائية S₁ ونحسب نفس الاحصائية (المتوسط مثلا أو التباين ...) في كل عينة من المجتمع الثاني ونسميها S₂. إن الفرق S₂ – S₁ يشكل بدوره متغيرة عشوائية لها المتوسط والتباين التاليين:

µ_{S – S2} = µ_S1 – µ_S2 σ²_{S1 – S2} = σ²_S1 + σ²_S2

مثال 1. إذا كانت الاحصائية هي المتوسط فإن:

µ_m_{1 –}_m₂ = µ_m₁ – µ_m₂ = µ₁ – µ₂ σ²_m_{1 –}_m₂ = σ²_m₁ + σ²_m₂ = σ²/n₁ + σ²/n₂

مثال 2. إذا كانت الاحصائية هي النسبة فإن:

µ_p1_–_p2 = µ_p1 – µ_p2 = p₁ – p₂ σ²_p1_–_p2 = σ²_p1 + σ²_p2 = p₁q₁/n₁ + p₂q₂ / n₂

إذا كان الاهتمام هو على مجموع الاحصائيتين بدلا من الفرق بينهما فإن:

µ_{S1 + S2} = µ_S1 + µ_S2 σ²_{S1 + S2} = σ²_S1 + σ²_S2

2 طبيعة توزيع المعاينة للفرق بين متوسطين

نظرية 7 : في حالة≥ 30 n₁ وn₂ ، يقترب توزيع المتغيرة المعيارية للفرق بين متوسطين من التوزيع الطبيعي المعياري. ونكتب: µ_m1_-_m2 ≈ N(0, 1 )

مثال[6] : ليكن المجتمع U₁ : 3، 7، 8. والمجتمع U₂: 2، 4. تحقق من أن :

µ_{U1 – U2} = µ_U1 – µ_U2 ; σ²_{U1 –} _U2 = σ²_U1 + σ²_U2 .

			U₁
	U₁– U₂	3	7	8
U₂	2	1	5	6
	4	-1	3	4

µ_U1 = (3 + 7 + 8)/3 = 6 ; µ_U2 = (2 + 4)/2 = 3 =>

µ_U₁ – µ_U₂ = 6 – 3 = 3

µ_U_{1 –}_U₂ = (1 + 5 + 6 – 1 + 3 + 4)/6 = 3

σ²_U₁ = (3² + 7² + 8²)/3 - 6² = 14/3 ;

σ²_U₂ = (2² + 4²)/2 - 3² =1 => σ²_U1 + σ²_U2 = 17/3

σ²_{U1 – U2}= (1² + 5² + 6² + 1² + 3² + 4²) / 6 - 3² =

(1 + 25 + 36 + 1 + 9 + 16) / 6 - 9 = 17/3

المبحث 5. توزيع المعاينة للتباين وتوزيع المعاينة لنسبة تبايني عينتين

توزيع المعاينة للتباين

توزيع المعاينة لنسبة تباينين

1 توزيع المعاينة للتباين

(‌أ) حالة المعاينة بالإرجاع

مسألة: أحسب تباين المجتمع في المسألة 1، أحسب القيمة المتوقعة لتباين العينة المسحوبة بالإرجاع من خلال متوسط تباينات العينات الممكنة، قارن بين تباين المجتمع والقيمة المتوقعة لتباين العينة.

التباينات الممكنة S²_i
0	1	4	6,25	12,3
1	0	1	2,25	6,25
4	1	0	0,25	2,25
6,25	2,25	0,25	0	1
12,3	6,25	2,25	1	0

(∑_i S²_i)/25 = 73/25 = 2.92 =>E(S²) = 2.92

σ² = E(X²) – E(X)²

= [(1 + 9 + 25 + 36 + 64)/5] - 4.6² = (135/5) - 21 = 5.84

E(S²) = 2.92 = 5.84/2 = σ² (1/n)

نظرية 8 : إذا كانت م ع تمثل مجتمع ما وS² متغيرة ع تمثل تباين عينة مسحوبة بالإرجاع (أو بدون إرجاع من مجتمع غير محدود) حجمها n، فإن :

(عند n ≥ 30 : E(S²) ≈ σ² )

البرهان:

ملاحظة: من النظرية نجد أن: ونقول عن أنه مقدر "غير منحرف" ل σ² ويرمز له ب ‘S² حيث

نظرية 9 : إذا أخذنا عينات عشوائية حجمها n من مجتمع طبيعي، فإن :

مثال : ليكن مجتمع طبيعي حجمه 100 نسحب منه عينة حجمها n = 16 . ما هو احتمال أن يكون تباين العينة S² أقل من أو يساوي 10 علما أن تباين المجتمع 80.

من الجدول P(X²₁₅ ≤ 2) < 0.005

(‌ب) حالة المعاينة بدون إرجاع

التباينات الممكنة S²_i
1
4	1
6,25	2,25	0,25
12,3	6,25	2,25	1

مسألة: في المسألة 1 أحسب تباين المتوسطات الممكنة للعينة σ²_mفي حالة المعاينة بدون إرجاع، قارن بين تباين المجتمع وتباين المتوسطات الممكنة للعينة.

(∑_i S²_i) = 36.5 ; (∑_i S²_i)/10 = 3.65 => E(S²) = 3.65

σ² = E(X²) – E(X)²

= [(1 + 9 + 25 + 36 + 64)/5] - 4.6² = 5.84

E(S²) = 3.65 = 5.84*(5/4) (1/2)

= σ² * [(n-1)/ n] [N/ (N-1)]

نظرية 10 : إذا كانت م ع تمثل مجتمع ما محدود وS² متغيرة ع تمثل تباين عينة نفادية مسحوبة من ذات المجتمع، فإن القيمة المتوقعة لتباين العينة تكتب:

(عندما يكون N كبير جدا N/ (N-1) تؤول إلى 1)

2 توزيع المعاينة لنسبة تباينين

رأينا في الفصل السابق أن: ~F_ν1,_ν2 في حالة المتغيرتان العشوائيتان مستقلتان
و X₁~ χ_ν₁² و χ_ν₂² X₂ ~ . من النظرية 9 نستنتج ما يلي:

نظرية 12 : ليكن لدينا مجتمعان طبيعيان تبايناهما σ²₁ , σ²₂ . نسحب من المجتمعين عينتين عشوائيتين حجمهما على التوالي n₁ , n₂ :

مثال[7] . عينتين حجمهما 8 و10 مسحوبتين من مجتمعين طبيعيين تبايناهما على التوالي 20 و36. ما احتمال أن يكون تباين الأولى أكبر من ضعف تباين الثانية؟

= P(F_{7, 9}> 3.7)

من الجدول نجد 0.05 > P(F_{7, 9}> 3.7) > 0.01 و في الحقيقة P(F_{7, 9}> 3.7) = 0.036

3 ملحق

(‌أ) الانحراف المعياري لتوزيع المعاينة للتباين

نظرية 11 : إذا كانت X م ع تمثل مجتمع ما وS² متغيرة ع تمثل تباين عينة مسحوبة من ذات المجتمع، فإن:

من أجل n ≥ 100 ، توزيع S² يقترب كثيرا من التوزيع الطبيعي.

(‌ب) الانحراف المعياري لتوزيع المعاينة للانحراف المعياري

من أجل n ≥ 100 ، توزيع S يقترب كثيرا من التوزيع الطبيعي و µ_s ≈ S

4 خلاصة

الجدول التالي يلخص ما ورد في النظريات السابقة من 6 إلى 10 .

الخاصية	المعاينة	المجتمع	إحصائية العينة
		مجتمع موزع طبيعيا غير محدود	النسبة
(p, σ_p') p’ ≈ N	n ≥ 30	مجتمع موزع طبيعيا غير محدود
لحساب σ_p'نضرب في معامل الإرجاع.	المعاينة نفاديه	مجتمع طبيعي محدود
µ_{S – S2} = µ_S1 – µ_S2 µ_{S1 + S2} = µ_S1 + µ_S2 σ²_{S1 – S2} = σ²_S1 + σ²_S2 σ²_{S1 + S2} = σ²_S1 + σ²_S2	سحب بالإرجاع	مجتمع ما	الفرق بين إحصائيتين ما.
µ_m1_-_m2 ≈ N(0, 1 )	≥ 30 n₁ وn₂	مجتمع ما	الفرق بين إحصائيتين ما.
	سحب بالإرجاع (أو بدون إرجاع من مجتمع غير محدود) حجمها n	مجتمع ما وتباين عينة S²	التباين
E(S²) ≈ σ²	n ≥ 30	مجتمع ما وتباين عينة S²
	حجمها n	مجتمع طبيعي
	عينة نفادية	مجتمع ما محدود وS² تمثل تباين العينة
N/ (N-1) تؤول إلى 1	N كبير جدا	مجتمع ما محدود وS² تمثل تباين العينة
	عينتين عشوائيتين حجمهما على التوالي n₁ , n₂	مجتمعان طبيعيان تبايناهما σ²1 , σ²2	نسبة تباينين

الفصل III. نظرية التقدير

مفاهيم أساسية طرق التقدير بمجال طرق تأسيس المقدر

في الفصل السابق درسنا من خلال مجموعة من النظريات العلاقة الرياضية بين معالم العينة والمعالم المناظرة لها في المجتمع مثل المتوسط، التباين، النسبة...كما درسنا العلاقة بين شكل توزيع المجتمع وشكل التوزيع الاحتمالي لمعالم العينة. تظهر هذه العلاقات كتوصيف لخصائص العينة ومعالمها ولكنها تستخدم أكثر لتقدير خصائص ومعالم المجتمع محل الدراسة، وهذا ما سنتعرف عليه في هذا الفصل.

المبحث 1. مفاهيم أساسية

بعض خصائص المقدر

التقدير النقطي، التقدير بمجال

1 بعض خصائص المقدر[8]

لتقدير معلمة من معالم مجتمع محل دراسة، نحتاج إلى اختيار الإحصائية المناسبة في العينة لتقدير هذه المعلمة. غالبا ما تكون المعلمة المناظرة في العينة هي أحسن مقدر، كأن نقدر متوسط المجتمع µ من خلال متوسط العينةµ_m . تسمى الإحصائية المستخدمة في التقدير المقدر.

(‌أ) المقدر غير المتحيز

نقول عن إحصائية ما بأنها مقدر غير متحيز sans biais لمعلمة المجتمع إذا كان متوسطها أو توقعها الرياضي مساويا لمعلمة المجتمع.

مثال: نقول عن متوسط العينة m أنه مقدر غير متحيز لمتوسط المجتمع µ لأن E(m) = µ . في المقابل نسمي الإحصائية S² في معاينة بالإرجاع أنها مقدر متحيز ل σ² لأن E(S²) = σ² (n-1)/n ≠ σ² ، بينما تعتبر الاحصائية= S²n/(n-1) S’² مقدرا غير متحيز في معاينة بالإرجاع.

(‌ب) الكفاءة

تتعلق كفاءة (efficacité) مقدر ما بمقدار التباين لتوزيع المعاينة للإحصائية، فإذا كان لمقدرين (إحصائيتين) نفس المتوسط نقول عن المقدر ذو توزيع المعاينة الأقل تباينا أنه الأكثر كفاءة.

مثال: لكل من توزيعي المعاينة للمتوسط والوسيط نفس المتوسط هو متوسط المجتمعµ ، لكن يعتبر المتوسط m مقدرا أكثر كفاءة لمتوسط المجتمعµ من الوسيط لأن تباين توزيع المعاينة للمتوسطات V(m) = σ²/n أقل من تباين توزيع المعاينة للوسيط :

V(méd) = σ²π/2n = (σ²/n) (3.14159/2) > σ²/n .

من البديهي أن استخدام مقدرات فعالة وغير متحيزة هو الأفضل، إلا أنه قد يلجأ لمقدرات أخرى لسهولة الحصول عليها.

(‌ج) التقارب convergeance

نقول عن مقدر أنه متقارب إذا كان يؤول إلى قيمة المعلمة المقدرة عندما يؤول حجم العينة إلى ما لا نهاية.

مثال: يعتبر متوسط العينة مقدرا متقاربا لمتوسط المجتمع لأن:

2 التقدير النقطي والتقدير بمجال[9].

قد نحتاج إلى تقدير لمعلمة مجتمع بقيمة واحدة ونقول عن هذا التقدير أنه تقدير نقطي، و أحيانا أخرى نحتاج إلى تقدير معلمة المجتمع بنقطتين يحددان مجال لقيمة المعلمة ونقول عن هذا النوع من التقدير أنه تقدير بمجال.

مثال : إذا قدرنا دخل الأسرة في منطقة ما ب 18000 دج، نكون قد قدرنا دخل الأسرة تقديرا نقطيا. يكون تقديرنا بمجال إذا قلنا مثلا أن الدخل يساوي 18000 ± 2000 أي أنه يتراوح بين 16000 و20000دج.

(‌أ) درجة التأكد

لكي يكون التقدير علميا ينبغي تقييم احتمال أن تكون المعلمة تنتمي فعلا إلى المجال المحدد، لذلك نلحق بالمجال ما يسمى بدرجة أو مستوى الثقة، ويرمز له ب p. الاحتمال المعاكس يسمى احتمال الخطأ ويرمز له ب α، ويسمى أيضا ""مستوى المعنوية".

مثال: دخل الأسرة في المنطقة (أ) ينتمي إلى المجال [16000، 20000] بمستوى معنوية 5% أي بمستوى ثقة 95% . وتسمي الحدود 16000 و20000 حدود الثقة.

(‌ب) تعيين حدود مجال الثقة

تحدد حدود الثقة من خلال معاملات الثقة التي بدورها تحدد من خلال مستوى المعنوية (مستوى الثقة). ففي حالة استخدام التوزيع الطبيعي للتقدير تكون القيمتين ± 1.96 معاملات الثقة من أجل مستوى ثقة 95% بينما القيمتين ±2.58 تمثلان معاملات الثقة من أجل مستوى ثقة 99 % .

مثال: ليكن µ_sوσ_s متوسط وانحراف معياري توزيع المعاينة لإحصائية ما s حيث µ_s = µ . إذا كان توزيع المعاينة ل s توزيعا طبيعيا (كما هو الحال بالنسبة لأغلب الإحصائيات عندما (n ≥ 30) ) فإننا نقدر مثلا وبالنظر إلى توزيع s أن:

القيمتين µ_s ± 1.96σ_s تمثلان حدود الثقة ب 95 %، و µ_s ± 2.58σ_sحدود الثقة ب 99% .

في حالة التوزيع الطبيعي يرمز لحدود الثقة ب Z_cأو Z_1-_α/2 (أنظر الرسم).

المبحث 2. التقدير بمجال

كيفية تعيين مجال الثقة للمتوسط

كيفية تعيين مجال الثقة للنسبة

كيفية تعيين مجال الثقة للتباين

كيفية تعيين مجال الثقة لنسبة تباينين

1 مجال الثقة للمتوسط

يقدر متوسط المجتمع µ من خلال الإحصائية m.

(‌أ) تقدير µ باستخدام التوزيع الطبيعي

نستخدم التوزيع الطبيعي لتحديد مجال الثقة إذا علمنا أن المجتمع الذي سحبت منه العينة يتبع التوزيع الطبيعي.

وفي حالة العينة الممتدة (n ≥ 30) يمكن كذلك الاستفادة من نظرية النهاية المركزية[10] أن m تتبع التوزيع الطبيعي.

تكتب حدود مجال الثقة كما يلي:

إلا أنه غالبا ما يكون الانحراف المعياري للمجتمع σ مجهولا، ولذلك نعوض σ في الصيغ السابقة بالمقدر S’ أو S.

الجدول الآتي يبين قيم z_c التي تمثل حدود مجال الثقة بحسب مستوى الثقة :

مستوى الثقة 1-α	0.99	0.98	0.95	0.90	0.8	0.5
α مستوى المعنوية	0.01	0.02	0.05	0.10	0.2	0.5
1- α/2	0.995	0.99	0.975	0.95	0.9	0.75
Z_1-_α/2	82.5	2.326	1.96	1.645	1.282	0.674

مثال : نقدر أن µ يوجد داخل المجال m ± 1.96σ_m بمستوى ثقة 95% (0.95) أي بمستوى معنوية 5 % (0.05)، وداخل المجال m ± 2.58σ_mبمستوى ثقة 99% أي بمستوى معنوية 0.01...

(‌ب) تقدير µ باستخدام التوزيع t :

في حالة العينة الصغيرة (n < 30)وσ مجهول نستخدم توزيع ستيودنت لتحديد مجالات الثقة ل µ. مثلا القيم-t_0.975 ؛ t_0.975 تحد 95% من المساحة تحت المنحنى ونقول أن -t_0.975 ; t_0.975 تمثل القيم الحرجة أو معاملات الثقة عند مستوى ثقة 95% ونكتب:

ومنه نستخلص مجال الثقة ل µ كما يلي:

2 مجال الثقة للنسبة

(‌أ) حالة المجتمع غير محدود أو المعاينة غير نفادية و العينة الممتدة (n ≥ 30) :

لتكن s إحصائية تمثل نسبة "نجاحات" في عينة ذات حجم n ≥ 30 مستخرجة من مجتمع ثنائي حيث p هي نسبة النجاحات. تستعمل التوزيع الطبيعي لتقدير p فنعين حدود الثقة ل p كما يلي: p’ ± z_cσ_p أينp’ نسبة النجاحات في العينة،

نعلم من الفصل السابق أن ومنه يحدد مجال الثقة ل p كما يلي:

(‌ب) في حالة كون المجتمع محدود ذا حجم Nوالمعاينة نفادية:

3 مجال الثقة للتباين

لتقدير التباين والانحراف المعياري لمجتمع بمجال ثقة نستعمل الخاصية : .

مثال: مجال الثقة ب95% يحدد كما يلي:

نظرا لأن توزيع ك2 غير متماثل فإن المجال أعلاه ليس الأمثل، إذ توجد طريقة لتضييق مجال الثقة أكثر إذا لم نشأ أن تكون أطراف المنحنى متساوية، وهذا بخلاف التوزيعات المتماثلة كالطبيعي وستيودنت.

4 مجالات الثقة لنسبة تباينين

رأينا سابقا (نظرية 11 من الفصل 5) أنه إذا كان لدينا مجتمعان طبيعيان تبايناهما σ²₁ , σ²₂ وسحبنا منهما عينتين عشوائيتين حجمهما على التوالي n₁ , n₂فإن :

إذا يمكن تكوين تقدير بمجال لF عند مستوى ثقة 0.98 كما يلي:

و من ثم يمكن تقدير النسبة بين تبايني المجتمعين كما يلي:

5 خلاصة

لتقدير إحصائية مجتمع نستخدم نظريات توزيع المعاينة. هذه النظريات تتناول خصائص إحصائيات العينة من متوسط العينة، النسبة في العينة، ... و علاقتها بالإحصائيات المناظرة لها في المجتمع.

جدول 1 توزيع المعاينة للمتوسطات حسب طبيعة توزيع المجتمع، معلومية التباين و حجم العينة.

قانون		n	تباين المجتمع (σ²)	قانون المجتمع
N(µ ; σ/√n)	σ/√n	n < 30 أو n ≥ 30	معلوم	طبيعي
N(µ ; S’/√n)	S’/√n	n ≥ 30	غير معلوم
t_α;_n-1	S’/√n	n < 30	غير معلوم
N(µ ; σ/√n)	σ/√n	n ≥ 30	معلوم	غير معلوم
N(µ ; S’/√n)	S’/√n	n ≥ 100	غير معلوم	غير معلوم

جدول 2 تحديد مجال الثقة للنسبة، للتباين وللنسبة بين تباينين

المجتمع	التوزيع الاحتمالي للإحصائية	مجال الثقة
مجتمع غير محدود أو معاينة غير نفادية و عينة ممتدة (n ≥ 30)	التوزيع الطبيعي
مجتمع محدود ذا حجم N والمعاينة نفادية	التوزيع الطبيعي
غير معلوم		أو
مجتمعين طبيعيين، أو عينتين مسحوبتين من مجتمع طبيعي واحد.		مثلا عند مستوى ثقة 0.98:

6 ملحق. مجالات الثقة للفروق والمجاميع

إذا كانت s₁ وs₂ إحصائيتا معاينة لها توزيع يقترب من التوزيع الطبيعي، والعينتان مستقلتان، تكتب حدود الثقة للفروق بين المعالم التي تمثلها الإحصائيتين كما يلي:

في حالة المجموع :

مثال: إذا كانت الإحصائيتان هما متوسطا عينتين مستقلتين، مسحوبتين من مجتمعين غير محدودين، نحدد مجال الثقة للفرق (و للمجموع) بين متوسطي المجتمعين µ₁- µ₂ كما يلي :

مثال 2: إذا كانت الإحصائيتان هما نسبتان في عينتين مستقلتين، مسحوبتان من مجتمعين غير محدودين :

المبحث 3. طرق تأسيس المقدر ^{^[11]}

طريقة العزوم

طريقة المعقولية العظمى (الاحتمال الأكبر)

أحد الطرق لاختيار مقدر معلمة ما للمجتمع أن نأخذ مباشرة نظيرتها في العينة، وإذا كان هذا المقدر لا يتصف بالخصائص المطلوبة نجري عليه تعديلا (استخدامS’² بدلا من S² لتقدير σ²). توجد طرق أخرى لتحديد المقدر الأنسب منها طريقة المعقولية العظمى والتي تدعى أيضا طريقة الاحتمال الأكبر والتي تنسب إلى العالم فيشر وكذا طريقة العزوم.

1 طريقة العزوم

ليكن المطلوب تقدير عدد K من معالم المجتمع : θ₁, θ₂, . . , θ_k. نكون جملة معادلات عددها K. تتضمن كل معادلة مساواة العزم المرتبط بالأصل من الدرجة k لمتغيرة المجتمع X :µ’_k = E(X^k) ، بنظيره لمتغيرة المعاينة x :

m’_k = (1/n)∑_ix_i^k k = 1, 2, , K

مثال: ليكن X ~ B(20; p) . تقدير p بطريقة العزوم انطلاقا من عينة يتم كما يلي:

لدينا عدد المعالم المراد تقديرها K = 1 إذا نحتاج إلى معادلة واحدة : µ = 20p .ومنه p = 20/µ، نأخذ إذا كمقدر لp القيمة: p’ ونحسبها كما يلي : p’ = m/20 .

في حالة تقدير معلمتين للمجتمع نحتاج أن نستعمل جملة المعادلتين: µ = m , µ’₂ = m’₂

مثال2 : لتكن X ~ N(µ; σ²). نسحب عينة ذات متوسط m، وتباين S². لتقدير µ وσ² نحتاج إلى حل جملة المعادلتين:

هذه الطريقة قد تعطي مقدرات متحيزة كما في هذه الحالة.

2 طريقة المعقولية العظمى (طريقة الاحتمال الأكبر)

حالة كون متغيرة المجتمع متقطعة : نريد تقدير معلمة θ واحدة للمجتمع، ولدينا عينة غير نفادية (المتغيرا ت التي تمثل قيم المحصل عليها في العينة مستقلة) لها نفس التوزيع للمجتمع. من البديهي أن احتمال تحقق عينة بذاتها مرتبط ب قيمة المعلمة المجهولة : P(x₁, x₂, …,x_n) = L(θ). هناك قيمة ل θ تعظم احتمال الحصول على العينة المحصل عليها، ونفترض أن تلك القيمة هي الصحيحة بما أن العينة حصلت بالفعل. تتمثل طريقة المعقولية العظمى في البحث عن هذه القيمة. أي البحث عن θ التي تعظم L(θ) ، حيث :

L(θ) = f(x₁, . . . , x_n ; θ) = f(x₁) . f(x₂) . . . f(x_n) .

تعتمد طريقة المعقولية العظمى على تعظيم دالة الاحتمال المشتركة L(θ) .

مثال: ليكن X ~ B(p)، حيث النجاح هو وجود الخاصية " أ " لدى فرد مسحوب عشوائيا من المجتمع. نرد تقدير p من خلال عينة حجمها 2. ما هي القيمة p’ ل p التي تجعل النتيجة 1، 0 هي الأكثر احتمالا؟ أي ما هي p’ التي تجعل p(0.1) = pq أكبر ما يمكن؟

من الواضح أن أكبر قيمة ل p(0.1) هي ¼ والقيمة التي تحققها هي p’ = 1/2 ، وبهذا نجيب على التساؤل.

الفصل IV. مفاهيم اختبارات الفروض وتطبيقاتها

اختبار المتوسط

اختبار النسبة واختبار التباين

اختبارات المقارنة بين مجتمعين

اختبار التجانس و اختبار التعديل

في الفصل السابق تناولنا كيفية تقدير معالم المجتمع من خلال بيانات العينة وبعض خصائص المقدر الجيد. في هذا الفصل[12] سنتناول كيفية اختبار فرضيات موضوعة حول معالم مجتمع أو أكثر. يحتاج الدارس أحيانا في مرحلة ما من بحثه إلى اختبار فرضية أو أكثر بخصوص المجتمع المدروس. من أمثلة ذلك: اختبار فرضية بخصوص معدل الدخل في منطقة معينة، اختبار فرضية نسبة شفاء لدواء معين، ... يتم ذلك بصياغة فرضية عن المجتمع المدروس (أو المجتمعات المدروسة) ومن ثم محاولة الحصول على دليل إحصائي ينفي أو يثبت هذه الفرضية وذلك من خلال بيانات عينة (أو أكثر) عشوائية بسيطة. تخص الفرضية أحد معالم المجتمع كالمتوسط، النسبة أو التباين، ونعتمد في إثباتها أو رفضها على خصائص إحصائية معاينة مختارة. من أجل ذلك يعتمد هذا الدرس، كما هو الحال بالنسبة لدرس التقدير، على درس المعاينة.

المبحث 1. اختبار المتوسط

الاختبار ثنائي الاتجاه للمتوسط

الاختبار أحادي الاتجاه للمتوسط

استخدام S كمقدر لتباين المجتمع في اختبار المتزسط

اختبار المتزسط باستخدام توزيع t

يتناول هذا الاختبار متوسط المجتمع (µ)، مثل متوسط الدخل، متوسط وزن منتج معين، .. ويؤكد اختبار المتوسط فرضية مساواته لقيمة ما µ₀. و للقيام بالاختبار نستخرج عينة عشوائية نحسب فيها المتوسط m ثم نستخدم التوزيع الاحتمالي ل m لقياس قرب أو بعد هذه القيمة من µ₀.

1 اختبار ثنائي الاتجاه للمتوسط.

لنتناول هذا المثال: نريد اختبار فرضية حول متوسط دخل الطالب في السنة الأولى من تخرجه، ولتكن القيمة الافتراضية هي 15000دج كمتوسط للدخل الشهري. نحتاج إلى الخطوات التالية: تحديد الفرضيات، تحديد قاعدة القرار، حساب القيمة الجدولية للمتغيرة، حساب القيمة الفعلية للمتغيرة، اتخاذ القرار.

(‌أ) تحديد الفرضيات (الصفرية والبديلة):

↔ H₁ : µ ≠ µ₀ H₀ : µ = µ₀

تسمى الفرضية H₀ الفرضية الصفرية أو فرضية العدم، ويؤدي الاختبار إما إلى رفضها ونكتب RH_o وفي هذه الحالة نقبل الفرضية البديلة أو المعاكسة أو عدم رفضها ونكتب R’H₀. µ₀هي القيمة الافتراضية ل µ وهي في هذه الحالة 15000 لذلك نكتب الفرضيات كما يلي:

↔ H₁ : µ ≠ 15000 H₀ : µ = 15000

عادة ما تكون µ₀ محددة بناءا على بيانات عينة عشوائية بسيطة (µ₀= m)، وفي هذه الحالة يمكن استخدام الخاصية
m ~ N(µ, σ²/n) لاجراء الاختبار، حيث أنه تحت H₀فإن : m ~ N(µ₀, σ²/n)

مما يعني معلومية احتمال أن يكون m قريب إلى درجة ما من µ₀ فمثلا :

P(µ₀ – 1.64(σ_m) ≤ m ≤ µ₀ + 1.64(σ_m)) = 0.90

P(µ₀ – 1.96(σ_m) ≤ m ≤ µ₀ + 1.96(σ_m)) = 0.95

P(µ₀ – 2.58(σ_m) ≤ m ≤ µ₀ + 2.58(σ_m)) = 0.99

وبصفة عامة نكتب:

P[µ₀ – z_1-_α/2(σ_m) ≤ m ≤ µ₀ + z_1-_α/2 (σ_m)] = 1-α

أو حسب الكتابة الأكثر شيوعا:

حيث:

§ (m - µ₀)/σ_m: (متغيرة القرار) هي المتغيرة المعيارية ل m ونرمز لها ب z_c، حيث z ~ N(0, 1) .

§ σ_m تحدد كما يلي: σ_m= σ/√nفي حالة المعاينة بالإرجاع (أو n ≤ 0.05N ) و في الحالة المعاكسة.

§ 1 - α/2 : المساحة على يسار z .

§ n : حجم العينة.

يمكن إذا كان m خارج المجال 1-α، أن نرفض الفرضية الصفرية التي حدد على أساسها هذا المجال ونقبل بالتالي الفرضية البديلة.

تسمى هذه (الخطة) قاعدة القرار.

(‌ب) تحديد قاعدة القرار

تكتب قاعدة القرار في المثال الذي بين أيدينا، وهي قاعدة اختبار ثنائي الاتجاه (أنظر الشكل 1) ، كما يلي:

أو

رسم 23 منطقتي القبول و الرفض في حالة قاعد القرار الثنائية

Figure 24 منحنى القوة

تتضمن هذه الخطة مخاطرة تتمثل في الوصول إلى قرار خاطىء: فقد تكون الفرضية H₀ صحيحة بينما تقودنا قيمة m المحصلة إلى رفضها، ويسمى هذا الخطأ من النوع الأول، واحتماله α، ويكتب : P(RH₀/ H₀) = α،

و قد تقودنا قيمة m إلى قبولH₀ فيما هي خاطئة، ويسمى هذا الخطأ من النوع الثاني واحتماله 1- α ويكتب :

P(R’H₀ / H₁ ) = 1-α

و يمكن تقليص احتمال أحد الخطأين على حساب الثاني، ولكن لا يمكن تقليص احتمال كلا الخطأين معا إلا بزيادة حجم العينة.

و يقيس احتمال رفض الفرضية الصفرية P(RH₀) قوة الاختبار (أنظر الشكل 2) فيما يقيس احتمال قبولها P(R’H₀) فعالية الاختبار (أنظر الشكل 2). ويتوقف كلا الاحتمالين على القيمة الحقيقية ل µ .

(2) منحنى القوة

(‌ج) حساب z الجدولية:

ويرمز لها ب z_tحيث، وهي المشار إليها في قاعدة القرار (الشكل الثاني)، وفي حالتنا (اختبار ثنائي بمستوى معنوية 5%) :

z_t = z_1-α/2= z_1-0.05/2= z_1-0.₀₂₅ = z_0.975

ومن الجدول نجد أن z_0.975 = 1.96 .

(‌د) حساب z الفعلية:

ويرمز لها ب z_c_وهي المتغير المعيارية ل m (أنظر قاعدة القرار الشكل الأول) :

(‌ه) القرار:

نقرر قبول أو رفض H₀ حسب قاعدة القرار. وفي حالتنا نرفض H₀ لأن z_c > z_t ونقبل H₁ أي أن متوسط دخل الخريج حديث التوظيف ليس 15000دج.

2 الاختبار أحادي الاتجاه للمتوسط.

يتميز الاختبار الثنائي عن الأحادي في الفرضية البديلة التي هي عدم مساواة في الاختبار الثنائي وأكبر تماما أو أصغر تماما (حسب الحالة) في الاختبار الأحادي، وهذا يترتب عليه تغيير في قاعدة القرار.

(‌أ) الاختبار أحادي الاتجاه من اليمين.

لنرجع إلى المثال السابق مع تغيير محدد هو أننا نريد اختبار ما إذا كان متوسط الدخل للخريج 15000دج أم أكثر (اختبار من اليمين).

أ- الفرضيات : ↔ H₁ : µ > µ₀ H₀ : µ = µ₀

في هذه الحالة µ₀ = 15000 لذلك نكتب : ↔ H₁ : µ > 15000 H₀ : µ = 15000

ب- قاعدة القرار:

ج- حساب z الجدولية: (اختبار على اليمين بمستوى معنوية 5%) : z_t = z_1-α= z_1-0.05= z_0.95

ومن الجدول نجد أن z_0.95 = 1.645

د- حساب z الفعلية:

ه- القرار: نرفض H₀ لأن z_c > z_t ونقبل H₁ أي أن متوسط دخل الخريج حديث التوظيف ليس 15000دج وإنما هو أكبر.

(‌ب) الاختبار أحادي الاتجاه من اليسار

نعود إلى مثالنا ونفترض أن متوسط العينة كان 14200دج ونريد أن نختبر ما إذا كان متوسط الدخل مساوي أم أقل من 15000دج.

أ- الفرضيات : ↔ H₁ : µ < 15000 H₀ : µ = 15000

ب- قاعدة القرار:

ج- حساب z الجدولية: (اختبار على اليسار بمستوى معنوية 5 %) :

= -1.645 z_t = - z_1-α= - z_1-0.05= - z_0.95

د- حساب z الفعلية:

ه- القرار: نرفض H₀ لأن z_c < z_t ونقبل H₁ أي أن متوسط دخل الخريج حديث التوظيف أقل من 15000دج .

3 استخدام S كمقدر ل σ في اختبار المتوسط.

في الأمثلة السابقة افترضنا أن σ معلوم، في الواقع غالبا ما يكون الانحراف المعياري مجهولا ونحتاج بالتالي إلى استخدام الانحراف المعياري للعينة (S) عند حساب σ_m (أنظر درس التقدير)، حيث نعوض العبارة

σm = σ/√n

مثال: في المثال السابق نفترض أن الانحراف المعياري للدخل الشهري للطالب مجهول، لكن الانحراف المعياري للعينة S = 1600 . كيف يمكن اختبار ما إذا كان الدخل الشهري أقل من 15000دج؟

الخطوات أ، ب ، ج تبقى بدون تغيير.

د- حساب z الفعلية:

ه- القرار: نرفض H₀ لأن z_c < z_t ونقبل H₁ أي أن متوسط دخل الخريج حديث التوظيف ليس 15000دج وإنما هو أقل.

4 استخدام التوزيع t في اختبار المتوسط.

في حالة n< 30 وσ (الانحراف المعياري للمجتمع) مجهولا، لا يمكن استخدام التوزيع الطبيعي، ولكن لدينا :

و تحت H₀ (µ = µ₀ ) :

يمكن إذا استخدام التوزيع ستيودنت (بشرط أن يكون توزيع المجتمع طبيعيا أو على الأقل جرسي الشكل) .

و تتغير قاعدة القرار تبعا لهذا التغيير فتكتب في حالة الاختبار الثنائي كما يلي:

في حالة اختبار من اليمين:

في حالة اختبار من اليسار:

5 خلاصة

يتم اختبار الفرضيات من خلال 5 خطوات متتالية وهي:

§ تحديد الفرضيات (الصفرية والبديلة)

§ تحديد قاعدة القرار

§ حساب القيمة الجدولية للمتغيرة

§ حساب القيمة الفعلية للمتغيرة

§ اتخاذ القرار.

تتحدد كيفية إتمام كل خطوة حسب طبيعة الاختبار (ثنائي أو أحادي الاتجاه)، حسب طبيعة المجتمع و طبيعة و حجم العينة، ... و تسخدم في ذلك نظريات توزيع المعاينة.

المبحث 2. اختبار النسبة واختبار التباين

اختبار النسبة

اختبار التباين

1 اختبار النسبة

يتعلق هذا الاختبار بنسبة مفردات المجتمع التي تتصف بخاصية ما (p)، حيث يؤكد الاختبار أو ينفي صحة فرضية معينة بخصوص قيمة p . يرمز للقيمة الافتراضية ب p₀ وتكتب الفرضية كما يلي: H₀ : p = p₀

للقيام بالاختبار نستخدم خصائص p’ النسبة في العينة (أنظر توزيع المعاينة للنسبة : نظرية 6).

عند n ≥ 30 : (p, σ_p') p’ ≈ N (نظرية موافر- لابلاس)

استنادا إلى هذه الخصائص وتحت H0 :

و من ثم يمكن تحديد قاعدة القرار بحسب طبيعة الاختباركما يلي:

في حالة الاختبار الثنائي:

في حالة اختبار من اليمين:

في حالة اختبار من اليسار:

مثال: تقدر الدوائر الرسمية نسبة المتخرجين الجامعيين الذين يحصلون على عمل في السنة الأولى التي تلي تخرجهم ب 70 % . وجدت دراسة أجريت على عينة من 900 طالب أن نسبة الحصول على عمل 67 % . كيف يمكن اختبار ما إذا كانت النسبة الرسمية صحيحة أم مبالغ فيها، بمستوى معنوية 5 %.

H₀ : p = 0.70 ↔ H₁ : p < 0.70

ومنه نرفض الفرضية H₀.

2 اختبار التباين

لاختبار صدقية فرضية بخصوص قيمة تباين مجتمع ما،

H₀ : σ² =σ₀² ↔ H₁ : σ² = σ₀²

نستعمل المقدر غير المنحاز. حيث في حالة العينة الكبيرة (n ≥ 50 في أحسن الأحوال) ، وتحت H₀ فإن

حيث µ₄ هو العزم المركزي من الدرجة الرابعة. وبهذا الشكل تكتب قاعدة القرار للاختبار الثنائي كما يلي:

وفي حالة µ₄ مجهول يمكن استخدام كمقدر : m₄ = E(xi – m)⁴ .

وإذا كان المجتمع طبيعيا، حيث µ₄ = 3σ⁴ ، فإن متغيرة القرار يمكن أن تكتب كما يلي:

المبحث 3. اختبار المقارنة بين مجتمعين

اختبار تساوي متوسطي مجتمعين

اختبار تساوي تبايني مجتمعين

يتناول هذا الاختبار مقارنة بين مجتمعين من خلال المتوسط أو التباين لكل منهما ... وسنركز هنا على متغيرة القرار، إذ من السهل على الطالب استنتاج كيفية إتمام الخطوات الأخرى على ضوء ما سبق.

1 اختبار تساوي متوسطي مجتمعين

الغرض من الاختبار هو تأكيد أو نفي تساوي متوسطي مجتمعين من خلال عينتين عشوائيتين بسيطتين مستقلتين. تكتب الفرضيات (في حالة الاختبار الثنائي)كما يلي: H₀ : µ₁= µ₂↔ H₁ : µ₁≠µ₂

لتحديد متغيرة القرار نعتمد في الاختبار على متغيرة القرار T أو T’ بحسب الحالة (نترك للطالب استنتاج قاعدة القرار)، حيث نميز بين حالة كون تباينا المجتمعين معلومين وحالة كون تباينا المجتمعين مجهولين.

(‌أ) تباينا المجتمعين معلومين

1- المجتمعين طبيعيين:

2- مجتمعين ما (n₁ , n₂ ≥ 30):

(‌ب) تباينا المجتمعين مجهولين

1- المجتمعان طبيعيان:

إذا كان تباينا المجتمعين متساويين

2- مجتمعين ما (n₁ , n₂ ≥ 30):

مثال: نسحب من مجتمعين طبيعيين متساويي التباين عينتين حجم الأولى 18 وحجم الثانية 21. وجدنا النتائج التالية:

m₁ = 81, m₂ = 76, S²₁ = 9, S²₂ = 8. كيف يمكن اجراء اختبار تساوي متوسطي المجتمعين بمستوى معنوية 5 % .

H₀ : µ₁ = µ₂↔ H₁ : µ₁ ≠ µ₂

2 اختبار تساوي تبايني مجتمعين

الغرض من الاختبار هو تأكيد أو نفي تساوي تباينا مجتمعين من خلال عينتين عشوائيتين بسيطتين مستقلتين.

تكتب الفرضيات (في حالة الاختبار الثنائي)كما يلي: H₀ : σ²₁ = σ²₂ ↔ H₁ : σ²₁ ≠ σ²₂

نعتمد في الاختبار على متغيرة القرار T أو T’ بحسب الحالة، حيث نميز بين حالة كون المجتمعين طبيعيين أم غير ذلك.

(‌أ) مجتمعين طبيعيين

1- الحالة العامة:

2- في حالة n₁ , n₂ ≥ 30

(‌ب) مجتمعين ما (n₁, n₂ ≥ 50)

1- µ₄⁽¹⁾_;µ₄⁽²⁾ معروفين :

2- في حالة µ₄⁽¹⁾_;µ₄⁽²⁾ غير معروفين : نعوض µ₄ ب m₄ .

مثال : نسحب من مجتمعين طبيعيين عينتين حجم الأولى 18 وحجم الثانية 21. وجدنا النتائج التالية:

m₁ = 81, m₂ = 76, S²₁ = 9, S²₂ = 8. كيف يمكن اجراء اختبار تساوي متوسطي المجتمعين بمستوى معنوية 5 % ؟

H₀ : σ²₁ = σ²₂↔ H₁ : σ²₁ ≠ σ²₂

S’²₁ = S²₁ * n₁ / (n₁-1) = 9 (18)/17 ≈ 9.53 ; S’²₂ = S²₂ * n₂ / (n₂-1) = 8 (21)/20 = 8.4

S’²₁ / S’²₂ ≈ 1.135 ; F_{0.05 ;17 ;20} ≈ 2.17

T < F_α_{; n1-1 ;n2-1} => R’H₀

المبحث 4. اختبار الاستقلال والتجانس

اختبار التجانس

اختبار التعديل

1 اختبار التجانس

لنعد إلى اختبار النسبة، ونفترض أن لدينا عددا k من الخصائص المتنافية، نسبة تحقق كل منها في المجتمع p_i حيث ∑p_i = 1. نريد اختبار فرضية تساوي هذه النسب:

p_i≠ p_i0 H₀ : p_i = p_i0 (i = 1, 2, . . . k ) ↔ H₁ :

(الفرضية البديلة هي أن إحدى النسب النظرية p_i0 على الأقل غير مساوية للقيمة الحقيقية.)

متغيرة القرار : لإنجاز الاختبار نستخرج عينة نحسب فيها عدد مرات تحقق الخصائص (n_i) . إذا تحققت الشروط

n ≥ 30 ، p_i0 ≥ 1 وعلى الأقل في 80 % من الحالات np_i0 ≥ 5 نبرهن أن :