محاضرات الاحصاء الرياضي 6


(‌أ)  خصائص توزيع ستيودنت

            E(T) = 0,        V(T) = ν/(ν-2)   si  (ν > 2)

رسم  16 تدرج منحنى ستيودنت حسب درجة الحرية  
§          نلاحظ أن منحنى  tمتماثل حول المتوسط 0 مما يعني أن لكل نقطة موجبة t نقطة مناظرة لها سالبة حيث المساحة تحت المنحنى على يمين t تساوي المساحة تحت المنحنى علي يسار (–t)، ونكتب t1-p = - tp .
§          بالإضافة إلى ذلك فإن منحنى f(t) يقترب من المنحنى الطبيعي المعياري كلما زادت قيمة ν . وعموما، يعتبر الإحصائيون أن المنحنيان يتطابقان تقريبا عند ν 30.
§          في الجداول الاحصائية، تعين نقطة (قيمة المتغيرة) t من خلال νوالمساحة p على يسار t تحت المنحنى
) (p = P(T ≤  tν;p). وأحيانا تحدد النقطة t  بدلالة المساحة على يمينها (α = 1 - p)  ونكتب : tp,ν  أو tα,ν .

2           توزيع فيشر (F)[1] Distribution F de Fisher-Snédecor




و نقول أن المتغيرة X تتبع توزيع فيشر ب 1ν و2ν درجة حرية ونكتب:                          X ~ Fν1, ν2

(‌أ)  خصائص توزيع فيشر:


ويظهر من المعادلة تبعية منحنى f(x) بالإضافة ل x إلى كل من ν1  وν2 ولذلك تحدد أي نقطة F من خلال ثلاثة معالم: ν1  وν2 و p (المساحة تحت المنحنى على يسار النقطة F) ، ونكتب Fp, ν1 , ν2 
  وفي الغالب تعطي الجداول الإحصائية قيم F عند p = 0.95   وp = 0.99 .







3           خلاصة

يمكن تلخيص أهم ما تضمنه هذا المبحث في الجدول التالي:
التوزيع
المتغيرة العشوائية
أهم ما يجب معرفته عن دالة الكثافة
توزيع ك2
X ~ χ²ν
إذا كانت Xi متغيرات عشوائية مستقلة كل منها تتبع التوزيع الطبيعي المعياري، و  
X = X1² + X2² + . . . + Xν²
إذن: X ~ χ²ν
f(x) = 0   si    x ≤ 0

E(X) = ν,     V(X) = 2ν
توزيع ستيودنت
T ~ tν
لتكن المتغيرتان العشوائيتان المستقلتان Y وZ حيث Y~ N(0, 1) و χν² Z ~ ؛ إذن:
  ~ tν
E(T) = 0, 
 V(T) = ν/(ν-2)   si  (ν > 2)

توزيع فيشر
X ~ Fν1, ν2
إذا كانت لدينا متغيرتان عشوائيتان مستقلتان حيث:
   X1 ~ χν1² و  χν2² X2 ~ ،
فإن  ~ Fν1, ν2
f(x) = 0   si    x ≤ 0
,
;


التقارب بين التوزيع الثنائي والتوزيع الطبيعي
الانتقال من متغيرة متقطعة إلى متغيرة مستمرة
التقارب بين التوزيع الثنائي وتوزيع بواسون
نظرية النهاية المركزية

نتناول في هذا المبحث بعض حالات التقارب الذي يحصل بين عدد من التوزيعات الاحتمالية الشهيرة. ونقصد بالتقارب بين توزيعين (الثنائي وبواسون مثلا) أن يعطي التوزيعان نتائج متقاربة بخصوص احتمال معين، مما يعني إمكانية استخدام توزيعين احتماليين (وأحيانا أكثر) لحساب احتمال معين. علما أننا قد تطرقنا من قبل بإيجاز إلى هذا المفهوم عند دراستنا لهذه التوزيعات.

1           التقارب بين التوزيع الثنائي والتوزيع الطبيعي

لندرس السلوك التقاربي لمتغيرة التوزيع الثنائي X~B(n,p) عندما تؤول n إلىأعداد كبيرة جدا.
ليكن X يمثل عدد مرات الحصول على صورة عند رمي قطعة نقدية : مرتين، 4 مرات، 8 مرات، 16 مرات.

2
1
0
Xi

¼
1/2
1/4
Pi

4
3
2
1
0
Xi
1/16
4/16
6/4
4/16
1/16
Pi










8
7
6
5
4
3
2
1
0
Xi
0,004
0,031
0,109
0,219
0,273
0,219
0,109
0,031
0,004
Pi





برسم منحنيات Pi للحالات n = 2 ، n = 4 ، n = 8 ، n =16 يظهر السلوك التقاربي للمتغيرة X .
رسم 19  السلوك التقاربي للتوزيع الثنائي لما  p = 0.5
يظهر من مقارنة المنحنيات الأربعة أن زيادة قيمة n تؤدي إلى الحصول على منحنى ذا شكل جرسي ومتماثل حول التوقع µ .
هذه الملاحظة تصدق أيضا في حالة p ≠ 0.5 لكن التحول يكون أكثر بطأ.
من أجل التعميم نعتبر المتغيرة المعيارية z = (x - µ)/σ الملحقة بذات المتغيرة ذات التوزيع الثنائي X . إن السلوك التقاربي لZ الملاجظ في الشكل أسفله هو ما تثبته النظرية التالية:

ونكتبN(0,1)  Y ≈.















قاعدة:
في حالةn  كبيرة و  p غير قريب من 0 يمكن اعتبار التوزيع الثنائي كتقريب جيد للتوزيع الطبيعي. ويعطي التوزيعان نتائج أكثر تقاربا كلما كانت n كبيرة أكثر.  ونكتب:
و مما يسرع تقارب التوزيع الثنائي من التوزيع الطبيعي كون p قريب من 0.5   وكقاعدة :
§         عموما نعتبر أن التقريب ملائم عندما np  وnq  كلاهما أكبر من 5.
§         عدد من الاحصائيين[2] يعتمد قاعدة أخرى هي أن يكون أحد الشرطين التاليين متوفرين:
o       npq ≥ 9         
o       n ≥ 20 , np ≥ 10, nq ≥ 10
في حالة p = 0.5 ، الشرط (1) يتحقق عند n = 36 والثاني عند  n = 20.
في حالة p = 0.10 ، الشرطين يتحققان عند n = 100 .

2           الانتقال من متغيرة متقطعة إلى متغيرة متصلة.

لاستخدام التوزيع الطبيعي بدلا من التوزيع الثنائي يعني حساب الاحتمال عن طريق توزيع مستمر بينما المتغيرة متقطعة. من أجل ذلك يتم اعتبار كل قيمة في المتغيرة الأصلية مجالا.
مثال. احتمال 4 نجاحات خلال n تجربة يصاغ كما يلي:    P(3.5 ≤  X ≤  4.5) .
مثال2: نرمي قطعة نقدية 20 مرة. ليكن X عدد مرات الحصول على صورة. أحسب P(X = 8) ثم أدرس إمكانية استخدام نظرية موافر- لابلاس لحساب نفس الاحتمال.
 X ~ B(20, 0.5) , P(X = 8) = F(8) – F(7) = 0.2517 – 0.1316 = 0.1201.
لدينا np = 10 >5 وكذلك nq = 10 >5 ، وإذا شئنا استخدام القاعدة الثانية فإننا نجد أيضا أن : n =10، np =10، nq=10، يمكن إذا اعتبار Y = (X-10)/√5  ~ N(0 ,1) . نستخدم المتغيرة المستمرة X* بدلا من X لحساب احتمال المجال المعبر عن القيمة 8 وهو [7.5, 8.5]

3           التقارب بين التوزيع الثنائي وتوزيع بواسون

يعطي توزيع بواسون نتائج قريبة من التوزيع الثنائي لما n ≥ 30        وnp < 5              أو nq < 5
و يستخدم بعض الإحصائيين كشرط لاستعمال قانون بواسون بدلا من القانون الثنائي القاعدة التالية[3]:
  n ≥ 25  و p ≤ 0,1
مثال :  10  %من إنتاج آلة ما يعد تالفا، نأخذ 30 وحدة من انتاج هذه الآلة عشوائيا.
 أحسب احتمال أن يكون هناك وحدتان تالفتان.
        P(X = 2) = C230 (0,1²) (0.928) = 0.22     
لدينا n ≥ 25، p ≤ 0.1لاستعمال توزيع بواسون نحسب أولا قيمة المعلمة (معلمة قانون بواسون)
            λ = µ = np =30 * 0,1 = 3
P(2) = λx * e - λ/x! = (32 * e -3) / 2! = 0.22

4           نظرية النهاية المركزية

لتكن المتغيرات X1، X2، . . . . متغيرات عشوائية مستقلة لها نفس التوزيع الاحتمالي بتباين ومتوسط محددين. إذا كانت
Sn = X1 + X2 + . . . + Xn            (n = 1, 2, . . .),         
 فإن Sn تتبع التوزيع الطبيعي عندما n →∞ .  وبما أن E(Sn) = nµ   و σSn = σ√n  فإننا تكتب :

في الحقيقة فإن النظرية محققة عندما تكون المتغيرات المستقلة Xi لها نفس المتوسط والتباين حتى ولو لم يكن لها بالضرورة نفس التوزيع، مع العلم أنه توجد صيغ أخرى لهذه النظرية حيث لا يشترط أن يكون للمتغيرات نفس التوزيع الاحتمالي ولا حتى أن تكون مستقلة.
تجدر الإشارة إلى أن نظرية موافر- لابلاس التي تطرقنا إليها سابقا هي حالة خاصة من نظرية النهاية المركزية، ذلك أن متغيرة تتبع القانون B(n, p) يمكن اعتبارها مجموعا لعدد من المتغيرات المستقلة ذات التوزيع البرنولي B(1, p).



5           خلاصة  

لاستخدام التوزيع الطبيعي بدلا من التوزيع الثنائي يعني حساب الاحتمال عن طريق توزيع مستمر بينما المتغيرة متقطعة. من أجل ذلك يتم اعتبار كل قيمة في المتغيرة الأصلية مجالا.
نظرية النهاية المركزية تنص على أن Sn (متغيرات عشوائية مستقلة لها نفس التوزيع الاحتمالي بتباين ومتوسط محددين ) تتبع التوزيع الطبيعي عندما n →∞ بمتوسط E(Sn) = nµ   و σSn = σ√n ونكتب:

الرسم البياني التالي يبين القواعد المستخدمة كشروط للتقريب بين التوزيعات الاحتمالية المذكورة آنفا في المبحث بالإضافة إلى التوزيعات الأخرى التي درست في الفصول السابقة (الرمزcr يعني متغيرة معيارية).

 Organigramme hiérarchique



مفاهيم إحصائية
توزيعات المعاينة للمتوسطات
توزيع المعينة للنسبة
توزيع المعاينة للفروق و المجاميع
توزيع المعاينة للتباين و توزيع المعاينة لنسبة تباينين

تنتشر في مجتمعاتنا المعاصرة عمليات الاستقصاء، ففي عالم الأعمال تقوم المؤسسات عن طريق مصالح التسويق ومصالح البحوث والتطوير بإجراء استقصاءات للإطلاع على توجهات المستهلكين، وفي وسائل الإعلام لا يمر يوم دون أن يعلن عن نتائج استقصاء أجرته مجلة أو جامعة حول مواضيع سياسية أو اجتماعية متعددة، منها الاستقصاءات المثيرة للجدل حول الأراء السياسية للمواطنين أثناء الحملات الانتخابية. فما هي الأسس النظرية الرياضية التي تستند عليها الاستقصاءات المختلفة ؟ أو كيف يمكن الاستدلال من خلال بيانات عينة على خصائص المجتمع الذي أخذت منه؟ الإجابة على هذه الأسئلة و غيرها تتطلب فهم العلاقات الرياضية بين الخصائص المختلفة للمجتمع مثل المتوسط، التباين وغيرها، والخصائص المناظرة لها في العينة وهو ما سنتناوله في هذا الفصل. في الفصول المقبلة سندرس عددا من التطبيقات لهذه العلاقات الرياضية.
المجتمع والعينة
العينة النفادية والعينة غير النفادية
العينة العشوائية
معالم مجتمع
إحصائية المعاينة

1           المجتمع والعينة  Population et échantillon

نشرح هذين المصطلحين من خلال الأمثلة التالية:
·         قد ترغب الإدارة العسكرية في تقدير الوزن المتوسط للجندي، فتقوم أخذ أوزان عينة من 100 جندي من بين مجموع الجنود (المجتمع).
·         ترغب هيأة معينة بالبحوث السياسية في تقدير نسبة الناخبين المساندين لمرشح معين في 10 الولايات، فتقوم باستجواب 100 ناخب من كل ولاية. الناخبون في الولايات العشر يمثلون المجتمع بينما ال 1000 ناخب المستجوبون يمثلون العينة.
·         من أجل معرفة مدى دقة صنع قطعة نقدية ترمى القطعة 100 مرة ونحسب عدد مرات الحصول على الصورة والكتابة، حجم العينة هنا هو 100.
·         لتقدير نسبة الكرات داخل صندوق، التي من لون معين، نقوم عدد من المرات بسحب كرة نسجل لونها ثم نعيدها. عدد الكرات المسحوبة يمثل حجم العينة.
نلاحظ أن مصطلح المجتمع يقصد به القياسات أو القيم وليس الأفراد أو الأشياء التي تم قياسها (مجتمع الأوزان، مجتمع آراء الناخبين..)، كما أن المجتمع قد يكون محدودا أو غير محدود (نتائج رميات قطعة النقد)، أما العينة فهي عادة تكون محدودة، ونرمز عادة لحجم المجتمع ب N، ولحجم العينة ب n.

2           العينة النفادية والعينة غير النفادية  Echantillon exhaustif et non exhaustif

عندما يكون السحب بالإرجاع حيث يمكن أن تظهر المفردة أكثر من مرة في العينة، نسمي هذه المعاينة غير نفادية لأن تكرار العملية لا يؤدي إلى تقليص عدد المفردات في المجتمع، والعكس نسمي المعاينة بدون إرجاع معاينة نفادية. هناك فرضيتان تتكرران في عدد من العلاقات الرياضية التي سنراها لاحقا، هما فرضية أن قيم مفردات العينة مستقلة والمجتمع لانهائي. يتحقق شرط الاستقلال إذا كانت المعاينة غير نفادية، وإذا كانت كذلك، يمكن اعتبار المجتمع مجتمعا غير محدود.

3           العينة العشوائية Echantillon aléatoire

من أجل أن تكون العينة ممثلة للمجتمع، أحد الطرق المستخدمة هي العينة العشوائية. نظريا (قد يصعب تحقيق ذلك في الواقع)،  نقول عن عينة أنها عشوائية إذا كان لكل مفردة في المجتمع نفس الاحتمال لأن تكون في العينة. تسمى هذه العينة بالعينة العشوائية البسيطة. لإنجاز ذلك إما أن نسحب المفردات بطريقة عشوائية أو نرقم مفردات المجتمع ثم نحدد العينة من خلال مجموعة من الأعداد تؤخذ من الجداول الإحصائية للأعداد العشوائية[4].

4           معالم المجتمع Paramètre d’une population

نقصد بمعالم المجتمع مجموعة من خصائصه مثل المتوسط، التباين، معامل التماثل، ...  من خصائص المجتمع أيضا طبيعة توزيعه الاحتمالي f(x) كأن يكون طبيعيا أو غيره.

5           إحصائية المعاينة Statistique de l’échantillonnage 

لتقدير معالم المجتمع (متوسط المجتمع µ، تباين المجتمع σ²  النسبة   p...) ننطلق من بيانات العينة، حيث نحتاج إلى حساب معالم مثل متوسط العينة m ، تباين العينة، النسبة في العينةp’ . بصفة عامة، نسمي كل قيمة تحسب انطلاقا من بيانات العينة من أجل تقدير قيمة معالم المجتمع إحصائية المعاينة. نظريا (رياضيا) إحصائية المعاينة هي كل دالة في المتغيرات العشوائية التي تمثل القيم المحصل عليها في العينة.
متوسط توزيع المعاينة للمتوسطات
تباين توزيع المعاينة للمتوسطات
طبيعة توزيع المعاينة للمتوسطات

1           متوسط توزيع المعاينة للمتوسطات

مسألة: ليكن المجتمع 1، 3، 5، 6، 8. ما هي القيمة المتوقعة لمتوسط عينة مسحوبة بالإرجاع مكونة من مفردتين (m)؟ أحسب متوسط المجتمع µ. قارن بين m وµ.  من أجل تحديد ذلك أحسب جميع الحالات الممكنة للمتوسط mi حسب كل عينة.
العينات الممكنة العينات الممكنة ذات الحجم  n = 2 من مجتمع حجمه 5 عددها: 5*5 =25
العينات الممكنة

المتوسطات الممكنة للعينة (معاينة غ نفادية)          mi
(1, 1)
(3, 1)
(5, 1)
(6, 1)
(8, 1)

1
2
3
3,5
4,5
(1, 3)
(3, 3)
(5, 3)
(6, 3)
(8, 3)

2
3
4
4,5
5,5
(1, 5)
(3, 5)
(5, 5)
(6, 5)
(8, 5)

3
4
5
5,5
6,5
(1, 6)
(3, 6)
(5, 6)
(6, 6)
(8, 6)

3,5
4,5
5,5
6
7
(1, 8)
(3, 8)
(5, 8)
(6, 8)
(8, 8)

4,5
5,5
6,5
7
8
القيمة المتوقعة m ل mi هي متوسط قيمها وهي m = (∑i mi) / 25 = 4,6 .
حساب متوسط المجتمع: µ = (1 + 3 + 5 + 6 + 8)/5 = 4.6                          
مثال2. أوجد نفس مطالب المثال 1. في حالة السحب بدون إرجاع. العينات الممكنة عددها: C25 = 10
        

العينات الممكنة بدون إرجاع

المتوسطات الممكنة للعينة أو
توزيع المعاينة للمتوسطات (معاينة نفادية)
mi
(1, 3)




2



(1, 5)
(3, 5)



3
4


(1, 6)
(3, 6)
(5, 6)


3,5
4,5
5,5

(1, 8)
(3, 5)
(5, 8)
(6, 8)

4,5
5,5
6,5
7
القيمة المتوقعة m ل mi هي متوسط قيمها وهي:
 E(m) = µm = (∑i mi) / 10 = 4,6
متوسط المجتمع : µ = (1 + 3 + 5 + 6 + 8)/5 = 4.6                  

 

نظرية 1.  إذا كانت م ع تمثل مجتمع ما وm متغيرة ع تمثل متوسط عينة مسحوبة من ذات المجتمع، فإن القيمة المتوقعة لمتوسط العينة E(M) تكتب كما يلي:  E(M) = µm = µ

البرهان : لنرمز ب Xi لقيم المتغيرة الأصلية X .

2           تباين توزيع المعاينة للمتوسطات

(‌أ)     حالة المعاينة بالإرجاع

مثال. أحسب تباين المجتمع في المسألة 1، أحسب التباين (والانحراف المعياري) لتوزيع المعاينة للمتوسطات σ²m علما أن العينة مسحوبة بالإرجاع (غ نفادية)، قارن بين تباين المجتمع وتباين متوسطات العينات الممكنة (توزيع المعاينة للمتوسطات).
mi
1
2
3
3,5
4,5
2
3
4
4,5
5,5
3
4
5
5,5
6,5
3,5
4,5
5,5
6
7
4,5
5,5
6,5
7
8

σ²m = [∑i (mi m)² ]/25 = 2.92; 
σ² = [∑i (xi – µ)² ]/5 = 5.84
2.92 = 5.84 / 2

هذا المثال يمهد للنظرية التالية:
نظرية 2. إذا كانت م ع تمثل مجتمع ما وmi متغيرة ع تمثل متوسط عينة مسحوبة من ذات المجتمع بالإرجاع، فإن تباين mi (تباين توزيع المعاينة للمتوسطات) يكتب كما يلي:                 حيث n حجم العينة.
البرهان: لنرمز ب Xi لقيم المتغيرة الأصلية X .

(‌ب)                     حالة المعاينة بدون إرجاع.

مسألة: في المسألة 1 أحسب تباين المتوسطات الممكنة للعينة  σ²mفي حالة المعاينة بدون إرجاع، قارن بين تباين المجتمع وتباين المتوسطات الممكنة للعينة.
        
المتوسطات الممكنة للعينة أو
توزيع المعاينة للمتوسطات (معاينة نفادية)
mi
2



3
4


3,5
4,5
5,5

4,5
5,5
6,5
7
تباين المتوسطات الممكنة للعينة:
     σ²m = [∑i (mi m)² ]/10 = 2.19  
تباين المجتمع:             σ² = [∑i (xi – µ)² ]/5 = 5.84 
( أو بطريقة ثانية:
 σ² = E(X²) – E(X)²
     = (1 + 9 + 25 + 36 + 64) / 5 - 4.6² = 5.84)
المقارنة بين تباين متوسط العينة و تباين المجتمع:
هذا يمهد للنظرية التالية:
نظرية 3. إذا كانت X م ع تمثل مجتمع ما حجمه N وmi متغيرة ع تمثل متوسط عينة حجمها n مسحوبة من ذات المجتمع بدون إرجاع، فإن تباين mi (تباين توزيع المعاينة للمتوسطات) يكتب كما يلي:                      
وتسمى النسبة   معامل الإرجاع.

3           طبيعة توزيع m

ندرس طبيعة توزيع متوسط توزيع المعاينة للمتوسطات من خلال النظريات التالية:
نظرية 4إذا كان المجتمع موزع طبيعيا بمتوسط µ وتباين σ² فإن متوسط العينة المسحوبة منه يتبع أيضا التوزيع الطبيعي بمتوسط µ وتباين σ²/n، ونكتب m ≈ N(µ, σ²/n)

نظرية 5. (نظرية النهاية المركزية): إذا كان المجتمع الذي تسحب منه العينة ذو متوسط µ وتباين σ² لكن ليس بالضرورة طبيعيا فإن المتغيرة المعيارية ل m أي  تؤول إلى التوزيع الطبيعي المعياري عندما يكون n كبيرا (n 30) ونكتب:
z ≈ N(0, 1).
في حالة المجتمع محدود والمعاينة نفادية نستبدل العبارة σ/√n ب                
عمليا يستخدم الإحصائيين هذه الصيغة المعدلة بمعامل الإرجاع للانحراف المعياري عندما n/N ≥ 0.05

مثال:  مجتمع حجمه 900  بمتوسط 20= µ وσ =12 . نستخرج كل العينات الممكنة. أحسب المتوسط والانحراف المعياري لتوزيع المعاينة للمتوسطات في حالة: (1)  حجم العينة n = 36، (2) n = 64 .
(1) n = 36 :   n/N = 36/900 = 0.04 < 0.05 => σm = σ/√n = 12/√36 = 2   
E(m) = µ = 20
مثال2. باستخدام معطيات المثال السابق (n = 36) أحسب احتمال أن يكون m محصورا بين 18 و22.
 أحسب نفس الاحتمال في حالة n = 64.

4          خلاصة

الجدول التالي يبين أهم خصائص توزيع المعينة للمتوسطات.
الخاصية
المعاينة
المجتمع
E(M) = µm = µ
سحب بالإرجاع أو بدون إرجاع
مجتمع ما
سحب بالإرجاع
مجتمع ما
سحب بدون إرجاع
مجتمع ما حجمه N
m ≈ N(µ, σ²/n)
سحب بالإرجاع أو بدون إرجاع
مجتمع موزع طبيعيا بمتوسط µ وتباين σ²
≈ N(0, 1)
عندما يكون n كبيرا (n 30)
مجتمع بمتوسط µ وتباين σ² لكن ليس بالضرورة طبيعيا

النظرية التالية تبين المتوسط، التباين، و طبيعة التوزيع الإحصائية  p' : نسبة خاصية ما في العينة.
نظرية 6 : لتكن X م ع تمثل مجتمع ما غير محدود وموزع طبيعيا حيث p نسبة المفردات في المجتمع ذات صفة معينة، ولتكن p م ع تمثل نسبة المفردات ذات الصفة المذكورة في العينة المسحوبة من ذات المجتمع، نحصل على توزيع للإحصائية ’p حيث معالمه E(p') و'σp، هذه المعالم تساوي :
عند n ≥ 30  :           (p, σp') p’ N
عندما يكون المجتمع محدودا والمعاينة نفاديه نضرب في معامل الإرجاع عند حساب الانحراف المعياري.

مثال[5]. لاحظت إدارة الجامعة أنه في عينة من 100 طالب،  40 حصلوا أخيرا على شهادة. تريد الإدارة تقدير نسبة الطلبة الذين يحصلون على الشهادة داخل مجال يكون احتماله 90 بالمائة.
P(p1< p’< p2) = 0.9 ; n ≥ 30,
نفترض أن N كبير بحيث :  n/N < 0.05
متوسط و تباين توزيع المعاينة للفروق و المجاميع
طبيعة توزيع المعاينة للفروق و المجاميع

1           المتوسط والتباين

ليكن لدينا مجتمعين نسحب من كل منهما عينة عشوائية، نحسب في كل عينة محسوبة من المجتمع الأول الإحصائية S1 ونحسب نفس الاحصائية (المتوسط مثلا أو التباين ...) في كل عينة من المجتمع الثاني ونسميها S2. إن الفرق  S2  S1 يشكل بدوره متغيرة عشوائية لها المتوسط والتباين التاليين:
µS – S2 = µS1 – µS2                         σ²S1 – S2 = σ²S1 + σ²S2
مثال 1.  إذا كانت الاحصائية هي المتوسط فإن:
µm1 – m2 = µm1 – µm2 = µ1 – µ2                   σ²m1 – m2 = σ²m1 + σ²m2  =  σ²/n1 + σ²/n2

مثال 2. إذا كانت الاحصائية هي النسبة فإن:
µp1 p2 = µp1 µp2 = p1 p2                      σ²p1  p2 = σ²p1 + σ²p2  =  p1q1/n1 + p2q2 / n2
إذا كان الاهتمام هو على مجموع الاحصائيتين بدلا من الفرق بينهما فإن:
µS1 + S2 = µS1 + µS2                                   σ²S1 + S2 = σ²S1 + σ²S2

2           طبيعة توزيع المعاينة للفرق بين متوسطين

نظرية 7 : في حالة≥ 30   n1 وn2 ، يقترب توزيع المتغيرة المعيارية للفرق بين متوسطين من التوزيع الطبيعي المعياري. ونكتب:                                       µm1 - m2 ≈ N(0, 1 )

مثال[6] : ليكن المجتمع U1 : 3، 7، 8. والمجتمع U2 : 2، 4. تحقق من أن :
µU1 – U2 = µU1 – µU2 ;               σ²U1 – U2 = σ²U1 + σ²U2 .



U1


U1 – U2
3
7
8
U2
2
1
5
6

4
-1
3
4
µU1 = (3 + 7 + 8)/3 = 6 ; µU2 = (2 + 4)/2 =  3 =>
µU1 – µU2 = 6 – 3 = 3
µU1 – U2 = (1 + 5 + 6 – 1 + 3 + 4)/6 = 3
σ²U1 = (3² + 7² + 8²)/3 - 6² = 14/3 ;
σ²U2 = (2² + 4²)/2 - 3² =1 => σ²U1 + σ²U2 = 17/3
σ²U1 – U2 = (1² + 5² + 6² + 1² + 3² + 4²) / 6 - 3² =
 (1 + 25 + 36 + 1 + 9 + 16) / 6 - 9 = 17/3

توزيع المعاينة للتباين
توزيع المعاينة لنسبة تباينين

1           توزيع المعاينة للتباين

(‌أ)  حالة المعاينة بالإرجاع

مسألة: أحسب تباين المجتمع في المسألة 1، أحسب القيمة المتوقعة لتباين العينة المسحوبة بالإرجاع من خلال متوسط تباينات العينات الممكنة، قارن بين تباين المجتمع والقيمة المتوقعة لتباين العينة.
التباينات الممكنة i
0
1
4
6,25
12,3
1
0
1
2,25
6,25
4
1
0
0,25
2,25
6,25
2,25
0,25
0
1
12,3
6,25
2,25
1
0
                 
(∑ii)/25 = 73/25 = 2.92   =>E(S²) = 2.92


σ² = E(X²) – E(X)²
= [(1 + 9 + 25 + 36 + 64)/5] - 4.6² = (135/5) - 21 = 5.84
E(S²) = 2.92 = 5.84/2  =        σ² (1/n)

نظرية 8 : إذا كانت م ع تمثل مجتمع ما وS² متغيرة ع تمثل تباين عينة مسحوبة بالإرجاع (أو بدون إرجاع من مجتمع غير محدود) حجمها n، فإن :           
 (عند  n ≥ 30 :    E(S²) σ² )
البرهان:

ملاحظة: من النظرية نجد أن:    ونقول عن  أنه مقدر "غير منحرف" ل σ² ويرمز له ب S² حيث


نظرية 9 : إذا أخذنا عينات عشوائية حجمها n من مجتمع طبيعي، فإن : 

مثال :  ليكن مجتمع طبيعي حجمه 100 نسحب منه عينة حجمها n = 16  . ما هو احتمال أن يكون تباين العينة أقل من أو يساوي 10 علما أن تباين المجتمع 80.
  
    من الجدول  P(X²15 ≤ 2) < 0.005

(‌ب)                     حالة المعاينة بدون إرجاع

التباينات الممكنة S²i
1



4
1


6,25
2,25
0,25

12,3
6,25
2,25
1
مسألة: في المسألة 1 أحسب تباين المتوسطات الممكنة للعينة  σ²mفي حالة المعاينة بدون إرجاع، قارن بين تباين المجتمع وتباين المتوسطات الممكنة للعينة.                                                                    
(∑ii) = 36.5 ;    (∑ii)/10 = 3.65   => E(S²) = 3.65
σ² = E(X²) – E(X)²
     = [(1 + 9 + 25 + 36 + 64)/5] - 4.6² = 5.84
E(S²) = 3.65 = 5.84*(5/4) (1/2)
                                                          = σ² * [(n-1)/ n] [N/ (N-1)]

نظرية 10 :  إذا كانت م ع تمثل مجتمع ما محدود وS² متغيرة ع تمثل تباين عينة نفادية مسحوبة من ذات المجتمع، فإن القيمة المتوقعة لتباين العينة تكتب: 
(عندما يكون N كبير جدا N/ (N-1)   تؤول إلى 1)

2           توزيع المعاينة لنسبة تباينين

رأينا في الفصل السابق أن:  ~Fν1, ν2 في حالة المتغيرتان العشوائيتان مستقلتان
 و  X1 ~ χν1² و  χν2² X2 ~ .    من النظرية 9 نستنتج ما يلي:
نظرية 12 : ليكن لدينا مجتمعان طبيعيان تبايناهما σ²1 , σ²2  . نسحب من المجتمعين عينتين عشوائيتين حجمهما على التوالي n1 , n2 :

مثال[7] . عينتين حجمهما 8 و10 مسحوبتين من مجتمعين طبيعيين تبايناهما على التوالي 20 و36. ما احتمال أن يكون تباين الأولى أكبر من ضعف تباين الثانية؟
                              
= P(F7, 9 > 3.7)
من الجدول نجد 0.05 > P(F7, 9 > 3.7) > 0.01     و في الحقيقة P(F7, 9 > 3.7) = 0.036 

3           ملحق

(‌أ)  الانحراف المعياري لتوزيع المعاينة للتباين

نظرية 11 : إذا كانت X م ع تمثل مجتمع ما وS² متغيرة ع تمثل تباين عينة مسحوبة من ذات المجتمع، فإن:

من أجل n ≥ 100 ، توزيع S²  يقترب كثيرا من التوزيع الطبيعي.

(‌ب)                     الانحراف المعياري لتوزيع المعاينة للانحراف المعياري


من أجل n ≥ 100 ، توزيع S  يقترب كثيرا من التوزيع الطبيعي و µsS

4           خلاصة

الجدول التالي يلخص ما ورد في النظريات السابقة من 6 إلى 10 .
الخاصية
المعاينة
المجتمع
إحصائية العينة
            

مجتمع موزع طبيعيا
غير محدود
النسبة
(p, σp') p’ N
n ≥ 30
لحساب σp' نضرب في معامل الإرجاع.

المعاينة نفاديه
مجتمع طبيعي
 محدود
µS – S2 = µS1 – µS2
µS1 + S2 = µS1 + µS2

σ²S1 – S2 = σ²S1 + σ²S2
σ²S1 + S2 = σ²S1 + σ²S2

سحب بالإرجاع
مجتمع ما
الفرق بين إحصائيتين ما.
µm1 - m2 ≈ N(0, 1 )
≥ 30   n1 وn2
سحب بالإرجاع (أو بدون إرجاع من مجتمع غير محدود)
حجمها n
مجتمع ما وتباين عينة S²
التباين
E(S²) σ²
n ≥ 30
حجمها n
مجتمع طبيعي
عينة نفادية
مجتمع ما محدود و تمثل تباين العينة

N/ (N-1)   تؤول إلى 1
N كبير جدا
عينتين عشوائيتين حجمهما على التوالي n1 , n2
مجتمعان طبيعيان تبايناهما σ²1 , σ²2

نسبة تباينين


مفاهيم أساسية                   طرق التقدير بمجال                      طرق تأسيس المقدر
في الفصل السابق درسنا من خلال مجموعة من النظريات العلاقة الرياضية بين معالم العينة والمعالم المناظرة لها في المجتمع مثل المتوسط، التباين، النسبة...كما درسنا العلاقة بين شكل توزيع المجتمع وشكل التوزيع الاحتمالي لمعالم العينة. تظهر هذه العلاقات كتوصيف لخصائص العينة ومعالمها ولكنها تستخدم أكثر لتقدير خصائص ومعالم المجتمع محل الدراسة، وهذا ما سنتعرف عليه في هذا الفصل.
بعض خصائص المقدر
التقدير النقطي، التقدير بمجال

1           بعض خصائص المقدر[8]

لتقدير معلمة من معالم مجتمع محل دراسة، نحتاج إلى اختيار الإحصائية المناسبة في العينة لتقدير هذه المعلمة. غالبا ما تكون المعلمة المناظرة في العينة هي أحسن مقدر، كأن نقدر متوسط المجتمع µ من خلال متوسط العينةµm . تسمى الإحصائية المستخدمة في التقدير المقدر.

(‌أ)  المقدر غير المتحيز

نقول عن إحصائية ما بأنها مقدر غير متحيز sans biais لمعلمة المجتمع إذا كان متوسطها أو توقعها الرياضي مساويا لمعلمة المجتمع.
مثال: نقول عن متوسط العينة m أنه مقدر غير متحيز لمتوسط المجتمع µ لأن E(m) = µ . في المقابل نسمي الإحصائية S² في معاينة بالإرجاع أنها مقدر متحيز ل σ² لأن E(S²) = σ² (n-1)/n ≠ σ² ، بينما تعتبر الاحصائية= S²n/(n-1)  S’² مقدرا غير متحيز في معاينة بالإرجاع.

(‌ب)                     الكفاءة

تتعلق كفاءة (efficacité) مقدر ما بمقدار التباين لتوزيع المعاينة للإحصائية، فإذا كان لمقدرين (إحصائيتين) نفس المتوسط نقول عن المقدر ذو توزيع المعاينة الأقل تباينا أنه الأكثر كفاءة.
مثال: لكل من توزيعي المعاينة للمتوسط والوسيط نفس المتوسط هو متوسط المجتمعµ  ، لكن يعتبر المتوسط m مقدرا أكثر كفاءة لمتوسط المجتمعµ  من الوسيط لأن تباين توزيع المعاينة للمتوسطات V(m) = σ²/n أقل من تباين توزيع المعاينة للوسيط :
V(méd) = σ²π/2n = (σ²/n) (3.14159/2)      >      σ²/n .
من البديهي أن استخدام مقدرات فعالة وغير متحيزة هو الأفضل، إلا أنه قد يلجأ لمقدرات أخرى لسهولة الحصول عليها.

(‌ج)                      التقارب  convergeance    

نقول عن مقدر أنه متقارب إذا كان يؤول إلى قيمة المعلمة المقدرة عندما يؤول حجم العينة إلى ما لا نهاية.
مثال: يعتبر متوسط العينة مقدرا متقاربا لمتوسط المجتمع لأن:

2           التقدير النقطي والتقدير بمجال[9].

قد نحتاج إلى تقدير لمعلمة مجتمع بقيمة واحدة ونقول عن هذا التقدير أنه تقدير نقطي، و أحيانا أخرى نحتاج إلى تقدير معلمة المجتمع بنقطتين يحددان مجال لقيمة المعلمة ونقول عن هذا النوع من التقدير أنه تقدير بمجال.
مثال : إذا قدرنا دخل الأسرة في منطقة ما ب 18000 دج، نكون قد قدرنا دخل الأسرة تقديرا نقطيا. يكون تقديرنا بمجال إذا قلنا مثلا أن الدخل يساوي 18000 ± 2000 أي أنه يتراوح بين 16000 و20000دج.

(‌أ)  درجة التأكد

لكي يكون التقدير علميا ينبغي تقييم احتمال أن تكون المعلمة تنتمي فعلا إلى المجال المحدد، لذلك نلحق بالمجال ما يسمى بدرجة أو مستوى الثقة، ويرمز له ب p. الاحتمال المعاكس يسمى احتمال الخطأ ويرمز له ب  α، ويسمى أيضا ""مستوى المعنوية".
مثال: دخل الأسرة في المنطقة (أ) ينتمي إلى المجال [16000، 20000] بمستوى معنوية 5%  أي بمستوى ثقة 95%  . وتسمي الحدود 16000 و20000 حدود الثقة.

(‌ب)                     تعيين حدود مجال الثقة

تحدد حدود الثقة من خلال معاملات الثقة التي بدورها تحدد من خلال مستوى المعنوية (مستوى الثقة). ففي حالة استخدام التوزيع الطبيعي للتقدير تكون القيمتين ± 1.96 معاملات الثقة من أجل مستوى ثقة 95% بينما القيمتين ±2.58 تمثلان معاملات الثقة من أجل مستوى ثقة 99 %  .







مثال: ليكن µs وσs متوسط وانحراف معياري توزيع المعاينة لإحصائية ما s حيث µs = µ . إذا كان توزيع المعاينة ل s توزيعا طبيعيا (كما هو الحال بالنسبة لأغلب الإحصائيات عندما (n ≥ 30) ) فإننا نقدر مثلا وبالنظر إلى توزيع s أن:
  القيمتين µs ± 1.96σs تمثلان حدود الثقة ب 95 %، و  µs ± 2.58σs حدود الثقة ب 99% .
في حالة التوزيع الطبيعي يرمز لحدود الثقة ب Zc  أو Z1-α/2  (أنظر الرسم).
كيفية تعيين مجال الثقة للمتوسط
كيفية تعيين مجال الثقة للنسبة
كيفية تعيين مجال الثقة للتباين
كيفية تعيين مجال الثقة لنسبة تباينين

1           مجال الثقة للمتوسط

يقدر متوسط المجتمع µ من خلال الإحصائية m.

(‌أ)  تقدير µ باستخدام التوزيع الطبيعي 

نستخدم التوزيع الطبيعي لتحديد مجال الثقة إذا علمنا أن المجتمع الذي سحبت منه العينة يتبع التوزيع الطبيعي.
وفي حالة العينة الممتدة (n ≥ 30)  يمكن كذلك الاستفادة من نظرية النهاية المركزية[10] أن m تتبع التوزيع الطبيعي.
تكتب حدود مجال الثقة كما يلي:
     



إلا أنه غالبا ما يكون الانحراف المعياري للمجتمع σ مجهولا، ولذلك نعوض σ في الصيغ السابقة بالمقدر S’ أو S.
الجدول الآتي يبين قيم  zc التي تمثل حدود مجال الثقة بحسب مستوى الثقة :
مستوى الثقة   1-α
0.99
0.98
0.95
0.90
0.8
0.5
α  مستوى المعنوية
0.01
0.02
0.05
0.10
0.2
0.5
  1- α/2
0.995
0.99
0.975
0.95
0.9
0.75
Z1-α/2
82.5
2.326
1.96
1.645
1.282
0.674
مثال : نقدر أن µ يوجد داخل المجال m  ± 1.96σm  بمستوى ثقة 95% (0.95) أي بمستوى معنوية 5 %  (0.05)، وداخل المجال m ± 2.58σm بمستوى ثقة 99% أي بمستوى معنوية  0.01...

(‌ب)                     تقدير µ باستخدام التوزيع t :

في حالة العينة الصغيرة (n < 30)وσ مجهول نستخدم توزيع ستيودنت لتحديد مجالات الثقة ل µ. مثلا القيم-t0.975  ؛ t0.975    تحد 95%  من المساحة تحت المنحنى ونقول أن  -t0.975 ; t0.975 تمثل القيم الحرجة أو معاملات الثقة عند مستوى ثقة 95%  ونكتب:

ومنه نستخلص مجال الثقة ل µ  كما يلي:

2           مجال الثقة للنسبة

(‌أ)  حالة المجتمع غير محدود أو المعاينة غير نفادية و العينة الممتدة (n ≥ 30) :

لتكن s إحصائية تمثل نسبة "نجاحات" في عينة ذات حجم n ≥ 30 مستخرجة من مجتمع ثنائي حيث p هي نسبة النجاحات. تستعمل التوزيع الطبيعي لتقدير p فنعين حدود الثقة ل p كما يلي: p’ ± zcσp  أينp’ نسبة النجاحات في العينة،
نعلم من الفصل السابق أن  ومنه يحدد مجال الثقة ل p كما يلي:

(‌ب)                     في حالة كون المجتمع محدود ذا حجم  Nوالمعاينة نفادية:

3           مجال الثقة للتباين

لتقدير التباين والانحراف المعياري لمجتمع بمجال ثقة نستعمل الخاصية : .
مثال: مجال الثقة ب95%  يحدد كما يلي:



نظرا لأن توزيع ك2 غير متماثل فإن المجال أعلاه ليس الأمثل، إذ توجد طريقة لتضييق مجال الثقة أكثر إذا لم نشأ أن تكون أطراف المنحنى متساوية، وهذا بخلاف التوزيعات المتماثلة كالطبيعي وستيودنت.

4           مجالات الثقة لنسبة تباينين

رأينا سابقا (نظرية 11 من الفصل 5) أنه إذا كان لدينا مجتمعان طبيعيان تبايناهما σ²1 , σ²2  وسحبنا منهما عينتين عشوائيتين حجمهما على التوالي n1 , n2 فإن : 
إذا يمكن تكوين تقدير بمجال لF  عند مستوى ثقة 0.98 كما يلي:

و من ثم يمكن تقدير النسبة بين تبايني المجتمعين كما يلي:





5           خلاصة

لتقدير إحصائية مجتمع نستخدم نظريات توزيع المعاينة. هذه النظريات تتناول خصائص إحصائيات العينة من متوسط العينة، النسبة في العينة، ... و علاقتها بالإحصائيات المناظرة لها في المجتمع.
جدول  1  توزيع المعاينة للمتوسطات حسب طبيعة توزيع المجتمع، معلومية التباين و حجم العينة.

قانون
n
تباين المجتمع    (σ²)
قانون المجتمع
N(µ ; σ/√n)
σ/√n
n < 30 أو n 30  
معلوم
طبيعي
N(µ ; S’/√n)
S’/√n
n 30
غير معلوم
tα; n-1
S’/√n
n < 30
N(µ ; σ/√n)
σ/√n
n 30
معلوم
غير معلوم
N(µ ; S’/√n)
S’/√n
n ≥ 100
غير معلوم

جدول  2  تحديد مجال الثقة للنسبة، للتباين وللنسبة بين تباينين

المجتمع
التوزيع الاحتمالي للإحصائية
مجال الثقة
مجتمع غير محدود أو معاينة غير نفادية و عينة ممتدة (n ≥ 30)
التوزيع الطبيعي
مجتمع محدود ذا حجم  N والمعاينة نفادية
التوزيع الطبيعي
غير معلوم
   أو
مجتمعين طبيعيين، أو عينتين مسحوبتين من مجتمع طبيعي واحد.
مثلا عند مستوى ثقة 0.98:

6           ملحق. مجالات الثقة للفروق والمجاميع

إذا كانت s1 وs2 إحصائيتا معاينة لها توزيع يقترب من التوزيع الطبيعي، والعينتان مستقلتان، تكتب حدود الثقة للفروق بين المعالم التي تمثلها الإحصائيتين كما يلي:

في حالة المجموع :

مثال: إذا كانت الإحصائيتان هما متوسطا عينتين مستقلتين، مسحوبتين من مجتمعين غير محدودين، نحدد مجال الثقة للفرق (و للمجموع) بين متوسطي المجتمعين µ1 - µ2 كما يلي :
مثال 2: إذا كانت الإحصائيتان هما نسبتان في عينتين مستقلتين، مسحوبتان من مجتمعين غير محدودين :



 طريقة العزوم
طريقة المعقولية العظمى (الاحتمال الأكبر)

أحد الطرق لاختيار مقدر معلمة ما للمجتمع أن نأخذ مباشرة نظيرتها في العينة، وإذا كان هذا المقدر لا يتصف بالخصائص المطلوبة نجري عليه تعديلا (استخدامS’²  بدلا من لتقدير σ²). توجد طرق أخرى لتحديد المقدر الأنسب منها طريقة المعقولية العظمى والتي تدعى أيضا طريقة الاحتمال الأكبر والتي تنسب إلى العالم فيشر وكذا طريقة العزوم.

1           طريقة العزوم

ليكن المطلوب تقدير عدد K من معالم المجتمع : θ1, θ2, . . , θk. نكون جملة معادلات عددها K. تتضمن كل معادلة مساواة العزم المرتبط بالأصل من الدرجة k لمتغيرة المجتمع X  :µ’k = E(Xk) ، بنظيره لمتغيرة المعاينة x :
m’k = (1/n)∑ixik      k = 1, 2,    , K
مثال: ليكن X ~ B(20; p)  . تقدير p  بطريقة العزوم انطلاقا من عينة يتم كما يلي:
لدينا عدد المعالم المراد تقديرها K = 1 إذا نحتاج إلى معادلة واحدة : µ = 20p .ومنه p = 20/µ، نأخذ إذا كمقدر لp القيمة: p’ ونحسبها كما يلي : p’ = m/20  .
في حالة تقدير معلمتين للمجتمع نحتاج أن نستعمل جملة المعادلتين: µ = m   ,   µ’2 = m’2           
مثال2 : لتكن X ~ N(µ; σ²). نسحب عينة ذات متوسط m، وتباين . لتقدير µ وσ² نحتاج إلى حل جملة المعادلتين: 
هذه الطريقة قد تعطي مقدرات متحيزة كما في هذه الحالة.

2           طريقة المعقولية العظمى (طريقة الاحتمال الأكبر)

حالة كون متغيرة المجتمع متقطعة : نريد تقدير معلمة θ واحدة للمجتمع، ولدينا عينة غير نفادية (المتغيرا ت التي تمثل قيم المحصل عليها في العينة مستقلة) لها نفس التوزيع للمجتمع. من البديهي أن احتمال تحقق عينة بذاتها مرتبط ب قيمة المعلمة المجهولة : P(x1, x2, …,xn) = L(θ). هناك قيمة ل θ تعظم احتمال الحصول على العينة المحصل عليها، ونفترض أن تلك القيمة هي الصحيحة بما أن العينة حصلت بالفعل. تتمثل طريقة المعقولية العظمى في البحث عن هذه القيمة. أي البحث عن θ التي تعظم L(θ) ، حيث :
L(θ) = f(x1, . . . , xn ; θ) = f(x1) . f(x2) . . . f(xn.
تعتمد طريقة المعقولية العظمى على تعظيم دالة الاحتمال المشتركة   L(θ)  .
مثال: ليكن X ~ B(p)، حيث النجاح هو وجود الخاصية " أ " لدى فرد مسحوب عشوائيا من المجتمع. نرد تقدير p من خلال عينة حجمها 2. ما هي القيمة p’ ل p التي تجعل النتيجة 1، 0 هي الأكثر احتمالا؟ أي ما هي p’  التي تجعل p(0.1) = pq أكبر ما يمكن؟
من الواضح أن أكبر قيمة ل p(0.1) هي ¼  والقيمة التي تحققها هي  p’ = 1/2 ، وبهذا نجيب على التساؤل.











اختبار المتوسط                                                                                     
اختبار النسبة واختبار التباين
اختبارات المقارنة بين مجتمعين
اختبار التجانس و اختبار التعديل
في الفصل السابق تناولنا كيفية تقدير معالم المجتمع من خلال بيانات العينة وبعض خصائص المقدر الجيد. في هذا الفصل[12] سنتناول كيفية اختبار فرضيات موضوعة حول معالم مجتمع أو أكثر. يحتاج الدارس أحيانا في مرحلة ما من بحثه إلى اختبار فرضية أو أكثر بخصوص المجتمع المدروس. من أمثلة ذلك: اختبار فرضية بخصوص معدل الدخل في منطقة معينة، اختبار فرضية نسبة شفاء لدواء معين، ... يتم ذلك بصياغة فرضية عن المجتمع المدروس (أو المجتمعات المدروسة) ومن ثم محاولة الحصول على دليل إحصائي ينفي أو يثبت هذه الفرضية وذلك من خلال بيانات عينة (أو أكثر) عشوائية بسيطة. تخص الفرضية أحد معالم المجتمع كالمتوسط، النسبة أو التباين، ونعتمد في إثباتها أو رفضها على خصائص إحصائية معاينة مختارة. من أجل ذلك يعتمد هذا الدرس، كما هو الحال بالنسبة لدرس التقدير، على درس المعاينة.

الاختبار ثنائي الاتجاه للمتوسط
الاختبار أحادي الاتجاه للمتوسط
استخدام S كمقدر لتباين المجتمع في اختبار المتزسط
اختبار المتزسط باستخدام توزيع t

 يتناول هذا الاختبار متوسط المجتمع (µ)، مثل متوسط الدخل، متوسط وزن منتج معين، .. ويؤكد اختبار المتوسط فرضية مساواته لقيمة ما µ0. و للقيام بالاختبار نستخرج عينة عشوائية نحسب فيها المتوسط m ثم نستخدم التوزيع الاحتمالي ل m لقياس قرب أو بعد هذه القيمة من µ0

1             اختبار ثنائي الاتجاه للمتوسط.

لنتناول هذا المثال: نريد اختبار فرضية حول متوسط دخل الطالب في السنة الأولى من تخرجه، ولتكن القيمة الافتراضية هي 15000دج كمتوسط للدخل الشهري. نحتاج إلى الخطوات التالية: تحديد الفرضيات، تحديد قاعدة القرار، حساب القيمة الجدولية للمتغيرة، حساب القيمة  الفعلية للمتغيرة، اتخاذ القرار. 

(‌أ)  تحديد الفرضيات (الصفرية والبديلة):         

↔ H1 : µ ≠ µ0    H0 : µ = µ0
تسمى الفرضية H0 الفرضية الصفرية أو فرضية العدم، ويؤدي الاختبار إما إلى رفضها ونكتب RHo وفي هذه الحالة نقبل الفرضية البديلة أو المعاكسة أو عدم رفضها ونكتب R’H0. µ0 هي القيمة الافتراضية ل µ وهي في هذه الحالة 15000 لذلك نكتب الفرضيات كما يلي:
↔ H1 : µ ≠ 15000    H0 : µ = 15000
عادة ما تكون µ0 محددة بناءا على بيانات عينة عشوائية بسيطة 0 = m)، وفي هذه الحالة يمكن استخدام الخاصية
 m ~ N(µ, σ²/n) لاجراء الاختبار، حيث أنه تحت H0 فإن :            m ~ N(µ0 , σ²/n)
مما يعني معلومية احتمال أن يكون m قريب إلى درجة ما من µ0 فمثلا :
P(µ0 – 1.64(σm) m µ0 + 1.64(σm)) = 0.90
P(µ0 – 1.96(σm) m µ0 + 1.96(σm)) = 0.95
P(µ0 – 2.58(σm) m µ0 + 2.58(σm)) = 0.99
وبصفة عامة نكتب:
P[µ0 – z1-α/2(σm)  m   µ0 + z1-α/2 (σm)] = 1-α
أو حسب الكتابة الأكثر شيوعا:    

حيث:
§         (m - µ0)/σm : (متغيرة القرار) هي المتغيرة المعيارية ل m ونرمز لها ب zc، حيث z ~ N(0, 1)   .
§         σm تحدد كما يلي:   σm= σ/√nفي حالة المعاينة بالإرجاع  (أو n ≤ 0.05N ) و  في الحالة المعاكسة.
§         1 - α/2 : المساحة على يسار z .
§         n : حجم العينة.
يمكن إذا كان m خارج المجال 1-α، أن نرفض الفرضية الصفرية التي حدد على أساسها هذا المجال ونقبل بالتالي الفرضية البديلة.
تسمى هذه (الخطة) قاعدة القرار.

(‌ب)                      تحديد قاعدة القرار

 تكتب قاعدة القرار في المثال الذي بين أيدينا، وهي قاعدة اختبار ثنائي الاتجاه (أنظر الشكل 1) ، كما يلي:
  أو       

رسم  23  منطقتي القبول و الرفض في حالة قاعد القرار الثنائية

Figure 24  منحنى القوة
تتضمن هذه الخطة مخاطرة تتمثل في الوصول إلى قرار خاطىء: فقد تكون الفرضية H0 صحيحة بينما تقودنا قيمة m المحصلة إلى رفضها، ويسمى هذا الخطأ من النوع الأول، واحتماله  α، ويكتب :   P(RH0 / H0) = α،
و قد تقودنا قيمة m إلى قبولH0  فيما هي خاطئة، ويسمى هذا الخطأ من النوع الثاني واحتماله 1- α ويكتب :
P(R’H0 / H1 ) = 1-α
و يمكن تقليص احتمال أحد الخطأين على حساب الثاني، ولكن لا يمكن تقليص احتمال كلا الخطأين معا إلا بزيادة حجم العينة. 
و يقيس احتمال رفض الفرضية الصفرية P(RH0) قوة الاختبار (أنظر الشكل 2) فيما يقيس احتمال قبولها P(R’H0) فعالية الاختبار (أنظر الشكل 2). ويتوقف كلا الاحتمالين على القيمة الحقيقية ل µ  .

(2)  منحنى القوة


(‌ج)                      حساب z الجدولية:

ويرمز لها ب zt حيث، وهي المشار إليها في قاعدة القرار (الشكل الثاني)، وفي حالتنا (اختبار ثنائي بمستوى معنوية 5%) :
zt = z1-α/2 = z1-0.05/2 = z1-0.025 = z0.975
ومن الجدول نجد أن z0.975 = 1.96  .

(‌د) حساب z  الفعلية:

ويرمز لها ب zc  وهي المتغير المعيارية ل m (أنظر قاعدة القرار الشكل الأول) :

(‌ه)   القرار:

نقرر قبول أو رفض H0 حسب قاعدة القرار. وفي حالتنا نرفض H0 لأن zc > zt  ونقبل H1 أي أن متوسط دخل الخريج حديث التوظيف ليس 15000دج.

2           الاختبار أحادي الاتجاه للمتوسط.

يتميز الاختبار الثنائي عن الأحادي في الفرضية البديلة التي هي عدم مساواة في الاختبار الثنائي وأكبر تماما أو أصغر تماما (حسب الحالة) في الاختبار الأحادي، وهذا يترتب عليه تغيير في قاعدة القرار.

(‌أ)  الاختبار أحادي الاتجاه من اليمين.

لنرجع إلى المثال السابق مع تغيير محدد هو أننا نريد اختبار ما إذا كان متوسط الدخل للخريج 15000دج أم أكثر (اختبار من اليمين).
أ- الفرضيات :                           ↔ H1 : µ > µ0    H0 : µ = µ0
في هذه الحالة µ0 = 15000  لذلك نكتب :                ↔ H1 : µ > 15000    H0 : µ = 15000
ب- قاعدة القرار:                                     
ج- حساب z الجدولية: (اختبار على اليمين بمستوى معنوية 5%) :                 zt = z1-α = z1-0.05 = z0.95
ومن الجدول نجد أن                                      z0.95 = 1.645   
د- حساب z  الفعلية:            
ه- القرار: نرفض H0 لأن zc > zt  ونقبل H1 أي أن متوسط دخل الخريج حديث التوظيف ليس 15000دج وإنما هو أكبر.

(‌ب)                     الاختبار أحادي الاتجاه من اليسار 

نعود إلى مثالنا ونفترض أن متوسط العينة كان 14200دج ونريد أن نختبر ما إذا كان متوسط الدخل مساوي أم أقل من 15000دج.
أ- الفرضيات :               ↔ H1 : µ < 15000    H0 : µ = 15000
ب- قاعدة القرار:                           

ج- حساب z الجدولية: (اختبار على اليسار بمستوى معنوية 5 %) :   
         = -1.645  zt = - z1-α = - z1-0.05 = -  z0.95
د- حساب z  الفعلية:               
ه- القرار: نرفض H0 لأن zc < zt  ونقبل H1 أي أن متوسط دخل الخريج حديث التوظيف أقل من 15000دج .

3           استخدام S كمقدر ل σ في اختبار المتوسط.

في الأمثلة السابقة افترضنا أن σ معلوم، في الواقع غالبا ما يكون الانحراف المعياري مجهولا ونحتاج بالتالي إلى استخدام الانحراف المعياري للعينة (S) عند حساب σm (أنظر درس التقدير)، حيث نعوض العبارة
  σm = σ/√n        
مثال: في المثال السابق نفترض أن الانحراف المعياري للدخل الشهري للطالب مجهول، لكن الانحراف المعياري للعينة S = 1600 . كيف يمكن اختبار ما إذا كان الدخل الشهري أقل من 15000دج؟
الخطوات أ، ب ، ج تبقى بدون تغيير.
د- حساب z  الفعلية:     
ه- القرار: نرفض H0 لأن zc < zt  ونقبل H1 أي أن متوسط دخل الخريج حديث التوظيف ليس 15000دج وإنما هو أقل.

4           استخدام التوزيع t في اختبار المتوسط.

في حالة n< 30  وσ (الانحراف المعياري للمجتمع) مجهولا، لا يمكن استخدام التوزيع الطبيعي، ولكن  لدينا :
        و تحت H0  (µ = µ0 ) : 
يمكن إذا استخدام التوزيع ستيودنت (بشرط أن يكون توزيع المجتمع طبيعيا أو على الأقل جرسي الشكل) .
و تتغير قاعدة القرار تبعا لهذا التغيير فتكتب في حالة الاختبار الثنائي كما يلي:

في حالة اختبار من اليمين: 
في حالة اختبار من اليسار:

5           خلاصة

يتم اختبار الفرضيات من خلال 5 خطوات متتالية وهي:
§         تحديد الفرضيات (الصفرية والبديلة)
§         تحديد قاعدة القرار
§         حساب القيمة الجدولية للمتغيرة
§         حساب القيمة الفعلية للمتغيرة
§         اتخاذ القرار.
تتحدد كيفية إتمام كل خطوة حسب طبيعة الاختبار (ثنائي أو أحادي الاتجاه)، حسب طبيعة المجتمع و طبيعة و حجم العينة، ... و تسخدم في ذلك نظريات توزيع المعاينة.
اختبار النسبة
اختبار التباين

1            اختبار النسبة

يتعلق هذا الاختبار بنسبة مفردات المجتمع التي تتصف بخاصية ما (p)، حيث يؤكد الاختبار أو ينفي صحة فرضية معينة بخصوص قيمة p . يرمز للقيمة الافتراضية ب p0  وتكتب الفرضية كما يلي:    H0 : p = p0
للقيام بالاختبار نستخدم خصائص p’ النسبة في العينة (أنظر توزيع المعاينة للنسبة : نظرية 6).

عند n ≥ 30  : (p, σp') p’ ≈ N   (نظرية موافر- لابلاس)
استنادا إلى هذه الخصائص وتحت H0 : 
و من ثم يمكن تحديد قاعدة القرار بحسب طبيعة الاختباركما يلي:
في حالة الاختبار الثنائي:  
في حالة اختبار من اليمين:
                                      في حالة اختبار من اليسار: 
مثال: تقدر الدوائر الرسمية نسبة المتخرجين الجامعيين الذين يحصلون على عمل في السنة الأولى التي تلي تخرجهم ب 70  % . وجدت دراسة أجريت على عينة من 900 طالب أن نسبة الحصول على عمل 67 % . كيف يمكن اختبار ما إذا كانت النسبة الرسمية صحيحة أم مبالغ فيها، بمستوى معنوية 5 %.
H0 : p = 0.70 ↔ H1 : p <  0.70

ومنه نرفض الفرضية H0 .

2           اختبار التباين

لاختبار صدقية فرضية بخصوص قيمة تباين مجتمع ما،
H0 : σ² =σ0²   ↔ H1 : σ² = σ0²
نستعمل المقدر غير المنحاز. حيث في حالة العينة الكبيرة (n ≥ 50 في أحسن الأحوال) ، وتحت H0 فإن 
حيث µ4 هو العزم المركزي من الدرجة الرابعة. وبهذا الشكل تكتب قاعدة القرار للاختبار الثنائي كما يلي:

 
وفي حالة µ4 مجهول يمكن استخدام كمقدر : m4 = E(xi – m)4 .
وإذا كان المجتمع طبيعيا، حيث  µ4 = 3σ4 ، فإن متغيرة القرار يمكن أن تكتب كما يلي:




اختبار تساوي متوسطي مجتمعين
اختبار تساوي تبايني مجتمعين

يتناول هذا الاختبار مقارنة بين مجتمعين من خلال المتوسط أو التباين لكل منهما ... وسنركز هنا على متغيرة القرار، إذ من السهل على الطالب استنتاج كيفية إتمام الخطوات الأخرى على ضوء ما سبق.

1           اختبار تساوي متوسطي مجتمعين

الغرض من الاختبار هو تأكيد أو نفي تساوي متوسطي مجتمعين من خلال عينتين عشوائيتين بسيطتين مستقلتين. تكتب الفرضيات (في حالة الاختبار الثنائي)كما يلي:   H0 : µ1 = µ↔   H1 : µ1 µ2
لتحديد متغيرة القرار نعتمد في الاختبار على متغيرة القرار T أو T’  بحسب الحالة (نترك للطالب استنتاج قاعدة القرار)، حيث نميز بين حالة كون تباينا المجتمعين معلومين وحالة كون تباينا المجتمعين مجهولين.

(‌أ)  تباينا المجتمعين معلومين

1-  المجتمعين طبيعيين:

2-  مجتمعين ما (n1 , n2 ≥ 30):        

(‌ب)                     تباينا المجتمعين مجهولين

1- المجتمعان طبيعيان:
 إذا كان تباينا المجتمعين متساويين       
2- مجتمعين ما  (n1 , n2 ≥ 30):                
مثال: نسحب من مجتمعين طبيعيين متساويي التباين عينتين حجم الأولى 18 وحجم الثانية 21. وجدنا النتائج التالية:
 m1 = 81, m2 = 76, S²1 = 9, S²2 = 8. كيف يمكن اجراء اختبار تساوي متوسطي المجتمعين بمستوى معنوية 5 % .
H0 : µ1 = µ2   ↔ H1 : µ1  ≠   µ2

2           اختبار تساوي تبايني مجتمعين

الغرض من الاختبار هو تأكيد أو نفي تساوي تباينا مجتمعين من خلال عينتين عشوائيتين بسيطتين مستقلتين.
تكتب الفرضيات (في حالة الاختبار الثنائي)كما يلي:   H0 : σ²1 = σ²2  ↔  H1 : σ²1  σ²2    
نعتمد في الاختبار على متغيرة القرار T أو T’  بحسب الحالة، حيث نميز بين حالة كون المجتمعين طبيعيين أم غير ذلك.

(‌أ)  مجتمعين طبيعيين

                   1-  الحالة العامة:                  
2-  في حالة n1 , n2 ≥ 30                 

(‌ب)                      مجتمعين ما (n1, n2 ≥ 50)

1-    µ4 (1) ; µ4 (2)   معروفين :
 
2-     في حالة  µ4 (1) ; µ4 (2)   غير معروفين : نعوض µ4  ب m4 .
مثال : نسحب من مجتمعين طبيعيين عينتين حجم الأولى 18 وحجم الثانية 21. وجدنا النتائج التالية:
m1 = 81, m2 = 76, S²1 = 9, S²2 = 8. كيف يمكن اجراء اختبار تساوي متوسطي المجتمعين بمستوى معنوية 5 % ؟
H0 : σ²1 = σ²2   H1 : σ²1  ≠   σ²2
S’²1 = S²1 * n1 / (n1-1) = 9 (18)/17 ≈ 9.53 S’²2 = S²2 * n2 / (n2-1) = 8 (21)/20 = 8.4
 S’²1 / S’²2 ≈ 1.135 ; F0.05 ;17 ;20  ≈ 2.17
T < Fα  ; n1-1 ;n2-1  => R’H0

اختبار التعديل

1           اختبار التجانس

لنعد إلى اختبار النسبة، ونفترض أن لدينا عددا k من الخصائص المتنافية، نسبة تحقق كل منها في المجتمع  pi  حيث ∑pi = 1. نريد اختبار فرضية تساوي هذه النسب:
pi pi0    H0 : pi = pi0   (i = 1, 2, . . . k ) ↔ H1 :
(الفرضية البديلة هي أن إحدى النسب النظرية pi0  على الأقل غير مساوية للقيمة الحقيقية.)
 متغيرة القرار : لإنجاز الاختبار نستخرج عينة نحسب فيها عدد مرات تحقق الخصائص (ni) . إذا تحققت الشروط
n ≥ 30  ، pi0 ≥ 1        وعلى الأقل في 80 % من الحالات npi0 ≥ 5     نبرهن أن :















تعليقات

المشاركات الشائعة من هذه المدونة

الربح عن طرق الانترنت