محاضرات الاحصاء الرياضي5

التوزيع متى يستخدم القيم الممكنة للمتغيرة الاحتمال التوقع والتباين
الهندسي الزائد
b,p) X~ H(N, سحب بدون إرجاع.
كريات من صنفين. X ={0,1,2,…,b} ,

b ≤ b + r = N

p = b/N وq = r/N
n عدد الكريات المسحوبة N العدد الكلي للكريات
b عدد الكريات البيضاء
r ع الكريات الحمراء
الهندسي الزائد المتعدد نفس شروط ت الهندسي الزائد مع وجود أكثر من صنفين من الكريات. Xi ={0,1,2,…,Ni} ,

Σxi = n, ΣNi = N
P(X1=x1,X2=x2,…Xk=xk)=

E[Xi] = n (Ni/N) = npi
برنولي X~B(1, p) تجربة واحدة (غير مكررة) تقبل نتيجتين. X = {0, 1} P(X = 1) = p,
P(X = 0) = 1 - p = q μ = p, σ²= pq
الثنائي
X~B(n, p) تجارب ثنائية النتيجة، مكررة ومستقلة ( p ثابت). X = {0,1,2…,n} P(X = x) = Cxn px qn-x

μ= np, σ² = npq
باسكال (الثنائي السالب) X هي عدد التجارب اللازمة للحصول على عدد r من النجاحات في تجارب برنولية مكررة. X = {r, r +1, r +2, …, +∞} P(X = x) = Cr-1x-1 pr qx-r μ = r/p ,

σ² = rq/p²
الهندسي X هي عدد التجارب اللازمة للحصول على النجاح الأول في تجارب برنولية مكررة. X = {1,2,…,+∞} P(X = x) = qx-1p μ = 1/p,

σ² = q/p²
التوزيع المتعدد هو تعميم للتوزيع الثنائي على تجربة مكررة متعددة النتائج.
E(Xk) = npk

V(Xk) = npkqk
بواسون X~P(λ)
λ > 0
X عدد النجاحات في عدد كبير جدا من التجارب البرنولية (عدد الوحدات التالفة في شحنة). أو أيضا عدد من الأحداث في فترة زمن. X = {0,1,2,…,+∞}
P(X = 0) = e-λ

P(X ≥ 1) = 1 - e-λ E(x) = V(x) = λ

المبحث 2. التوزيعات الاحتمالية الشائعة المستمرة
التوزيع الطبيعي
التوزيع الأسي
توزيع قاما
توزيع بيتا
1 التوزيع الطبيعي أو توزيع لابلاس قوس D. Normale ou D. de Laplace -Gausse
يعد التوزيع الطبيعي من أهم التوزيعات الاحتمالية شائعة الاستخدام لما له من خصائص تنطبق على نسبة كبيرة من الظواهر الطبيعية والاجتماعية والاقتصادية. فلو اخترنا بالصدفة مئة أو ألفا من المارين في شار ع ما وقسنا أطوالهم لوجدنا نسبة كبيرة منها قريبة من متوسط ما، ونسبة قليلة من طوال القامة ونسبة مقاربة لها من قصار القامة. ومثل هذا بالنسبة للأوزان. ولو مثلنا هذه البيانات في معلم متعامد متجانس لكان المنحنى الذي يمثل النسبة، أو ما يمكن أن نسميه الاحتمال، ذا شكل جرسي متماثل حول المتوسط وهي صفات التوزيع الطبيعي (الشكل9) :
(‌أ) صيغة القانون
تكتب دالة الكثافة لمنحنى للتوزيع الطبيعي كما يلي:

حيث µ وσ هما على التوالي التوقع والانحراف المعياري. ونكتب X ~ N(µ, σ)
دالة التوزيع (الدالة التجميعية) للتوزيع الطبيعي تكتب كما يلي:

المتغيرة المركزية أو المعيارية : تستخدم المتغيرة المعيارية Z = (X-µ)/σ لتكوين الجداول الإحصائية للاحتمالات:
P(0 ≤ Z ≤ z)أو F(z) = P(Z ≤ z)،
حيث تسمح بكتابة الدالة f وF بدلالة مجهول واحد Z بدلا من 3 مجاهيل x وµ و σ وذلك كما يلي:

بالنظر إلى العلاقة الخطية بين المتغيرتين X و Z، فإن Z تتبع نفس توزيع X أي التوزيع الطبيعي. ونعلم أن:
E(Z) = 0 V(Z) = 1
(‌ب) خصائص التوزيع الطبيعي
الدالة المتجددة للعزوم :

من خصائص التوزيع الطبيعي أنه يعتبر معتدلا لا مدببا ولا مفلطحا، حيث يعتبر معامل التفلطح = 34α للتوزيع الطبيعي معيارا لاعتدال المنحنيات.
من خصائص التوزيع الطبيعي أيضا أنه متماثل حول القيمة المتوقعة
تماثل منحنى X حول المتوسط (أنظر الشكل 3) يعني تماثل لمنحنى Z حول 0، مما يعني أنه من أجل أي قيمة للمتغيرة المعيارية
z > 0 :
P(0 ≤ Z ≤ z) = P(-z ≤ Z ≤ 0) = P(-z ≤ Z ≤ z) / 2
P(Z ≤ -z) = 1- P(Z ≤ z) = P(Z ≥ z)

و لقد تم باستخدام المتغيرة المعيارية Z حساب الاحتمالات (المساحات) تحت المنحنى ومنها خاصة:
P(-σ ≤ X ≤ σ) = P(-σ ≤ Z ≤ σ) = 0.6837,
P(-2 σ ≤ X ≤ 2 σ) = P(-2 ≤ Z ≤ 2) = 0.9544,
P(-3 σ ≤ X ≤ 3 σ) = P(-3 ≤ Z ≤ 3) = 0.9973.
هذه القيم وغيرها متوفرة في الجداول الإحصائية التي نجدها في الكثير من المراجع، كما يمكن حسابها باستخدام الحاسوب.

مثال: باستعمال الجداول الاحصائية 1) أحسب : P(0 ≤ Z ≤ z) حيث z =1, 2, 3
2) أحسب P(-z ≤ Z ≤ z) من أجل نفس القيم ل z.
1) 0.3413 ، 0.47725 ، 0.49865
2) 0.6827، 0.9545، 0.9973
(‌ج) العلاقة بين التوزيع الطبيعي والتوزيع الثنائي
في حالةn كبيرة وp غير قريب من 0 يمكن اعتبار التوزيع الثنائي كتقريب جيد للتوزيع الطبيعي. ويعطي التوزيعان نتائج أكثر تقاربا كلما كانت n كبيرة أكثر. ونكتب:

ويسرع تقارب التوزيع الثنائي من التوزيع الطبيعي كون p قريب من 0.5.
قاعدة التقريب:
 عموما نعتبر التقريب إلى التوزيع الثنائي ملائما عندما np وnq كلاهما أكبر من 5.
 عدد من الاحصائيين يعتمد قاعدة أخرى هي أن يكون أحد الشرطين التاليين متوفرين:

(‌د) العلاقة بين التوزيع الطبيعي وتوزيع بواسون
عندما λ→ ∞ فإن التوزيعين الطبيعي وبواسون يعطيان نتائج متطابقة . ونكتب:

رسم 11 سلوك توزيع بواسون عند زيادة المعلمة من 1 إلى 2 إلى 5 (من اليسار إلى اليمين)
قاعدة التقريب:
o عموما نعتبر أن التقريب ملائم من التوزيع بواسون إلى التوزيع الطبيعي عندما λ ≥10
o فيما يعتمد عدد من الإحصائيين كشرط للتقريب λ≥15
ويمكن أن تتقارب نتائج التوزيعات الثلاث معا: الثنائي، بواسون والطبيعي حسب الشروط المذكورة )أنظر حل التطبيق أدناه.)
2 التوزيع الأسي Distribution exponentielle
عادة ما يستخدم التوزيع الأسي في مسائل متعلقة بقياس الزمن. من ذلك مدة خدمة شباك البريد، مدة مكالمة هاتفية، مدة تفريغ باخرة شحن، مدة تصليح آلة، مدة انتظار زبون قبل الحصول على الخدمة...في العلوم الدقيقة يستخدم التوزيع الأسي لتمثيل مدة حياة الذرات المشعة (atomes radioactives) قبل أن تتفكك، حيث يعبر الوسيط عن اللحظة التي يبقى فيها نصف المجتمع الأصلي .
من الضروري فهم الآتي: كقاعدة عامة يستخدم التوزيع الأسي لتمثيل مدة حياة ظاهرة ما إذا كان لها متوسط ثابت 1/λ وكانت هذه الظاهرة لا تخضع للتقادم (vieillissement) أي أن مدة حياة الظاهرة بعد لحظة ما T لا تتبع اللحظة T؛ أي لا تتأثر بالمدة التي دامتها الظاهرة من قبل. مثلا قد نستبعد استخدام التوزيع الأسي لتمثيل مدة حياة آلة عاملة قبل تعطلها لأن احتمال تعطلها في لحظة ليس مستقلا عن المدة التي عملتها الآلة من قبل، كذلك الأمر بالنسبة لمدة حياة الإنسان.
عمليا، نتحقق من دقة تمثيل التوزيع الأسي _أو أي توزيع آخر_ لظاهرة ما من خلال تقنيات اختبارات الفروض، وبالتحديد اختبار التجانس و التعديل.
نشير أخيرا إلى أن للتوزيع الأسي علاقة بالتوزيع بواسون، فإذا كان وقوع أحداث ما يتبع هذا التوزيع، فإن المدة بين وقوع حدثين تتبع التوزيع الأسي؛ كمثال على ذلك، إذا كان وصول الزبائن إلى مركز خدمة ما يتبع التوزيع بواسون فإن المدة الزمنية بين وصول زبون "أ" والزبون الموالي تتبع التوزيع الأسي. تتبين هذه العلاقة عند استنتاج صيغة القانون الأسي.
(‌أ) صيغة القانون الأسي أو دالة الكثافة و الدالة التجميعية للتوزيع.
بينت دراسة أن عدد حوادث العمل في معمل معين تتبع توزيع بواسون بمعدل λ حادث يوميا.
أوجد احتمال أن يسجل حادث على الأقل (حادث أو أكثر) في مدة t يوم.
P(X ≥ 1) = 1-e-λt P(X ≥ 1) =1- P(0) =1-[λ0t * e-λt/0!] =>
لنرمز ب T للزمن (باليوم) بين حادثين إذن سيكون لدينا f(t) دالة الكثافة للزمن بين حادثين، وF(t) = P(T ≤ t) دالة التوزيع ل T.
لنحسب احتمال P أن يكون الزمن بين حادثين يوم أو أقل:
لدينا P = P(T ≤ t = 1) إذن:
(1) ............ P = F(t = 1)
لاحظ من ناحية أخرى أن P هو معادل لاحتمال أن يسجل على الأقل حادث في يوم معين:
(2).......... P = P(X ≥ 1) = 1-e-λt
من (1) و(2) نستنتج أن F(t) = 1 - e-λt ............(3)
و منه f(t) = F(t)’ = (1 - e-λt)’
إذنλ e-λt f(t) =
قاعدة: إذا كان حدث عشوائي ما يتكرر في الزمن وفق توزيع بواسون:

فإن الزمن T بين حادثين يتبع التوزيع التالي:

حيث λ عدد حقيقي موجب.
و يسمى هذا التوزيع التوزيع الأسي ويسمى أيضا التوزيع الأسي السالب لعلاقته بتوزيع بواسون.
(‌ب) التمثيل البياني للتوزيع الأسي

(‌ج) خصائص التوزيع الأسي

3 توزيع قاما Distribution gamma
توزيعي قاما و بيتا يمثلان مجموعة واسعة من التوزيعات ذات معلمتين تتميز بمرونة وقدرة على توليد توزيعات متعددة حسب قيم المعلمتين. ندرس هذين التوزيعين أيضا لعلاقتهما بالتوزيعات F، t، و ك2. يستخدم توزيع قاما لتمثيل بعض الظواهر مثل توزيع الدخل والادخار تحت شروط معينة .
(‌أ) صيغة القانون.
نقول عن متغيرة عشوائية أنها تتبع توزيع قاما إذا كانت دالة كثافتها كما يلي:

حيث Γ(α) هي الدالة قاما:

ونكتب Γ(α, β) X ~
(‌ب) خصائص توزيع قاما
µ = α β , σ² = α β², M(t) = (1 - βt)-α
Pour α>1: Γ(α) = (α-1)Γ(α-1) et si α  N : Γ(α) = (α-1) ! , Γ(1/2) = √π
من خصائص توزيع قاما علاقته بالتوزيع الأسي كما سنرى في السلسلة.
مثال. أحسب ما يلي:

مثال2. أحسب المتوسط والتباين للمتغيرات العشوائية X و Y و Z المعرفة كما يلي:

4 توزيع بيتا Distribution bêta
يتميز توزيع بيتا بمرونته الكبيرة تبعا لقيم معلمتيه (أنظر الرسم 14) حيث يستخدم لحساب توزيع t²، F، التوزيع الثنائي، الثنائي السالب وغيرها ، وتستخدم لتمثيل بعض المتغيرات التي تتراوح بين 0 و 1، مثل نسبة ما كنسبة التالف أو المبيعات، إلخ.
(‌أ) صيغة القانون.
نقول عن متغيرة عشوائية أنها تتبع توزيع بيتا إذا كانت دالة كثافتها كما يلي:

حيث B(α, β) هي الدالة بيتا:
و نكتب B(α, β) X ~
 = 4,  = 2

رسم 13 التمثيل البياني لدالة الكثافة للتوزيع بيتا من أجل قيم مختلفة للمعالم
(‌ب) خصائص توزيع بيتا

(‌ج) العلاقة بين الدالتين قاما وبيتا:

مثال. أحسب ما يلي:

مثال2. أحسب ما يلي:

وباستعمال العلاقة نجد أن دالة الكثافة للتوزيع بيتا تكتب أيضا:

للتوزيعين قاما وبيتا علاقة بعدد من التوزيعات المهمة كالتوزيع الأسي وتوزيع كاي تربيع، من ذلك مثلا أن التوزيع الأسي هو حالة خاصة من توزيع قاما عندما α = 1 , β = 1/λ .
مثال3. أحسب النسبة المتوقعة للإنتاج التالف والتباين، إذا كانت نسبة الإنتاج التالف تتبع التوزيع التالي:

من المثال السابق لدينا:
بوضع و  يساويان 1 و 6 على التوالي، نجد أن B(1, 6) X ~
ومنه:
مثال4. نسبة الإنتاج المباع في مؤسسة تتبع التوزيع التالي. أحسب النسبة المتوقعة، واحتمال أن تبلغ النسبة أكثر من 35% .

5 خلاصة
الجدول التالي يلخص خصائص التوزيعات الاحتمالية المستمرة الأكثر استخداما.
التوزيع دالة الكثافة ، التوقع والتباين خصائص التوزيع
التوزيع الطبيعي المعياري
X~N(0, 1)

E(Z) = 0, V(Z) = 1 P(Z ≤ -z) = 1- P(Z ≤ z) =
P(Z ≥ z)
P(-σ ≤ X ≤ σ) =
P(-1 ≤ Z ≤ 1) = 0.6837,
P(-2 σ ≤ X ≤ 2 σ) =
P(-2 ≤ Z ≤ 2) = 0.9544,
P(-3 σ ≤ X ≤ 3 σ) =
P(-3 ≤ Z ≤ 3) = 0.9973.
التوزيع الأسي
 = 1/λ,
σ² = 1/ λ²
F(x) = 1- e-λx P(X ≤ ) = 0.63
توزيع قاما
X~Γ(α,β)

µ = α β,
σ² = α β²

توزيع بيتا
B(α, β) X~

الفصل V. المتغيرات العشوائية متعددة الأبعاد
المتغيرة الثنائية الاستقلال التباين والارتباط

درسنا في الفصل الأول المفاهيم والقواعد الأساسية في نظرية الاحتمالات كالاحتمال البسيط والاحتمال المتعدد وقاعدة جمع وضرب الاحتمالات. تساعد هذه المفاهيم المسير على التقدير وعلى اتخاذ القرار المناسب تجاه مسائل متشعبة وغير مؤكدة النتائج. في الفصل الثاني درسنا مفهوم المتغيرة العشوائية والتوزيع الاحتمالي (أو القانون الاحتمالي) وتطرقنا إلى عدد من التوزيعات الاحتمالية الشهيرة. تستخدم المتغيرة العشوائية لتمثيل الظواهر المختلفة من أجل دراستها والتوقع بشأنها. في هذا الفصل سنتناول نوعا من المتغيرات العشوائية وتوزيعاتها وهي المتغيرات العشوائية ذات أكثر من بعد، بالإضافة إلى مفاهيم أخرى مهمة متعلقة بالارتباط بين المتغيرات. ذلك أن العديد من الظواهر والمسائل التي تطرح أمام المسير تتضمن أكثر من متغيرة واحدة، فنتيجة نشاط مؤسسة هي محصلة العائد والتكاليف، ومحصول موسم زراعي يتأثر بمتغيرات عدة مثل كمية الأمطار والأسمدة والمساحة المزروعة. سوف نقتصر في دراستنا على المتغيرة ذات بعدين اثنين وهو ما يطلق عليه المتغيرة الثنائية.
المبحث 1. المتغيرة الثنائية
التوزيعات المشتركة المتقطعة والدوال الحدية (الهامشية)
التوزيعات المشتركة المتصلة
التوزيع الشرطي

1 التوزيعات المشتركة المتقطعة والدالة الهامشية (الحدية) Fonction marginale
(‌أ) تعريف
المتغيرة الثنائية هي متغيرة تتوقف ليس على قيمة واحدة هي قيمة X مثلا و إنما تتوقف على قيمة متغيرتين اثنتين. مثال ذلك، معدل الطالب يتوقف على نقطة الرقابة المستمرة و نقطة التطبيق أو نقطة السداسي الأول ونقطة السداسي الثاني. كذلك نتيجة السنة المالية تتوقف على متغيرتي التكاليف و الإيرادات، وهكذا. التعريف الدقيق للمتغيرة الثنائية يتأتى باستخدام الترميز كما يلي:
لتكن لدينا متغيرتان عشوائيتان متقطعتان X وY، لنرمز للاحتمال: P(X = x,Y = y) ب f(x,y) :
f(x,y) = P(X = x,Y = y)
f(x,y) ≥ 0
∑x∑y f(x,y) = 1
تسمى الثنائية (X,Y) متغيرة ذات بعدين وf(x,y) دالة الكثافة الاحتمالية لها ونقول أيضا دالة الكثافة المشتركة للمتغيرتين X وY ويمكن التعبير عنها عن طريق جدول للاحتمالات المشتركة (جدول التوزيع المشترك).
f1(x) ym . . . y2 y1 Y X
f1(x1)
f(x1,ym)
. . . f(x1,y2) f(x1,y1)
x1
f1(x2) f(x2,ym) . . . f(x2,y2) f(x2,y1) x2
. . . . . . . . . . . . . . . . . .
f1(xn) f(xn,ym) . . . f(xn,y2) f(xn,y1)
xn
1 f2(yn) . . . f2(y2) f2(y1) f2(y)
احتمال X = x يحسب ويكتب كما يلي P (X = x) = f1(x) = ∑k=1m f(x,yk)
احتمال Y = y يحسب و يكتب كما يلي P (Y = y) = f2(y) = ∑i=1n f(xi,y)
الدالتينf1(x) وf2(y) تسميان الدالتان الهامشيتان (الحديتان) حيث : ∑ f1(x) = 1 و∑ f2(y) =1
(‌ب) الدالة التجميعية
الدالة التجميعية للمتغيرة الثنائية (X,Y) تكتب كما يلي:
F (x, y) = P (X ≤ x, Y ≤ y) = ∑ u≤x ∑ v≤yf (u, v)
مثال: نرمي قطعة نقدية وحجر نرد، نرمز بX لعدد مرات ظهور الصورة، وY للرقم الذي يظهر من مكعب النرد.
o أكتب التوزيع الاحتمالي المشترك للمتغيرتين،
o أحسب احتمالات الأحداث التالية: الحصول على صورة مع الرقم 6، الحصول على الصورة، الحصول على الرقم 6.
o أحسب الاحتمال P(X ≤ 1, Y ≤ 3) ، P(X ≤ 2, Y ≤ 6).
f1(x) 6 5 4 3 2 1 X\Y
/2 1/12 1/12 1/12 1/12 1/12 1/12 0
1/2 1/12 1/12 1/12 1/12 1/12 1/12 1
1 1/6 1/6 1/6 1/6 1/6 1/6 f2(y)
احتمال الحصول على صورة مع الرقم 6 : P (X = 1 et Y = 6) = f(1, 6) = 1/12
احتمال الحصول على الصورة= 1/12 + 1/12 + . . . = 1/2 P (X = 1) = f1(1) = ∑k=1n f(1, yk)
احتمال الحصول على الرقم 6 1/12 + 1/12 = 1/6 = P (Y = 6) = f2(6) = ∑i=1m f(xi,6)
P(X ≤ 1, Y ≤ 3) = F(1, 3) = ∑ u≤1 ∑ v≤3 f(u,v) = 6(1/12) = 1/2 , P(X ≤ 2, Y ≤ 6) = 1
سؤال. من بين التوزيعات الاحتمالية الشهيرة التي رأينا في الفصل الثاني أيها يعتبر توزيعا مشتركا؟ (الجواب: التوزيع المتعدد.)
2 التوزيعات المشتركة المتصلة
(‌أ) تعريف
لتكن لدينا X وYمتغيرتان ع متصلتان، نعرف دالة الكثافة الاحتمالية المشتركة لهما كما يلي:
P(X = x, Y = y) = f(x, y)
f(x, y) ≥ 0
∫-∞+∞∫-∞+∞f(x, y) dx dy = 1
(‌ب) الدالة التجميعية
نكتب دالة التوزيع (الدالة التجميعية) كما يلي:
F(x, y) = P(X ≤ x, Y ≤ y) = ∫ u=-∞x∫ v=-∞yf(u, v) du dv
و يمكن استنتاج دالة الكثافة المشتركة من الدالة التراكمية بالاشتقاق كما يلي: f(x, y) = ∂²F / (∂x ∂y)
من جهة أخرى ∫u=-∞x∫v=-∞∞f(u, v) du dv F1(x) = P(X ≤ x) =
∫u=-∞∞∫v=-∞yf(u, v) du dv F2(y) = P(Y ≤ y) =
ونسمي الدالتان F1(x) وF2(y) الدالتان التراكميتان (التجميعيتان) الهامشيتان (الحديتان).
ولتحديد احتمال X وY محصورتان في مجالين ما نكتب:
P(a ≤ x ≤ b, c ≤ y ≤ d) = ∫x=ab∫y=cdf(x, y) dx dy
(‌ج) الدوال الهامشية
الدالتان الهامشيتان (الحديتان) للكثافة الاحتمالية للثنائية (X, Y) فيعبر عنها كما يلي:
f1(x) = ∫v=-∞+∞f(x, v) dv , f2(y) = ∫u=-∞+∞f(u, y) du
مثال: لدينا دالة الكثافة الاحتمالية المشتركة للمتغيرتين X وY المعرفة كما يلي:

أكتب دالة التوزيع الهامشية لكل من المتغيرتين أحسب احتمال 0 < x < 2 ، أحسب احتمال 1 < y < 3. F1(x) = P(X ≤ x) = ∫u=-∞x∫v=-∞∞f(u, v) du dv * x < 0 : F1(x) = 0, * 0 ≤ x < 4 : F1(x) = ∫u=-∞x∫v=-∞∞ uv/96 du dv = 0 + ∫u=0x∫v=15uv/96 du dv =1/96 ∫u=0x[ ∫v=15uv dv] du = 1/96∫u=0x[12u] du = x²/2 (12/96) = x²/16. * x ≥ 4: F1(x) = 1 F2(y) = P(Y ≤ y) = ∫u=-∞∞∫v=-∞yf(u, v) du dv Pour y < 1 : F2(y) = 0, * 1 ≤ y < 5 : F2(y) = 0 + ∫u=04∫v=1y uv/96 dudv = 1/96 ∫u=04[ ∫v=1yuv dv] du = 1/96 ∫u=04[u (y² - 1) / 2] du = (1/2 * 1/96) (y² - 1) (u²/2)04 = (1/(2*96)) (y² - 1) (16/2) = (y² - 1) / 24 * y ≥ 5 : F2(y) = 1 P(0 < x < 2) = F1(2) – F1(0) = 4/16 = ¼ , P(1 < y < 3) = 8 / 24 = 1/3 3 التوزيع الشرطي Distribution conditionnelle في حالةX ، Yمتغيرتان عشوائيتان متقطعتان، فإن دالة الكثافة الاحتمالية الشرطية ل (X|Y = y) تكتب كما يلي f(x/y) وتحسب كما يلي: و هذا استنادا إلى القانون التقليدي للاحتمالات الشرطية: التوزيع الاحتمالي ل X حيث= y Y هو مجموعة قيم المتغيرة X عند تثبيت Y والاحتمالات f(x/y) المقابلة لها. مثال. لتكن X عدد مرات الحصول على صورة عند رمي قطعة نقدية مرتين وY الفرق بالقيمة المطلقة بين عدد مرات الصورة وعدد مرات الكتابة. أكتب التوزيع الاحتمالي لY|X = 1، أكتب التوزيعان الاحتماليان ل X|Y = 0 وX|Y = 2. X 0 1 2 Y 1 0 P(X/Y=0) 0 1 0 P(y/x=1) 0 1 P(X/Y=2) 1/2 0 1/2 في حالةX وYمتغيرتان ع متصلتان نكتب: P(c ≤ Y ≤ d / x ≤ X ≤ x + dx) = ∫cdf(y/x) dy 4 خلاصة احتمال ثنائية عشوائية و يحسب كما يلي: f(x,y) = P(X = x,Y = y) للتعبير عن احتمال قيمة ما لإحدى المتغيرتين نكتب: P (X = x) = f1(x) و تسمى دالة الكثافة الهامشية. الاحتمال التجميعي لمتغيرتين فيعبر عنه من خلال دالة التوزيع المشتركة: F (x, y) = P (X ≤ x, Y ≤ y) تنطبق هذه التعاريف على كل من المتغيرات المتقطعة و المستمرة. للتعبير عن التوزيع الاحتمالي لإحدى المتغيرتين بشرط أن تأخذ المتغيرة الثانية قيمة ما (0، مثلا) فنكتب: P(X/Y = 0) لحساب الاحتمالات الشرطية ل X تستخدم القاعدة: المبحث 2. الاستقلال التباين والارتباط تعريف استقلال متغيرتين توقع وتباين المتغيرة العشوائية متعددة الأبعاد التباين المشترك معامل الارتباط 1 تعريف استقلال متغيرتين رأينا في الفصل الأول أن حدثين عشوائيين A وB يكونان مستقلان إذا كان: P(A et B) = P(A) P(B) انطلاقا من هذه القاعدة، تكون المتغيرتان العشوائيتان المتقطعتان X و Y مستقلتان إذا وفقط إذا كان: P(X = x, Y = y) = P(X = x) P(Y = y) f(x, y) = f1(x) f2(y) في حالة كون المتغيرتين متصلتين نكتب: P(X ≤ x, Y ≤ y) = P(X ≤ x) P(Y ≤ y) F(x, y) = F1 (x) F2 (y) أي أن المتغيرتان المستقلتان هما اللتان يمكن كتابة دالة التوزيع المشتركة لهما (أو دالة الكثافة المشتركة) في شكل جداء دالتين هامشيتين تراكميتين (أو دالتين هامشيتين للكثافة). مثال. ليكن X وY م ع مستمرين حيث دالة الكثافة المشتركة لهما معرفة كما يلي: بين أن المتغيرتين X وY مستقلتين. Soit c = c1*c2 => f(x, y) = c1 c2 xy = c1x * c2y => f(x, y) = f1(x) * f2(y) cqfd
مثال2. ليكن X وYو Z م ع متقطعة. تمثل X عدد مرات الحصول على صورة في رمية لقطعة نقدية وY عدد مرات الحصول على صورة في رمية موالية. وZ الفرق بالقيمة المطلقة بين X’ وY’ اللذان يمثلان على التوالي عدد مرات الحصول على الصورة/الكتابة في مجموع رميتين لقطعة نقدية.
X
Y 0 1 Z
X’ 0 1 2 X’ 0 1 2 Z 0 2
0 ¼ ¼ 0 0 1 0 px ¼ ½ ¼ pz ½ ½
1 ½ ½ 2 ½ 0 ½
من الواضح أن X وY مستقلتان لأن P(X = x,Y = y) = P(X = x) P(Y = y) عند كل قيم X وY.
على العكس من ذلك، نجد أن Z ليست مستقلة عن X’ فمثلا:
P(X’= 0, Z = 2) = 1/2 ≠ P(X’ = 0) P(Z = 2) = (1/4 . 1/2) = 1/8
2 توقع وتباين المتغيرة العشوائية متعددة الأبعاد
ينطبق كل من تعريف التوقع الرياضي والتباين الذين تناولناهما فيما سبق على المتغيرة العشوائية متعددة الأبعاد. لتكنX وYمتغيرتان عشوائيتان متقطعتان، وf(x, y) دالة كثافة مشتركة لهما.
µx = E(X) = ∑x∑y x f(x, y) , µy = E(Y) = ∑x∑yy f(x, y)
σ²x = E[(x – µx)²] = ∑x∑y (x – µx)² f(x, y) , σ²y = E[(y – µy)²] = ∑x∑y (y – µy)² f(x, y)
في حالة X وY متغيرتان مستمرتان:
µx = E(X) = ∫-∞+∞∫-∞+∞x f(x, y) dx dy , µy = ∫-∞+∞∫-∞+∞y f(x,y) dx dy .
σ²x = E[(x – µx)²] = ∫-∞+∞∫-∞+∞(x – µx)² f(x, y) dx dy ,
σ²y = E[(y – µy)²] = ∫-∞+∞∫-∞+∞(y – µy)² f(x, y) dx dy
مثال. ليكن لدينا التوزيع المشترك المعرف كما يلي:
7 -2 -4 y
X
1/8 1/4 1/8 1
1/8 1/8 1/4 -5
المطلوب حساب:
E(y), E(x) ،σ²x, σ²y

E(x) = ∑x∑y x f(x, y) = 1(1/8 + ¼ + 1/8) – 5(1/4 + 1/8 + 1/8) = 1/2 – 5/2 = -4/2 = -2
E(Y) = ∑x∑y y f(x, y) = -4 (1/8 + ¼) – 2 (1/4 + 1/8) + 7 (1/8 + 1/8) = -1/2
σ²x = E[(x – µx)²] = ∑x∑y (x - µx)² f(x, y)
= (1 + 2)² (1/8 + ¼ + 1/8) + (-5 + 2)² (1/4 + 1/8 + 1/8) = 9 (1/2) + 9 (1/2) = 9
σ²y = E[(y – µy)²] = ∑x∑y (y - µy)² f (x, y)
= (-4 + 1/2)² (1/8 + 1/4) + (-2 + 1/2)² (1/4 + 1/8) + (7 + 1/2)² (1/8 + 1/8)
= 49/4 (3/8) + 9/2 (3/8) + (15/2)² (2/8) = 651 / 32 = 20,34
كما يمكن حساب كل من القيم السابقة باستخدام الدوال الهاشية f1(x) و f2(y).
f1(x) 7 -2 -4 Y
X
4/8 1/8 1/4 1/8 1
4/8 1/8 1/8 1/4 -5
1 2/8 3/8 3/8 f2(y)
E(x) = ∑x x f1(x) = 1(4/8) – 5(4/8) = -2
V(x) = E(x²) – E²(x)
= [1²(4/8) + (– 5)²(4/8)] – (–2)² = 9
3 التباين المشترك Covariance
يعرف التباين المشترك كمايلي:
Cov (X, Y) = σxy = E[(X – µx)(Y – µy)]
في حالة X وY متغيرتان متقطعتان:
σxy = ∑x∑y(x – µx)(y – µy)f(x, y)
في حالة X وY متغيرتان مستمرتان:
σxy= ∫-∞+∞∫-∞+∞(x – µx) (y – µy) f(x, y) dx dy
(‌أ) خصائص التباين المشترك
1. من تعريف التباين يمكن أن نستنتج:
Cov(X, Y) = E[(X – µx)(Y – µy)]
= E[XY – Xµy – µxY + µxµy]
= E(XY) – E(X)E(Y) – E(X)E(Y) + µxµy
= E(XY) – E(X) E(Y)
Cov(X, Y) = E(XY) – E(X) E(Y)
2. في حالة X وY متغيرتان مستقلتان نعلم من خصائص التوقع الرياضي أن E(XY) = E(X) E(Y) ومنه:
Cov(X, Y) = E(XY) – E(X) E(Y) = E(XY) – E(XY)
Cov (X, Y) = 0
3. في حالة X وY متغيرتان مستقلتان أو غير مستقلتين:
2 Cov (X, Y) ± Var (X ± Y) = V(X) + V(Y)
4. القيمة المطلقة للتباين المشرك لا تكون أكبر من جداء الانحرافين المعياريين: |σxy| ≤ σxσy
5. في حالة X وY متغيرتان مرتبطتان تماما مثلا Y = X فإن: Cov(X, Y) = V(X) V(Y)
4 معامل الارتباط
من الخاصية (2) نستنتج أن الكسر يساوي 0 في حالة X وY مستقلتان و من الخاصية (5) نستنتج أنه في حالة X وY متغيرتان مرتبطتان تماما فإن الكسر يساوي 1.
من جهة أخرى من الخاصية 4 نستنتج أن النسبة تتراوح قيمته بين (-1) و(1): . من أجل هذا تستعمل النسبة: لقياس الارتباط بين المتغيرتين، وتسمى معامل الارتباط.
في حالة r معدوم نقول أن المتغيرتان غير مرتبطتين، من غير أن نجزم أنهما مستقلتان.
مثال. أوجد التباين المشترك والارتباط للتوزيع المشترك المذكور في المثال السابق.
Cov(X, Y) = E(XY) – E(X) E(Y)
E(XY) = 1(-4)(1/8) + (1)(-2)(2/8) + (1)(7)(1/8) + (-5)(-4)(2/8) + (-5)(-2)(1/8) + (-5)(7)(1/8) = 1.75
E(X) = 1(4/8) + (-5)(4/8) = -2, E(Y) = -4(3/8) – 2(3/8) + 7(2/8) = -1/2.
Cov(X, Y) = 1.75 – (-2)(-1/2) = 0.74
V(X) = E(X²) – E²(X) = 1(4/8) + (-5)²(4/8) – (-2)² = 9 => σx = 3,
V(Y) = E(Y²) – E²(Y) = 20.34 => σy = 4.5.
5 خلاصة
نقول عن متغيرتان أنهما مستقلتان إذا أمكن كتابة دالة التوزيع المشتركة لهما (أو دالة الكثافة المشتركة) في شكل جداء دالتين هامشيتين تراكميتين (أو دالتين هامشيتين للكثافة): f(x, y) = f1(x) f2(y) أي أن:
P(X = x, Y = y) = P(X = x) P(Y = y)
من جهة أخرى نقيس الارتباط بين متغيرتين من خلال معامل الارتباط،
وفي هذه الحالة يكون التباين المشترك Cov(X, Y) = E(XY) – E(X) E(Y)
معدوما لأنه تبعا لخصائص التوقع الرياضي في حالة الاستقلال فإن E(XY) = E(X) E(Y)
لكن العكس ليس بالضرورة صحيح.
يستخدم معامل الارتباط كمؤشر على الارتباط بين المتغيرتين، لكن الإحصائي يجب أن يكون متنبها إلى محدودية هذا المؤشر.

الفصل VI. دوال المتغيرات العشوائية والتقارب
الدوال غير الخطية : ك 2، فيشر وستيودنت
التقارب والسلوك التقاربي، نظرية النهاية المركزية

نتناول في المبحث الأول من هذا الفصل عدد من التوزيعات ذات الاستخدام الواسع في الإحصاء الاستدلالي والتطبيقي خاصة في مجالي "التقدير" و"اختبار الفروض"، حيث يستخدم الإحصائي هذه التوزيعات في عمله من أجل الوصول إلى "قرار" بشأن "المجتمع" المدروس انطلاقا من بيانات يتحصل عليها من عينة. في المبحث الثاني سنتطرق للتقارب بين التوزيعات الاحتمالية المختلفة التي درسناها من قبل.
المبحث 1. الدوال غير الخطية: ك 2 ، فيشر وستيودنت
توزيع ك2 توزيع ستيودنت توزيع فيشر
1 توزيع ك2 Distribution en Khi-carré (ou Khi-deux)
توزيع ك2 هو من أكثر التوزيعات استخداما في مجال اختبار الفروض بأنواعها، ويمكن تعريفه كما يلي:
لتكن X1, X2, . . . Xν ، متغيرات عشوائية مستقلة كل منها تتبع التوزيع الطبيعي المعياري (µ = 0, σ =1). المتغيرة
X = X1² + X2² + . . . + Xν²
لها دالة الكثافة التالية:

حيث Γ(α) هي الدالة قاما:

و نقول أن X تتبع التوزيع ك2 ب ν درجة حرية ونكتب X ~ χ²ν.
الدالة التجميعية χ²) F( تكتب كما يلي:

(‌أ) خصائص توزيع ك 2
E(X) = ν, V(X) = 2ν, M(t) = (1-2t)-ν/2
دالة التوزيع ك2 هي هي حالة خاصة من توزيع قاما بوضع α = ν/2, β = 2 .
ويأخذ منحنى f(x) شكله حسب قيمة الثابت ν ونلاحظ من الرسم أن المنحنى يبتعد شيئا فشيئا عن المحور العمودي ويأخذ شكلا جرسيا كلما زادت قيمة ν. ونبرهن أنه عند ν كبير (ν ≥ 30) فإن تتبع التوزيع الطبيعي المعياري.
 في الجداول الاحصائية، تعين نقطة (قيمة المتغيرة) ك2 على المحور الأفقي (أنظر الرسم المقابل) من خلال νبالإضافة إلى المساحة p على يسار ك2 تحت المنحنى (p = P(X ≤ χ²ν;p). وأحيانا تحدد النقطة ك2 بدلالة المساحة على يمينها (α = 1- p) لذلك نجد في كتب الاحصاء كل من الكتابتين: χ²p,ν وχ²α,ν

رسم 15 تعيين نقطة ك2 على المحور من خلال قيمة p

 نظرية: لتكن م ع مستقلة عددها n حيث X1 ~ χ²ν1 , . . . , Xn ~ χ²νn مجموع هذه المتغيرات
~ χ²νT
νT = ∑νi

2 توزيع ستيودنت Distribution de Student
لتكن المتغيرتان العشوائيتان المستقلتان Y وZ حيث Y~ N(0, 1) و χν² Z ~ ؛ المتغيرة تتبع توزيع لها دالة الكثافة التالية

بحث هذه المدونة الإلكترونية

Algeria forum for all Algerians

محاضرات الاحصاء الرياضي5

تعليقات

المشاركات الشائعة من هذه المدونة

ادارة معرفة الزبون

محاضرات الاحصاء الرياضي 6

لمن يحب الورود باقات الورد المتنوعة