المحاضرة الثالثة جدول التوزيع التكراري
جداول التوزيع التكراري Frequency distribution:
تناولنا سابقاً طرق عرض البيانات في الجداول بعد جمعها وقد تم التركيز على أساليب تبويب بيانات محدودة في جداول مختلفة الا انه في الحياة العملية تواجهنا كميات كبيرة من هذه البيانات قد لا نتمكن من عرضها بإحدى طرق عرض البيانات لأننا نحتاج إلى كتابة جداول تكرارية طويلة لنتمكن من عرض البيانات المطلوبة وفي مثل هذه الحالة نستخدم طريقة أخرى لعرض البيانات هي جداول التوزيع التكراري وهي إحدى الطرق التي تتمكن بواسطتها من تنظيم البيانات الكثيرة .
التوزيع التكراري : عبارة عن تلخيص وترتيب بيانات المتغير العشوائي التي سبق وإن جمعت وصنفت مقسمة إلى عدد من المجاميع تسمى كل منها بالفئة Class وهذه الفئات قد تكون مرتبة تصاعدياً أو تنازلياً حسب طبيعة البيانات ويسمى توزيع قيم الصفات (الظواهر) العددية حسب الفئات بالتوزيع التكراري وقد تكون فئات التوزيع التكراري متساوية في الطول أو غير متساوية حسب طبيعة الدراسة ومتطلباتها . أي يعني تبويب عدد كبير من البيانات على شكل فئات تسمى بالفئات التكرارية ، ثم تحديد عدد المشاهدات التي تقع ضمن كل من هذه الفئات ويطلق عليها بالتكرارات .
تقسيم جداول التوزيع التكراري :
أ)) الجداول البسيطة : وهي الجداول التي تتوزع فيها البيانات حسب صفة واحدة ويتألف من عمودين ، الأول يمثل تقسيمات الصفة أو الظاهرة إلى فئات أو مجموعات والثاني يبين عدد المفردات التابعة لكل فئة أو مجموعة .
مثال : الجدول الاتي يبين توزيع 100 طالب من طلبة كلية الزراعة حسب صفة الوزن .
|
الوزن (كغم) الفئات |
عدد الطلبة التكرار |
|
60 - 62 |
5 |
|
63 - 65 |
15 |
|
66 - 68 |
45 |
|
69 - 71 |
27 |
|
72 - 74 |
8 |
|
المجموع |
100 |
ب)) الجداول المركبة : هي الجداول التي توزع فيها البيانات حسب صفتين أو ظاهرتين أو أكثر في نفس الوقت ، والجداول المزدوجة لصفتين تتألف من الصفوف وتمثل فئات أو مجاميع أحد الصفتين والأعمدة تمثل فئات أو مجاميع الصفة الأخرى أما المفردات أو التكرارات المشتركة هي فئات أو مجاميع كلتا الصفتين .
مثال : الجدول الاتي يبين توزيع الطلبة حسب الطول والوزن .
|
الطول (سم) الوزن (كغم) |
151 - 160 |
161 - 170 |
171 - 180 |
المجموع |
|
121 - 140 |
20 |
6 |
4 |
30 |
|
141 - 160 |
2 |
40 |
10 |
52 |
|
161 - 180 |
2 |
6 |
10 |
18 |
|
المجموع |
24 |
52 |
24 |
100 |
ملاحظات على الجدول التكراري :
üالفئات Class : هي المجاميع التي قسمت إليها قيم المتغير وكل فئة تأخذ مدى معين من قيم المتغير ولكل فئة دائماً يكون لدينا حد أعلى وحد أدنى وكذلك حدان حقيقياً حد أدنى حقيقي وحد أعلى حقيقي .
üالحد الأدنى للفئة Lower class limit : هو أقل قيمة من قيم المتغير يسمح لها بالدخول في هذه الفئة مثل 50 من الفئة (50 - 55) .
üالحد الأعلى للفئة Upper class limit : هو أكبر قيمة من قيم المتغير يسمح لها بالدخول في هذه الفئة مثل 55 من الفئة (50 - 55) .
üالحدود الحقيقية للفئات Class boundary or true class : للفئة حدان حقيقيان حد أدنى حقيقي Lower class boundary وحد أعلى حقيقي Upper class boundary .
üطول الفئة Class length boundary : هو مقدار المدى بين حدي الفئة ويستحسن أن تكون أطوال الفئات متساوية وسوف نرمز لطول الفئة بالرمز C وقد تكون قيم أطوال الفئات غير متساوية .
üمركز الفئةClass mark : عبارة عن منتصف المدى بين حدي الفئة ويرمز له بالرمز yi .
الحد الأعلى + الحد الأدنى
مركز الفئة (yi) =
2
üتكرار الفئة Class frequency : هو عدد مفردات أو القيم التي تقع في مدى تلك الفئة ويرمز له fi ، ويكون مجموع التكرار مساوياً للعدد الكلي لقيم الظاهرة .
بناء جداول التوزيع التكراري :
1)) التبويب Tabulation : حيث نقوم بوضع البيانات العددية في جداول وذلك بعد تقسيمها حسب صفاتها المشتركة والهدف من هذه العملية هي اختصار البيانات إلى أصغر حيز يمكن أن يستوعبها .
وتمر عملية التبويب بثلاث مراحل هي :
1-تقسيم البيانات إلى مجموعات (فئات Class) بحسب صفاتها المشتركة بحيث تنتمي كل مفردة إلى احدى المجموعات أو الفئات فقط .
2-تحديد عدد مفردات كل مجموعة .
3-إنشاء الجدول الإحصائي ونقل البيانات اليه بحيث يظهر فيه عدد مفردات كل مجموعة .
2)) الفئات Class : هي مجموعة جزئية محددة بدقة ووضوح وتحوي عدداً من القيم المتقاربة يعتقد الباحث أنها شبه متجانسة ويفضل أن تكون هذه الفئات متساوية الطول لتسهيل اجراء المقارنات والقيام بالعمليات الحسابية .
3)) عدد الفئات : لا توجد قاعدة ثابتة تحدد عدد الفئات المطلوبة لأن ذلك يتوقف على
1- حجم البيانات . 2- الفرق بين أصغر وأكبر قيمة فيها . 3- مدى تجانسها . 4- مستوى الدقة المطلوبة .
ومن النقاط التي يجب أن تؤخذ بنظر الاعتبار عند تحديد عدد الفئات ...
1-يفضل أن يتراوح عدد الفئات بين 5 - 15 فئة .
2-الا يكون عدد الفئات كبيراً فتضيع الفائدة من الجدول وهي اختصار البيانات .
3-الا يكون عدد الفئات قليل جداً وبالتالي طول الفئة سيكون كبير فتضيع معالم التوزيع .
4)) طول الفئة Interval Class : إن تحديد طول الفئة عملية تخضع لرأي الباحث ويعتمد على ما يلي ...
1- الفرق بين أكبر وأصغر قيمة في البيانات .
2- مدى تجانس البيانات .
3-عدد الفئات التي يرغب الباحث في انشائها .
4-مستوى الدقة التي يرغب فيها الباحث .
حيث نستطيع تحديد طول الفئة من خلال قسمة المدى المطلق للبيانات على عدد الفئات ويفضل تقريب الكسور إلى أقرب عدد صحيح أي أن
المدى
طول الفئة =
عدد الفئات
مثال : الجدول الاتي يمثل التوزيع التكراري لأطوال نبات الذرة
|
ت |
الفئات Classes |
التكرار fi |
مركز الفئات yi |
الحدود الحقيقية |
|
1 |
31 - 40 |
1 |
35.5 |
30.5 - 40.5 |
|
2 |
41 - 50 |
2 |
45.5 |
40.5 - 50.5 |
|
3 |
51 - 60 |
5 |
55.5 |
50.5 - 60.5 |
|
4 |
61 - 70 |
15 |
65.5 |
60.5 - 70.5 |
|
5 |
71 - 80 |
25 |
75.5 |
70.5 - 80.5 |
|
6 |
81 - 90 |
20 |
85.5 |
80.5 - 90.5 |
|
7 |
91 - 100 |
12 |
95.5 |
90.5 - 99.5 |
الحد الأعلى + الحد الأدنى
مركز الفئة =
2
31 + 40
yi = = 35.5
2
الحد الأدنى الحقيقي = حد الفئة الأدنى - 0.5
= 31 - 0.5 = 30.5
في حالة وجود مرتبة عشرية وراء الفارزة أي كسر
= 1.5 - 0.05 = 1.45
أو الحد الأدنى الحقيقي = مركز تلك الفئة - 1/2 طول تلك الفئة
= 35.5 - 1/2 × 10 = 30.5
الحد الأدنى لتلك الفئة + الحد الأعلى للفئة السابقة
أو الحد الأدنى الحقيقي =
2
40 + 41`
الحد الأدنى الحقيقي = = 140.5
2
الحد الأعلى الحقيقي = حد الفئة الأعلى + 0.5
= 40 + 0.5 = 40.5
أو الحد الأعلى الحقيقي = مركز تلك الفئة + 1/2 طول تلك الفئة
= 35.5 + 1/2 × 10 = 40.5
في حالة وجود مرتبة عشرية وراء الفارزة أي كسر
1.9 + 0.05 = 1.95
الحد الأعلى لتلك الفئة + الحد الأدنى للفئة التي تليها
الحد الأعلى الحقيقي =
2
51 + 50
الحد الأعلى الحقيقي = = 50.5
2
طول الفئة = الحد الأعلى - الحد الأدنى + 1
= 40 - 31 + 1 = 10
الحدود في حالة وجود مرتبة عشرية وراء الفارزة
= الحد الأعلى - الحد الأدنى + 0.1
= 1.9 - 1.5 + 0.1 = 0.5
طول الفئة = الفرق بين الحدود الدنيا لفئتين متتاليتين
= الفرق بين الحدود العليا لفئتين متتاليتين
= الفرق بين الحدود الحقيقية الدنيا لفئتين متتاليتين
= الفرق بين الحدود الحقيقية العليا لفئتين متتاليتين
= الفرق بين مركز فئتين متتاليتين
طريقة عمل جداول التوزيع التكراري :
1)) استخراج المدى الكلي ويرمز له (R) = الحد الأعلى - الحد الأدنى + 1
R = R max - R min + 1
2)) تحديد عدد الفئات ويرمز له (M)
يفضل أن لا يقل عدد الفئات في التوزيع عن (5) ولا يزيد عن (15) فاذا قل عدد الفئات في التوزيع عن (5) فئات فان عملية التبويب قد تؤدي إلى عدم كشف الصفات الأساسية للمجتمع أي عدم إعطاء صورة واضحة لصفات المجتمع أي عدم إعطاء صورة واضحة لصفات المجتمع ، أما إذا زاد عدد الفئات عن (15) فئة فان ذلك فيه صعوبات في اجراء العمليات الحسابية لبعض المؤشرات ويمكن حساب عدد الفئات حسب الصيغ الاتية :
أ ) صيغة يول (yule) .
M = 2.5
ب ) صيغة ستيرجيس steruges .
M = 1 + 3.3 log (n)
حيث أن n تمثل عدد المشاهدات.
3)) إيجاد طول الفئة
المدى
طول الفئة = وتقرب النتيجة إلى عدد صحيح .
عدد الفئات
4)) كتابة حدود الفئات : بحيث تصبح جميع قيم المتغير عند كتابة حدود الفئات بين الحد الأدنى للفئة الأولى والحد الأعلى
للفئة الأخيرة .
5)) استخراج عدد التكرارات لكل فئة .
مثال : البيانات الأتية تمثل أوزان (16) طالب . المطلوب تبويب هذه البيانات في جدول توزيع تكراري
60.9 , 70.1 , 70.8 , 70 , 70.9 , 80 , 80.2 , 80.4 , 80.5 , 80.6 , 80.9 , 84 , 89 , 50 , 50 , 60.3
الحل :
1)) استخراج المدى الكلي
R = Rmax - Rmin + 1
R = 89 - 50 + 1 = 40
2)) تحديد عدد الفئات
= M = 2.5 = 5 M = 2.5 طريقة يول
M = 1 + 3.3 (log 16) = 4.97 = 5طريقة ستيرجس
R 40
3)) إيجاد طول الفئة = = = 8
M 5
4)) طول الفئة = الحد الأعلى - الحد الأدنى + 1
8 = س - 50 + 1
8 = س - 49
س = 57
|
الفئات |
التكرار |
مركز الفئات |
|
50 - 57 |
2 |
53.5 |
|
58 - 65 |
2 |
61.5 |
|
66 - 73 |
4 |
69.5 |
|
74 - 81 |
6 |
77.5 |
|
82 - 89 |
2 |
85.5 |
|
المجموع |
16 |
|