• المحاضرة الاولى الاحصاء العام

    علم الإحصاءStatistic Science  .....

    هو العلم الذي يعمل على استخدام الأسلوب العلمي في جمع البيانات وتبويبها وتصنيفها وعرضها وتحليلها (اختبارها) واستخلاص النتائج والاستنتاجات بهدف الوصول إلى قرارات مناسبة ، وأصبح علم الإحصاء وتطبيقاته من أهم الركائز التي يرتكز عليها البحث العلمي في ميادينه المختلفة ، ويمكن القول أنه لا يوجد مجال من مجالات الفكر والعمل الا وأستعمل الإحصاء فيه بأساليبه وطرقه المختلفة التي أصبحت ضرورة لابد منها لإنجاز البحوث والدراسات العملية المختلفة والارتقاء بها إلى الرصانة المطلوبة .

    في الماضي كان الإحصاء يهدف إلى العد حتى سمي بعلم العد أما في الوقت الحاضر فان علم الإحصاء أصبح يلعب دوراً بارزاً في مجال البحث العلمي وأصبح الالمام بمبادئ هذا العلم أحد المؤهلات الأساسية للباحث العلمي ، وقد أصبح علم الإحصاء جزء لا يتجزأ من عملية البحث العلمي ، ومن أشهر علماء الإحصاء في القرن العشرين هو العالم الانكليزي فيشر Fisher الذي طور علم الإحصاء بصيغته الحديثة وطبقه في مجالات وعلوم مختلفة وكثيرة كالزراعة والبيولوجي والوراثة والاقتصاد ووضع أسس تصميم وتحليل التجارب ، وبدأ استخدام علم الإحصاء من قبل العلماء وخاصة البيولوجيين بحدود عام 1921 عندما نشر فيشر كتابه (الطرق الإحصائية للعاملين في المجال البحثي) وقد ساهم علماء أخرون كثيراً في تطوير علم الإحصاء ومن أهمهم

    üفرانسيس كالتون Francis Galton (1822 - 1911) وقد اشتهر بتطبيق علم الإحصاء في علوم الوراثة والتطور

    üكارل بيرس Karl pearson (1857 - 1936) الذي أسس مجلة الإحصاء الحياتي (Biometric) التي لازالت تصدر لحد الأن .

    üوليم كوست William S. Gosset الذي أشتق توزيع T للعينات الصغيرة .

    üنيمان وبيرسون Neyman and Pearson  اللذان وضعا نظرية اختبار الفرضيات .

      تقسيم علم الإحصاء .....

    يقسم علم الإحصاء إلى قسمين أساسيين :

    1)) الإحصاء الوصفي Descriptive statistics : يشمل هذا القسم الطرق والأساليب الإحصائية المستعملة في وصف مجموعة معينة من البيانات وتتضمن الطرق الإحصائية هذه على أساليب جمع البيانات (Collection of Data) في صورة قياسات رقمية (Numerical measurement) ثم تصنيفها وتبويبها أو تنظيمها وتلخيصها مع إمكانية عرضها في جداول أورسومات بيانية وبعد ذلك حساب بعض المقاييس والمؤشرات الإحصائية المختلفة لها .

    2)) الإحصاء الاستنتاجي أو الاستدلاليInference statistics  : ويشمل الطرق الإحصائية التي تهدف إلى عمل استنتاجات أو استدلالات حول المصدر الذي جمعت منه البيانات ويضم فرعين رئيسيين هما

    أ - التقدير Estimation : ويهتم بإيجاد قيم تقديرية للاستدلال منها على القيم الحقيقية لمصدر جمع البيانات .

    ب - اختبار الفرضيات Test of hypotheses : يتضمن اختبار الفرضيات التي توضع كتفسير أولي للظاهرة المراد دراستها للوصول منها على قرار بقبولها أو رفضها .

    أهمية علم الإحصاء .....

    يستخدم علم الإحصاء في مجالات كثيرة ومتعددة منها

    1)في علم الاحياء (البيولوجي) : تستخدم الطرق الإحصائية في دراسة الأجناس والفصائل المختلفة للحيوانات والنباتات ومعرفة خواص كل جنس بما يتميز عن غيره ومقدار اختلاف مفردات الجنس الواحد في خاصية معينة فمثلاً نرى الذكور في الجنس البشري أطول قامة من الاناث في المتوسط مع ان الذكور فيما بينهم يختلفون في الطول إلى درجة ما وكذلك الاناث ويتم كل ذلك عن طريق جمع البيانات وتبويبها ودراستها دراسة إحصائية والخروج بنتائج من هذه الصفات .

    2)في الطب : يستخدم الإحصاء لدراسة العلاقة بين متغيرات كثيرة منها العلاقة بين العمر وضغط الدم مثلاً وكذلك العلاقة بين الوراثة والبيئة وتأثيرهما على تكوين الفرد .

    3)في الصحة العامة : يستخدم الإحصاء لدراسة الأمراض السارية ونسبة زيادتها ونقصها في المجتمع وكذلك دراسة حالة المعوقين والوفيات ونسبة الزيادة في السكان .

    4)في الكيمياء : يستخدم الإحصاء لتحليل البيانات المتعلقة بتكرير النفط ومعرفة نسبة مكوناته وكذلك دراسة العلاقة بين الغازات أو الفلزات وكذلك التجارب الكيمياوية في اعداد بحوث الماجستير والدكتوراه والبحوث العلمية الأخرى أو غيرها من التجارب في مجال النفط والمعادن وجمع البيانات المتعلقة بها ودراستها دراسة إحصائية لغرض الاستفادة منها في اعداد خطط التنمية الصناعية والبتروكيمياوية .

    5)يستخدم الإحصاء في التجارب الفيزيائية والهندسية والزراعية والاقتصادية وغيرها من التجارب التي تعتمد على الإحصاء لتحليل النتائج التي يتوصل اليها الباحث في جميع المجالات المذكورة أعلاه خاصةً تلك البحوث التي تعتمد على البيانات العددية .

    أهم وظائف علم الإحصاء .....

    1)) عرض الحقائق والبيانات بصورة واضحة ومحددة .

    2)) تلخيص البيانات الكثيرة بقيم قليلة ذات معنى .

    3)) وضع الأسس السليمة والصحيحة لمقارنة العوامل العائدة لنفس الظاهرة .

    4)) صياغة واختبار الفرضيات وذلك لأن الطرق الإحصائية ذات فائدة عظيمة في صياغة واختبار الفرضيات وتطوير نظريات جديدة .

    5)) يساعد علم الإحصاء على التنبؤ أو التكهن بقيمة الظاهر خلال فترة زمنية مستقبلية .   

    طبيعة البيانات والرموز الإحصائية (أهم المفاهيم الإحصائية) .....

    عند جمع البيانات حول ظاهرة ما فإننا نرمز للظاهرة بالرمز (Large letter) مثل ...... X , Y , Z , W ويرمز لكل مفردة أو مشاهدة فيها بالرمز (Small letter) مثل x1 , x2 , x3 , .........xn . فمثلا عند دراسة أوزان الطلبة في احدى المراحل الدراسية فإننا نرمز لظاهرة الوزن بالرمز X ووزن أي طالب i يرمز بالرمز xi  وإن

    i = 1 , 2 , 3 , ........ n

    حيث n عدد الطلبة وتسمى xi  المشاهدة أو المفردة أو الملاحظة وإن قيمة xi  قد تختلف من طالب إلى أخر .

    1)الصفة  Characteristic: مثل الطول أو الوزن أو العمر (كل صفة من هذه الصفات فيها تباين أو اختلاف) .

    2)المتغير Variable : عبارة عن صفة أو عنصر قابل للتغير في النوع والكم من فرد إلى أخر في نفس المجتمع أي تظهر اختلافات في قياساتها ، تتغير قيم كل صفة من شخص إلى أخر أو من نبات إلى أخر أو من حيوان إلى أخر وبالتالي فان طول الشخص ووزن الحيوان وعدد تفرعات النبات ونسبة البروتين في البذور ومحتوى الأوراق من الكلوروفيل وغيرها تعتبر جميعها متغيرات حسب المفهوم الاحصائي وذلك لأن قيمها متغيرة ، وهنالك نوعان من المتغيرات :

    أولاً : المتغيرات الوصفية أو النوعية : وهي الظواهر التي لا يمكن قياسها بالأرقام العددية مباشرة مثل صفة اللون (أزرق ، أسود ، بني ، ............. الخ) أو الحالة الاجتماعية (أعزب ، متزوج ، مطلق ، .......... الخ) .

    ثانياً : المتغيرات الكمية : هي تلك الظواهر التي يمكن قياسها مباشرة بالأرقام العددية مثل ظاهرة الوزن والعمر والطول والسرعة ............ الخ .

    وتقسم المتغيرات الكمية إلى نوعين .....

    أ - متغير متقطع غير مستمر Dis continuous variable : هو المتغير المرتبط بالأعداد ويأخذ قيم كاملة غير مجزئة أي تأخذ كل مشاهدة أو مفردة في المتغير المتقطع قيم متباعدة أو متقطعة بشكل قفزات ، كما هو الحال بعدد التفرعات أو عدد الولادات أو عدد الأشخاص المصابين أو اللون وغيرها فمثلاً يكون عدد التفرعات 4 أو 5 ولا يمكن أن يكون 4.7 وكذلك الإصابة بمرض معين إما مصاب أو غير مصاب وعدد المدارس وهكذا (لا تزيد قيمة المتغير أو تنقص بأقل من واحد) .

    ب - متغير مستمر Continuous variable : هو المتغير الذي يأخذ مدى واسع من القيم ضمن حدود معينة كما هو الحال مثلاً في وزن الجسم أو طول الجسم أو انتاج الحليب أو كمية البروتين أو درجة الحرارة أو الزمن وغيرها ، فهي متغيرات مستمرة ( فيها تباين واضح غير متقطعة وممكن أن تحمل كسور) . وبمعنى أخر هو المتغير الذي تأخذ كل مفردة أو مشاهدة قيمة رقمية أو كسر بين حدي التغير الكلي فلو فرضنا أن طول الطلاب يتراوح بين حدي التغير يتراوح بين 130.5 و 170 سم .

    3)المشاهدة Observation : هي قيمة المتغير المراد دراسته لشخص واحد أو نبات واحد أو حيوان واحد بالمشاهدة (مثلاً وزن الجسم لدى أحمد 70 كغم) ، وتعتبر المشاهدة بمثابة المواد الأولية التي يتعامل معها الباحث فاذا أراد معرفة عدد التفرعات في نبات ما ولنفرض عدد التفرعات 6 فان هذا العدد يمثل المشاهدة وإن مجموع المشاهدات تكون البيانات Data .

    4)البيانات Data : عبارة عن مجموعة من المشاهدات (أي عدد من القيم) وتقسم البيانات إلى نوعين :

    أ - البيانات الكمية Quantitative data : هي البيانات التي تقاس بوحدات أو تحدد وفق ألة عد أو قياس مثل الطول بالسنتيمتر أو أوزان الجسم بالكيلوغرام وكذلك تشمل النسب المئوية ، وهذه البيانات هي الأكثر استخداماً في الحلول والعمليات الإحصائية .

    ب - البيانات النوعية Qualitative data : هي بيانات وصفية (مثلاً توصف الأجسام حسب أطوالها إلى طويلة ومتوسطة وقصيرة وكذلك الطعم لمادة معينة إلى مقبول و غير مقبول) وهذا النوع من البيانات يخضع للاجتهاد الشخصي ، وكلما قلت الفئات المستخدمة تكون الدقة أكثر لأن الاجتهاد يقل .

    5)المجتمع Population : المجتمع وفق المفهوم الاحصائي هو جميع القيم أو المفردات أو العناصر التي تشترك في متغير واحد أو أكثر تميزه تماماً عن بقية المجتمعات مثل (أشخاص ونباتات وحيوانات وصخور وحقول وغيرها) فاذا كانت دراستنا متعلقة بطلبة جامعة كربلاء فالمجتمع هو جميع طلبة هذه الجامعة

    ويقسم المجتمع إلى :

    أ - مجتمع محدود : هو المجتمع الذي يمكن حصر عدد مفرداته كما هو الحال في أطوال طلبة كلية الزراعة في جامعة كربلاء .

    ب - مجتمع غير محدود : هو المجتمع الذي من الصعب أو المستحيل حصر عدد مفرداته مثل مجتمع نوع الأسماك وعددها في نهر دجلة أو عدد البكتيريا في حقل معين أو نوع من الطيور وعددها في العراق .

    6)العينة Sample : عبارة عن جزء من المجتمع أو مجموعة من المشاهدات اختيرت بطريقة ما من المجتمع ، وفي أغلب الأحيان لا نستطيع جمع المعلومات أو البيانات المطلوبة لكل عناصر المجتمع دون استثناء لأسباب قد تتعلق بالكلفة أو الحاجة الأنية (السرعة) أو محدودية الإمكانات وغيرها ، لذا نلجأ إلى اختبار عدد معين من عناصر المجتمع بهدف دراستها للحصول على البيانات المطلوبة ، وكلما زاد حجم العينة تزداد دقة النتائج أي يجب أن تكون العينة ممثلة للمجتمع . وهناك عدة طرق لجمع البيانات أهمها :

    أ - طريقة المسح Survey : فمثلاً إذا أردنا معرفة مقدار استهلاك الأسرة الواحدة في منطقة جغرافية معينة من مادة الرز مثلاً ، فان بإمكاننا جمع البيانات المطلوبة من خلال استجواب هذه الأسر وتدوين إجاباتهم دون تحكم عوامل معينة تؤثر في استهلاك الرز من قبل أفراد العائلة ، ونفس الحال بالنسبة للتعداد السكاني والتعداد الزراعي وغيرها .

    ب - طريقة التجربة : في هذه الطريقة تحتاج إلى إجراء تجربة معينة في الحقل أو المختبر ، مثلاً دراسات تأثير إضافة مستويات مختلفة من السماد الكيميائي إلى التربة أو إضافة مستويات مختلفة من فيتامين C مثلاً (صفر و 2 و 4 و 6 غم لكل كغم من العلف) في قابلية النمو للطيور الداجنة . 

       ويمكن تقسيم العينات إلى أنواع منها

    1)العينة العشوائية :هي العينات التي تؤخذ من المجتمع عشوائياً وفيها تعطى كل عنصر من عناصر المجتمع فرصة الدخول ضمن العينة ، ولا يكون للباحث دخل أو رأي في اختيار هذه المفردة أو تلك وإنما على أساس عشوائي وتعتبر أفضل أنواع العينات للأسباب الأتية :

    أ - إعطاء كل عنصر من العناصر فرصة بأن يدخل ضمن العينة .

    ب - العينة العشوائية تضمن تساوي اختيار بقية العينات .

    ج - ضمان الحصول على عينة ممثلة للمجتمع .

    وتؤخذ العينة العشوائية بطرق مختلفة أهمها

    1-طريقة البطاقات (اليانصيب أو القرعة) .

    2-طريقة جداول الأعداد العشوائية .

    تكون العينة العشوائية على أربعة أصناف هي :

    1)العينات العشوائية البسيطة : شرط سحبها أن يكون المجتمع الإحصائي متجانس وكل مفردة في المجتمع لها نفس الفرصة في الظهور ضمن مفردات العينة .

    2)العينات العشوائية الطبقية : شرط سحبها أن يكون المجتمع غير متجانس بحيث نستطيع تحويله إلى مجتمع متجانس عن طريق تقسيمه إلى طبقة بحيث نضمن مبدأ التجانس داخل كل طبقة ويتم سحب عينة عشوائية بسيطة من كل طبقة بحيث يتناسب حجمها مع حجم الطبقة في المجتمع .

    3)العينات العشوائية المنتظمة : هي طريقة من طرق الاختيار العشوائي لكنها لا تعطي فرصاً متساوية للأفراد في الظهور وتكون المسافة بين كل وحدة من وحدات العينة التي تم اختيارها ثابتة لذلك تسمى هذه الطريقة بذات القنوات المتساوية وشرط سحبها هو أن يكون المجتمع الإحصائي مرتبا ترتيبا تصاعديا أو تنازليا أو وفق أي ترتيب أخر .

    مثال : إذا أراد الباحث أن يختار عينة من 50 طالباً من قائمة تضم 500 طالب فان الباحث ووفق هذا الأسلوب سوف يقسم 500 على 50 ليحدد المسافة أو الفترة وهي 10 ثم يختار بطريقة عشوائية رقماً بين (1- 10) ، يبدأ به ولنفرض أن هذا الرقم 7 عندئذ يسحب من القائمة 7 ، 17 ، 27 وهكذا .

    تتميز هذه العينة بسهولة اختيار أفرادها الا أنها توصف بأنها شبه عشوائية إذ يتم اختيار الفرد الأول فقط عشوائياً .

    4)عينات عشوائية متعددة المراحل : شرط سحبها هو أن يكون المجتمع الإحصائي كبير جدا وموزع على بقعة جغرافية واسعة كأن يكون المجتمع على مستوى البلد أو المحافظة أو المقاطعة أو إقليم وفي هذه الحالة نبدأ بتقسيم المجتمع إلى وحدات أولية ثم نأخذ عينة عشوائية من هذه الوحدات كمرحلة أولى ، ثم نقسم كل وحدة أولية مختارة إلى وحدات اصغر (الوحدات الثانوية) ويتم اختيار عينة من الوحدات الثانوية لكل وحدة أولية كمرحلة ثانية ، ونستمر بالتقسيم والاختيار على هذا المنوال إلى إن نصل إلى عدد المفردات التي تؤلف العينة العشوائية .

    2)العينة غير العشوائية :هي تلك العينة التي تضم مفردات أو مشاهدات مختارة ، تجمع من مجتمع الدراسة بطريقة يكون للباحث شخصياً دخل في اختيار هذه المفردة دون مفردة أخرى بصورة متحيزة وليس على أساس عشوائي وذلك لاعتبارات تتعلق بطريقة الدراسة ، لاعتقاده بأن هذه المفردات هي خير ما تمثل المجتمع والتي ستغني الدراسة بآرائها وأطروحاتها .

    المحاضرة الثانية طرق جمع وتصنيف البيانات