میانگین گیری









دید کلی

شاید مهمترین نکته در مطالعه توزیع یک نمونه از اندازه‌ها ، تعیین یک مقدار مرکزی باشد، یعنی ، یک مقدار نماینده که اندازه‌ها در اطراف آن توزیع شده‌اند. هر معیار عددی را که معرف مرکز مجموعه داده‌ها باشد، معیار گرایش به مرکز می‌نامند. دو تا از متداولترین معیارهای گرایش به مرکز عبارتند از : میانگین و میانه.

تعریف میانگین

میانگین یا متوسط نمونه ای مرکب از n اندازه x1، x2 ، ... ، xn ، عبارت است از خارج قسمت مجموع این اندازه ها بر n، میانگین را با نشان می دهند که در عملیات، به صورت زیر نوشته می شود:

x´ = ∑ xi/n (به ازای i=0 تا n)

همان طوریکه از مفهوم "متوسط" بر می‌آید، میانگین ، مرکز مجموعه داده‌ها را نمایش می‌دهد. اگر نمودار نقطه‌ای مجموعه داده‌ها را این طور تجسم کنیم که روی میلاه افقی نازکی ، گویهای هم اندازه‌ای در محل داده‌ها قرار دارند، آنگاه ، میانگین نشان دهنده نقطه‌ای است که این میله در آن نقطه به حال تعادل در می‌آید.

تعریف میانه نمونه‌ای

میانه نمونه‌ای مرکب از n اندازه x1، x2 ، ... ، xn ، عبارت است از اندازه وسطی ، در صورتی که اندازه‌ها را به ترتیب از کوچکترین به بزرگترین مقدار مرتب کرده باشیم. اگر n فردی باشد، یک مقدار وسطی منحصر به فرد وجود دارد که میانه است. اگر n زوج باشد در مقدار وسطی وجود دارند که متوسط آنها به عنوان میانه تعریف می‌شود. اجمالا می‌توان گفت که ، میانه مقداری است که دسته داده‌ها را به دو نیمه مساوی تقسیم می‌کند. به عبارت دیگر ، 50% داده‌ها در زیر میانه و 50% در بالای میانه قرار می‌گیرند.

موارد استفاده از میانه و میانگین

وجود معدودی مشاهده خیلی برزرگ یا خیلی کوچک ، در میانه تاثیر ندارد، در حالی که وجود اینگونه مقادیر فرین در میانگین اثر قابل ملاحظه‌ای دارد. به نظر می‌رسد برای توزیعهایی که خیلی نامتقارن هستند، میانه معیار معقولتری از گرایش به مرکز است تا میانگین. به این دلیل در گزارشهای دولتی راجع به توزیع درآمد، به جای میانگین ، میانه درآمدها را ذکر می‌کنند. وقتی توزیع خیلی نامتقارن نیست، میانگین به میانه ترجیح داده می‌شود و خیلی بیشتر از میانه بکار می‌رود، زیرا در روشهای استنباطی ، میانگین از لحاظ نظری دارای امتیازاتی است که میانه فاقد آنهاست.

مفهوم چارک و صدک

اگر تعداد مشاهدات خیلی زیاد باشد (مثلا بیشتر از 25 یا 30) ، گاهی مفید است که مفهوم میانه را تعمیم دهیم و مجموعه داده‌های مرتب شده را به چهار قسمت تقسیم کنیم. درست همان طور که نقطه تقسیم داده‌ها به دو نیمه ، میانه خوانده شده نقاط تقسیم داده‌ها ، به چهار قسمت را چارک می‌نامند. بنابراین به جای این که بحث را محدود به تقسیم چهار قسمتی کنیم، داده‌ها را به قسمتهای زیادتری تقسیم ، و صدک را تعریف می‌کنیم.

صدک

صدک (100P) ام نمونه، مقداری است که وقتی داده ها از کوچکتذرین تا بزرگترین مقدار مرتب شدند، حداقل 100P% از مشاهدات منطبق بر این مقدار یا در سمت چپ (زیر) آن و حداقل 100P% از مشاهدات منطبق بر این مقدار یا در سمت راست (بالای) آن باشند.

چارکهای نمونه

  • چارک (اول) کوچکتر صدک 25 ام = Q1
  • چارک (دوم) میانه صدک 50 ام = Q2
  • چارک (سوم) بالایی صدک 75 ام = Q3

مباحث مرتبط با عنوان


تعداد بازدید ها: 86176