دید کلی
شاید مهمترین نکته در مطالعه توزیع یک نمونه از اندازهها ، تعیین یک مقدار مرکزی باشد، یعنی ، یک مقدار نماینده که اندازهها در اطراف آن توزیع شدهاند. هر معیار عددی را که معرف مرکز مجموعه دادهها باشد، معیار گرایش به مرکز مینامند. دو تا از متداولترین معیارهای گرایش به مرکز عبارتند از : میانگین و میانه.
تعریف میانگین
میانگین یا متوسط نمونه ای مرکب از n اندازه x
1، x
2 ، ... ، x
n ، عبارت است از خارج قسمت مجموع این اندازه ها بر n، میانگین را با نشان می دهند که در عملیات، به صورت زیر نوشته می شود:
x´ = ∑ xi/n (به ازای i=0 تا n)
همان طوریکه از مفهوم "متوسط" بر میآید، میانگین ، مرکز مجموعه دادهها را نمایش میدهد. اگر نمودار نقطهای مجموعه دادهها را این طور تجسم کنیم که روی میلاه افقی نازکی ، گویهای هم اندازهای در محل دادهها قرار دارند، آنگاه ، میانگین نشان دهنده نقطهای است که این میله در آن نقطه به حال تعادل در میآید.
تعریف میانه نمونهای
میانه نمونهای مرکب از n اندازه x
1، x
2 ، ... ، x
n ، عبارت است از اندازه وسطی ، در صورتی که اندازهها را به ترتیب از کوچکترین به بزرگترین مقدار مرتب کرده باشیم. اگر n فردی باشد، یک مقدار وسطی منحصر به فرد وجود دارد که میانه است. اگر n زوج باشد در مقدار وسطی وجود دارند که متوسط آنها به عنوان میانه تعریف میشود. اجمالا میتوان گفت که ، میانه مقداری است که دسته دادهها را به دو نیمه مساوی تقسیم میکند. به عبارت دیگر ، 50% دادهها در زیر میانه و 50% در بالای میانه قرار میگیرند.
موارد استفاده از میانه و میانگین
وجود معدودی مشاهده خیلی برزرگ یا خیلی کوچک ، در میانه تاثیر ندارد، در حالی که وجود اینگونه مقادیر فرین در میانگین اثر قابل ملاحظهای دارد. به نظر میرسد برای توزیعهایی که خیلی نامتقارن هستند، میانه معیار معقولتری از
گرایش به مرکز است تا میانگین. به این دلیل در گزارشهای دولتی راجع به توزیع درآمد، به جای میانگین ، میانه درآمدها را ذکر میکنند. وقتی توزیع خیلی نامتقارن نیست، میانگین به میانه ترجیح داده میشود و خیلی بیشتر از میانه بکار میرود، زیرا در روشهای استنباطی ، میانگین از لحاظ نظری دارای امتیازاتی است که میانه فاقد آنهاست.
مفهوم چارک و صدک
اگر تعداد مشاهدات خیلی زیاد باشد (مثلا بیشتر از 25 یا 30) ، گاهی مفید است که مفهوم میانه را تعمیم دهیم و مجموعه دادههای مرتب شده را به چهار قسمت تقسیم کنیم. درست همان طور که نقطه تقسیم دادهها به دو نیمه ، میانه خوانده شده نقاط تقسیم دادهها ، به چهار قسمت را چارک مینامند. بنابراین به جای این که بحث را محدود به تقسیم چهار قسمتی کنیم، دادهها را به قسمتهای زیادتری تقسیم ، و صدک را تعریف میکنیم.
صدک
صدک (100P) ام نمونه، مقداری است که وقتی داده ها از کوچکتذرین تا بزرگترین مقدار مرتب شدند، حداقل 100P% از مشاهدات منطبق بر این مقدار یا در سمت چپ (زیر) آن و حداقل 100P% از مشاهدات منطبق بر این مقدار یا در سمت راست (بالای) آن باشند.
چارکهای نمونه
- چارک (اول) کوچکتر صدک 25 ام = Q1
- چارک (دوم) میانه صدک 50 ام = Q2
- چارک (سوم) بالایی صدک 75 ام = Q3
مباحث مرتبط با عنوان