مقدمه
مطالعه توصیفی داده مشتمل بر تعریف
آمار توصیفی است. آمار توصیفی یعنی خلاصه کردن و توضیح خصوصیات مهم مجموعه دادهها. این مبحث مشتمل است بر فشرده کردن دادهها در قالب جداول ، نمایش آنها بوسیله نمودار و محاسبه شاخصهای عددی گرایش به مرکز و تفرق. این روشها انعطاف پذیرند و آنها را هم میتوان در مواردی بکار برد که مجموعه دادهها بوسیله نمونهگیری بخش کوچکی از
جامعه بدست میآید و هم در مواردی که مجموعه دادهها تقریبا تمام جامعه را شامل است مثلا در سرشماریها.
مراحل اساسی توصیف مجموعه دادهها
خلاصه کردن وتوصیف الگوی کلی دادهها
این مرحله بوسیله مراحل زیر عملی است:
- ارائه جداول و نمودارها
- بررسی کلی نمودار داده ها از لحاظ خصوصیات مهم ، از جمله تقارن یا انحراف از تقارن.
- بررسی اجمالی نمودار دادهها برای ملاحظه مشاهدات غیرمنتظرهای که به نظر میرسد از توده اصلی دادهها دورند.
محاسبه معیارهای عدد
این مرحله برای بدست آوردن موارد زیر است.
- یک مقدار نوعی یا معرف که مرکز دادهها را نشان دهد.
- مقدار پراکندگی دادهها.
توصیف داده بوسیله نمودارها و جداول
عمدتا دو نوع نمودار برای نشان دادن مجموعه دادهها به کار میروند که عبارتاند از
نمودار نقطهای و
بافت نگار. نمودارهای نقطهای را وقتی بکار میبرند که تعداد مشاهدات نسبتا کم باشد (مثلا کمتر از 20 تا 25). بافت نگارها برای حالتی که تعداد مشاهدات زیاد است، بکار میروند.
نمودار نقطهای
وقتی تعداد دادهها کم است. آنها را میتوان بوسیله نمودار نقطهای نشان داد. به این ترتیب که خطی رسم میکنیم و روی آن مقیاسی که حوزه اندازهها را دربرگیرد، در نظر میگیریم و هر یک از اندازهها را بر روی این خط به صورت نقطه پررنگی مشخص میکنیم. نمودار حاصل ، نمودار نقطهای خوانده میشود.
بافت نگار
وقتی مجموعه دادهها از تعداد زیادی اندازه تشکیل شده باشد. رسم نمودار نقطهای زحمت زیادی دارد. به علاوه ، تجمع زیاد نقاط ممکن است باعث شود که نمودار نقطهای جزئیات مربوط به قسمتهایی را که در آنها مشاهدات به شدت متمرکزند به خوبی نشان ندهد. در چنین حالاتی مناسب است که دادهها از طریق گروه بندی مشاهدات نزدیک بهم خلاصه کنیم ویک جدول فراوانی تشکیل دهیم. مراحل اصلی این فرایند در زیر خلاصه شده است.
مراحل تشکیل توزیع فراوانی
- پیدا کردن مقدار کمینه و بیشینه در مجموعه دادهها
- انتخاب تعدادی زیر فاصله یا خانههایی به طول مساوی به طوری که دامنه بین بیشینه و کمینه را بدون داشتن فصل مشترک در برگیرند. هر یک از این زیر فاصلهها را رده و دو سر هر رده را مرزهای آن رده مینامند.
- شمارش تعداد مشاهدات موجود در هر رد. هر یک از اعداد حاصل از این شمارشها را فراوانی ردهای یا فراوانی خانهای مینامند.
- تعیین فراوانی نسبی هررده با تقسیم فراوانی ردهای آن رده به تعداد کل مشاهدات. به این ترتیب فراوانی یک رده عبارت است از نسبت تعداد مشاهدات موجود در آن رده تعداد کل مشاهدات.
بافت نگار فراوانی نسبی
برای رسم بافت نگار فراوانی نسبی ، ردهها را روی محور افقی نمودار مشخص میکنیم و آن گاه روی هر رده ، مستطیلی عمودی رسم میکنیم که مساحت آن مساوی با فراوانی نسبی آن رده باشد.
طول رده / فراوانی نسبی رده = ارتفاع مستطیل
نمودار خطی فراوانی نسبی
مقادیر متمایز را به صورت نقاطی روی محور افقی مشخص میکنیم و سپس از نقاط حاصل ، خطهایی عمود بر محور رسم میکنیم که ارتفاع هر یک برابر با فراوانی نسبی مقدار مربوطه باشد.
مباحث مرتبط با عنوان