Автор: Свык Айнур Кенесовна
Сборник заданий по теме «Основы статистики»
1. В течении недели в 8 ч утра Саша измерял температуру воздуха. Он получил такие результаты: 20°С; 18°С; 16°С; 15°С; 14°С; 17°С; 19°С. Найдите среднее значение проведенных измерений.
2. Поезд ехал со скоростью 4 ч со скоростью 64 км/ч и 5 ч со скоростью 53,2 км/ч. Найдите среднюю скорость поезда на протяжении всего пути.
3.Автомобиль ехал 3 ч со скоростью 56,4 км/ч и 4 ч со скоростью 62,7 км/ч. Найдите среднюю скорость автомобиля на всем пути.
4.В автомастерской работает 10 человек. У двоих из них месячная зарплата составляет 22800 р., у четверых — 28000 р., у троих 31000 р., а у одного 32000 р. Какова средняя зарплата работников мастерской?
5.Фермер собрал с каждого гектара поля площадью 30 га по 30,2 ц пшеницы, а с каждого гектара поля площадью 20 га — по 32, 3 ц пшеницы. Какой средний урожай с одного гектара собрал фермер.
6.Среднее арифметическое четырех чисел равно 2,1, а среднее арифметическое трех других чисел − 2,8. Найдите среднее арифметическое этих семи чисел.
7.Среднее арифметическое семи чисел равно 10,2, а среднее арифметическое трех других чисел − 6,8. Найдите среднее арифметическое этих десяти чисел.
8.В институте сдавали зачет по высшей математике. В группе было 10 человек, и они получили соответствующие оценки: 3; 5; 5; 4; 4; 4; 3; 2; 4; 5.
Какую оценку получали чаще всего? Каков средний балл сдавшей зачет группы?
9.Дан ряд чисел: 175; 172; 179; 171; 174; 170; 172; 169.
Найдите медиану и размах ряда.
10.Дан ряд чисел: 175; 172; 179; 171; 174; 170; 172; 169.
Найдите моду ряда и среднее арифметическое ряда.
11.Имеются следующие данные о месячной заработной плате пяти рабочих (тг): 126000; 138000; 132000; 141000; 150000.
Найдите среднюю заработную плату.
12.Магазин продает 8 видов булочек по следующим ценам: 31; 22; 24; 27; 30; 36; 19; 27.
Найдите разность среднего арифметического и медианы этого набора.
13.Найдите среднее арифметическое и медиану числового ряда.
9; 7; 1; 1; 11; 5; 1.
14.Товарные запасы хлопчатобумажных тканей в магазине за первое полугодие составили (тыс. тг) на начало каждого месяца:
I |
II |
III |
IV |
V |
VI |
VII |
37 |
34 |
35 |
32 |
36 |
33 |
38 |
Определите средний товарный запас хлопчатобумажных тканей за первое полугодие.
15.Провели несколько измерений случайной величины: 2,5; 2,2; 2; 2,4; 2,9; 1,8.
Найдите среднее арифметическое этого набора чисел.
16.Провели несколько измерений случайной величины: 6; 18; 17; 14; 4; 22.
Найдите медиану этого набора чисел.
17.Провели несколько измерений случайной величины:
800; 3200; 2000; 2600; 2900; 2000. Найдите моду этого набора чисел.
18.Магазин продает 8 видов хлеба по следующим ценам: 60, 75, 80, 85, 90, 100, 110, 120 тенге.
Найдите разность среднего арифметического и медианы этого набора.
19.Дан числовой ряд: 1; 7; 3; 8; 7; 12; 22; 7; 11; 22; 7,8.
Найдите среднее арифметическое, размах и моду.
20.Для ряда чисел 5, 6, 8, 10, 7, 2 найдите:
а) среднее арифметическое;
б) отклонение каждого члена ряда от среднего арифметического;
в) сумму квадратов отклонений;
г) дисперсию ряда.
21. Вычислите дисперсию ряда чисел:
а) 6, 8, 10, 12, 9;
б) -4, -1, -2, 7, 5, 4.
22. Составьте какой-либо ряд, состоящий из пяти чисел. Найдите для него:
а) среднее арифметическое;
б) дисперсию;
в) среднее квадратичное отклонение.
23. В таблице приведены средние месячные температуры (в градусах Цельсия), установленные для Москвы и Хабаровска для первого полугодия на основе наблюдений, проводившихся в течение 80 лет.
Пользуясь калькулятором, найдите для каждого ряда данных:
а) среднее арифметическое месячных температур;
б) отклонения температур от среднего арифметического;
в) дисперсию.
Объясните, какие особенности климата отражены в значениях дисперсии.
24. Найдите дисперсию и среднее квадратичное отклонение для ряда чисел:
а) -5, -8, 6, 7, 4, 3; б) 1, 0, 3, 0, 6, 4.
25. Для произвольного ряда, составленного из пяти двузначных чисел, найдите среднее квадратичное отклонение.
26. Как изменится дисперсия ряда чисел
х1, х2, х3, х4, х5, х6,
если каждое число увеличить на положительное число а?
Проверьте результат на примере ряда 1, 3, 6, 8, -1, -2 и а = 4.
Выскажите предположение и проведите доказательство.
27. Задание. Континентальный климат отличается от умеренного более резкими изменениями температуры в течение года. В районах с континентальным климатом жаркое лето и очень холодная зима. С помощью дисперсии различия между двумя видами климата можно выразить количественно. В таблице приведены средние месячные температуры в четырех городах. Определите, которые из четырех городов расположены на территории с континентальным климатом, а какие с умеренным.
28. В результате исследования получен статистический ряд: Вычислить статистическую оценку математического ожидания, дисперсии и среднее квадратичное отклонение.
Решение. Для вычисления статистических оценок построим дискретный вариационный ряд:
Вычислим статистическую оценку математического ожидания:
вычислим дисперсию и среднее квадратичное отклонение:
29. Основные фонды предприятия города производственной и непроизводственной сферы характеризуются следующими данными:
Количество предприятий, fi |
Среднегодовая стоимость основных средств предприятий в сфере, млн.руб., Хi |
Производ-ственная |
Непроиз-водственная |
Производ-ственная |
Непроиз-водственная |
|
Производ-ственная |
Непроиз-водственная |
xi *fi |
xi *fi |
(xi — xcp)^2*fi |
(xi — xcp)^2*fi |
|
2 |
2,9 |
0,9 |
5,8 (2,9*2) |
1,8 (2*0,9) |
31,3 |
7,4 |
3 |
7,1 |
1,2 |
21,3 (7,1*3) |
3,6 |
0,2 |
7,9 |
5 |
10,7 |
2,2 |
53,5 |
11 |
73,9 |
2,0 |
6 |
6,9 |
3,2 |
41,4 |
19,2 |
0,0 |
0,8 |
7 |
5,1 |
4,2 |
35,7 |
29,4 |
21,6 |
13,2 |
23 |
157,7 |
65 |
127,0 |
31,4 |
Определить по каждому виду основных средств: средний размер основных средств на одну организацию и среднее квадратическое отклонение. Сравните вариацию, сделайте выводы.
Решение
Среднюю величину можно рассчитать по формуле средней арифметической взвешенной.
Для предприятий производственной сферы:
SHAPE \* MERGEFORMAT
=(2*2,9+3*7,1+5*10,7+6*6,9+7*5,1)/23=6,9.
Для предприятий непроизводственной сферы:
SHAPE \* MERGEFORMAT
= (0,9*2+1,2*3+2,2*5+3,2*6+4,2*7)/23=2,8.
Дисперсия.
Определим дисперсию.
Для предприятий производственной сферы
SHAPE \* MERGEFORMAT
=127/23= 5,5.
Для предприятий непроизводственной сферы = 31,4 / 23=1,4.
Среднее квадратическое отклонение
Среднеквадратическое отклонение находят как корень квадратный из дисперсии.
Поэтому для предприятий производственной сферы Среднеквадратическое отклонение это корень квадратный из 5,5, т.е. 2,3.
Для предприятий непроизводственной сферы Среднеквадратическое отклонение это корень квадратный из 1,4, т.е. 1,2.
30. Распределение фермерских хозяйств по посевной площади представлено следующими данными:
До 100 |
100-200 |
200-300 |
300-400 |
400-500 |
500 и более |
Итого |
|
Удельный вес хозяйств, в % к итогу |
17 |
20 |
28 |
25 |
7 |
3 |
100 |
Найдите дисперсию и среднее квадратичное отклонение посевных площадей, применив для расчета средней арифметической и дисперсии метод моментов.
Посевные площади, га |
Удельный вес хозяйств, в % к итогу |
середина интервала |
произведение признака на частность |
(xi^2)*fi |
До 100 |
17 |
50 |
8,5 |
425 |
100-200 |
20 |
150 |
30 |
4500 |
200-300 |
28 |
250 |
70 |
17500 |
300-400 |
25 |
350 |
87,5 |
30625 |
400-500 |
7 |
450 |
31,5 |
14175 |
500 и более |
3 |
550 |
16,5 |
9075 |
Итого |
100 |
244 |
76300 |
Средняя арифметическая (начальный момент первого порядка) = 244.
Дисперсия (центральный момент второго порядка)=16764.
Среднее квадратическое отклонение равно корню квадратному из дисперсии, т.е. из 16764=129,5.
31. Задание. Для проверки умения решать задачи в уме были отобраны девочки и мальчики одного возраста. Результаты исследования предоставлены в следующих таблицах:
Кол-во девочек |
3 |
5 |
6 |
9 |
11 |
12 |
13 |
15 |
18 |
Прав. ответы |
20 |
18 |
9 |
3 |
15 |
6 |
8 |
17 |
4 |
Кол-во мальчиков |
2 |
7 |
8 |
10 |
12 |
14 |
16 |
17 |
19 |
Прав. ответы |
10 |
19 |
14 |
4 |
11 |
9 |
8 |
7 |
3 |
Кого стоит отправлять на олимпиады и различные конкурсы? Мальчиков или девочек?
32. Рассмотрим два малых предприятия, у нас есть данные о запасе какого-то товара на их складах.
День 1 |
День 2 |
День 3 |
День 4 |
|
Пред.А |
19 |
21 |
19 |
21 |
Пред.Б |
15 |
26 |
15 |
24 |
В обеих компаниях среднее количество товара составляет 20 единиц:
- А -> (19 + 21 + 19+ 21) / 4 = 20
- Б -> (15 + 26 + 15+ 24) / 4 = 20
Однако, глядя на цифры, можно заметить:
- в компании A количество товара всех четырёх дней очень близко находится к этому среднему значению 20 (колеблется лишь между 19 ед. и 21 ед.),
- в компании Б существует большая разница со средним количеством товара (колеблется между 15 ед. и 26 ед.).
Если рассчитать стандартное отклонение каждой компании, оно покажет, что
- стандартное отклонение компании A = 1,
- стандартное отклонение компании Б ≈ 5.
Стандартное отклонение показывает эту волатильность данных — то, с каким размахом они меняются; т.е. как сильно этот запас товара на складах компаний колеблется (поднимается и опускается).
33. Допустим, вы с друзьями решили измерить рост ваших собак (в миллиметрах). В результате измерений вы получили следующие данные измерений роста (в холке): 600 мм, 470 мм, 170 мм, 430 мм и 300 мм.
Порода собаки |
Рост в миллиметрах |
Ротвейлер |
600 |
Бульдог |
470 |
Такса |
170 |
Пудель |
430 |
Мопс |
300 |
Вычислим среднее значение, дисперсию и среднеквадратическое отклонение.
Сперва найдём среднее значение. Как вы уже знаете, для этого нужно сложить все измеренные значения и поделить на количество измерений. Ход вычислений:
Среднее мм.
Итак, среднее (среднеарифметическое) составляет 394 мм.
Теперь нужно определить отклонение роста каждой из собак от среднего:
Наконец, чтобы вычислить дисперсию, каждую из полученных разностей возводим в квадрат, а затем находим среднее арифметическое от полученных результатов:
Дисперсия мм2.
Таким образом, дисперсия составляет 21704 мм2.
Как найти среднеквадратическое отклонение
Так как же теперь вычислить среднеквадратическое отклонение, зная дисперсию? Как мы помним, взять из нее квадратный корень. То есть среднеквадратическое отклонение равно:
мм (округлено до ближайшего целого значения в мм).
Применив данный метод, мы выяснили, что некоторые собаки (например, ротвейлеры) – очень большие собаки. Но есть и очень маленькие собаки (например, таксы, только говорить им этого не стоит).
Самое интересное, что среднеквадратическое отклонение несет в себе полезную информацию. Теперь мы можем показать, какие из полученных результатов измерения роста находятся в пределах интервала, который мы получим, если отложим от среднего (в обе стороны от него) среднеквадратическое отклонение.
34. Изменение численности работающих характеризуется следующими данными:
Годы |
Численность работающих человек |
1983 |
746 |
1984 |
737 |
1985 |
726 |
1986 |
717 |
1987 |
738 |
1988 |
751 |
1989 |
746 |
1990 |
725 |
1991 |
693 |
1992 |
681 |
1993 |
678 |
1994 |
682 |
1995 |
597 |
1996 |
595 |
1997 |
583 |
· Определить вид динамического ряда.
· Определить аналитические показатели динамики: абсолютный прирост, темп роста и прироста (цепные и базисные), абсолютное содержание 1% прироста. Результаты оформить таблицей.
· Определить динамические средние за период.
· Для определения тенденции изменения численности работающих произведите аналитическое выравнивание и выразите общую тенденцию соответствующим математическим уравнением.
· Определить выровненные (теоретические) уровни ряда динамики и нанести их на график – с фактическими данными.
· Предполагая, что выявленная тенденция сохранится в будущем, определить ожидаемую численность работающих на ближайшие 5 лет.
35.По известным данным о размере денежных средств на счете вкладчикам на начало некоторых месяцев определите среднемесячный остаток вклада за первый квартал, за первое полугодие и за 2009 год.
Дата |
01.01.2009 |
01.03.2009 |
01.04.2009 |
01.07.2009 |
01.08.2009 |
01.09.2009 |
01.12.2009 |
01.01.2010 |
Остаток |
13200 |
14728 |
15187 |
14850 |
13000 |
11000 |
8050 |
12230 |
36. По следующим данным о распределении 100 работников банка по величине месячной заработной платы определите среднюю заработную плату (используя способ моментов), приходящуюся на одного работника, моду и медиану.
Группы работников по величине месячной заработной платы, долл. |
Число рабочих, в процентах к итогу |
500-600 |
10 |
600-700 |
15 |
700-800 |
20 |
800-900 |
25 |
900-1000 |
15 |
1000-1100 |
10 |
Более 1100 |
5 |
Итого: |
100 |
37. Имеются следующие данные о перевозках грузов электровозами и тепловозами:
Вид тяги |
1 квартал |
2 квартал |
||
Дальность перевозок, км. |
Общий грузооборот, т*км |
Дальность перевозок, км. |
Общий объем перевозимого груза, т. |
|
Электровозы |
200 |
1400 |
220 |
7.0 |
Тепловозы |
320 |
2560 |
350 |
9.0 |
Определите среднюю дальность перевозок:
за 1 квартал;
за 2 квартал;
за полугодие.
38. По следующим данным о распределении предприятий региона по объему товарооборота, определите средний объем товарооборота, приходящийся на одно предприятие:
Группы предприятий по объему товарооборота, тыс.тенге. |
Число предприятий |
700-800 |
5 |
800-900 |
10 |
900-1000 |
12 |
1000-1100 |
10 |
1100-1200 |
8 |
1200-1300 |
6 |
Свыше 1300 |
5 |
Итого: |
56 |
39. На фирме работает 39 человек. Проведено исследование числа рабочих дней, пропущенных каждым работником фирмы в течение месяца. Результаты таковы:
0,1,3,0,2,3,5,7,3,5,2,10,7,5,0,2,5,10,5,3,1,9,15,10,1,0,2,3,5,7,7,6,5,3,0,7,10,13,0.
Составить интервальный вариационный ряд. Построить функцию распределения случайной величины числа пропущенных рабочих дней.
40. Вычислить дисперсию и среднее квадратичное отклонение по данным таблицы:
Тариф, разряд |
Число работников, чел |
12 |
1 |
13 |
5 |
14 |
30 |
15 |
60 |
16 |
30 |
17 |
5 |
18 |
1 |
ИТОГО |
132 |
41. В результате обследования получены следующие данные о распределении семей по размеру совокупного дохода:
Группы семей по размеру дохода, руб. |
Число семей |
До 100 |
3 |
100-150 |
35 |
150-200 |
20 |
200-250 |
10 |
250-300 |
11 |
300-350 |
14 |
Свыше 350 |
7 |
Итого: |
100 |
Определите дисперсию и среднее квадратичное отклонение.
42. Имеются следующие данные о возрасте работников цеха:
18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29
1. Построить интервальный ряд распределения
2. Графическое изображение ряда
3. Построить гистограмму, указать моду, средние значения. Вычисления производить по двум интервальным рядам. Разбиение на интервалы производить по формуле Стерджесса и следующим образом: 18-21; 21-24; 24-27; 27-30; 30-33; 33-36; 36-39
4. Найти среднее, моду, медиану, среднее линейное отклонение, среднее квадратичное отклонение, соотношение между модой медианой и средним
43. Имеются выборочные данные (выборка 5%-ная, механическая) об объеме реализации и сумме прибыли от реализации продукции по 40 однородным предприятиям одной из отраслей промышленности за год (тыс. тенге.)
№ |
Объем продукции |
Прибыль от реализации |
№ |
Объем реализованной продукции |
Прибыль от реализации |
1 |
1580 |
487 |
21 |
995 |
485 |
2 |
1960 |
650 |
22 |
1720 |
485 |
3 |
2495 |
790 |
23 |
1880 |
590 |
4 |
1320 |
430 |
24 |
2360 |
530 |
5 |
990 |
485 |
25 |
2830 |
750 |
6 |
2620 |
720 |
26 |
3000 |
740 |
7 |
1780 |
435 |
27 |
1770 |
485 |
8 |
1860 |
486 |
28 |
1120 |
435 |
9 |
1685 |
430 |
29 |
930 |
340 |
10 |
1080 |
430 |
30 |
1940 |
630 |
11 |
500 |
280 |
31 |
2494 |
620 |
12 |
1890 |
610 |
32 |
1885 |
650 |
13 |
1995 |
660 |
33 |
1480 |
545 |
44. Численность специалистов с высшим и специальным средним образованием (человек) двух регионов представлена в табл.
Дата |
I регион |
II регион |
1 января 2000 г. |
1850 |
1720 |
1 апреля 2000 г. |
1866 |
1810 |
1 декабря 2000 г. |
1910 |
1860 |
1 января 2001 г. |
1960 |
1900 |
Требуется:
1. сопоставить среднегодовую численность специалистов по двум регионам;
2. определить, в каком регионе и на сколько средняя численность специалистов больше (в абсолютном и относительном выражении).