При расчете средней арифметической для интервального вариационного ряда сначала определяют среднюю для каждого интервала, как полусумму верхней и нижней границ, а затем - среднюю всего ряда. В случае открытых интервалов значение нижнего или верхнего интервала определяется по величине интервалов, примыкающих к ним.

Пример 3 . Определить средний возраст студентов вечернего отделения.

Возраст в годах

Число студентов

Среднее значение интервала

Произведение середины интервала (возраст) на число студентов

до 20

(18 + 20) / 2 =19 18 в данном случае граница нижнего интервала. Вычисляется как 20 - (22-20)

20 - 22

(20 + 22) / 2 = 21

22 - 26

(22 + 26) / 2 = 24

26 - 30

(26 + 30) / 2 = 28

30 и более

(30 + 34) / 2 = 32

Итого

Средние, вычисляемые из интервальных рядов являются приближенными.

  1. Структурные средние величины

Кроме степенных средних в статистике для относительной характеристики величины варьирующего признака и характеристики рядов распределения пользуются структурными средними: модой и медианой.

Мода - это наиболее часто встречающийся вариант ряда. Мода применяется, например, при определении размера одежды, обуви, пользующейся наибольшим спросом у покупателей.

Модой для дискретного ряда является варианта, обладающая наибольшей частотой.

При вычислении моды для интервального вариационного ряда необходимо:

    сначала определить модальный интервал (по максимальной частоте),

    затем - значение модальной величины признака по формуле:

Определение моды графически: Мода определяется по гистограмме распределения. Для этого

правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника, а левую вершину модального прямоугольника - с левым верхним углом последующего прямоугольника. Абсцисса точки пересечения этих прямых и будет модой распределения.

Медиана

Медиана - это значение признака, который делит вариационный ряд на две равные по численности части.

Медиана для дискретного ряда.

Для определения медианы в дискретном ряду с нечетным количеством единиц наблюдения сначалапорядковый номер медианы по формуле: , а затем определяют, какое значение варианта обладает накопленной частотой, равной номеру медианы.

Если ряд содержит четное число элементов, то медиана будет равна средней из двух значений признака, находящихся в середине. Номер первого из этих признаков определяется по формуле: , для второго - . = n (количество элементов в ряду).

Медиана для интервального ряда

При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана.

Для этого:

Пример . Найти моду и медиану для интервального ряда.

Возрастные группы

Число студентов

Сумма накопленных частот ΣS

25 - 30

1054

2272

45 лет и более

Решение :

    Определим моду

В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).

Рассчитаем величину моды:

Это значит, что модальный возраст студентов равен 27 годам.

    Определим медиану.

Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σf i /2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:

Это значит, что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.

Графически медиана определяется по кумуляте. Для ее определения высоту наибольшей ординаты, которая соответствует сумме всех частот, делят пополам. Через полученную точку

проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения является медианой.

При статистической обработке результатов исследований самого разного рода полученные значения часто группируются в последовательность интервалов. Для расчета обобщающих характеристик таких последовательностей иногда приходится вычислять середину интервала - «центральную варианту». Методы ее расчета достаточно просты, но имеют некоторые особенности, вытекающие как из используемой для измерения шкалы, так и из характера группировки (открытые или закрытые интервалы).

Инструкция

Если интервал является участком непрерывной числовой последовательности, то для нахождения ее середины используйте обычные математические методы вычисления среднеарифметического значения. Минимальное значение интервала (его начало) сложите с максимальным (окончанием) и разделите результат пополам - это один из способов вычисления среднеарифметического значения. Например, это правило применимо, когда речь идет о возрастных интервала х. Скажем, серединой возрастного интервала в диапазоне от 21 года до 33 лет будет отметка в 27 лет, так как (21+33)/2=27.

Иногда бывает удобнее использовать другой метод вычисления среднеарифметического значения между верхней и нижней границами интервала . В этом варианте сначала определите ширину диапазона - отнимите от максимального значения минимальное. Затем поделите полученную величину пополам и прибавьте результат к минимальному значению диапазона. Например, если нижняя граница соответствует значению 47,15, а верхняя - 79,13, то ширина диапазона составит 79,13-47,15=31,98. Тогда серединой интервала будет 63,14, так как 47,15+(31,98/2) = 47,15+15,99 = 63,14.

Если интервал не является участком обычной числовой последовательности, то вычисляйте его середину в соответствии с цикличностью и размерностью используемой измерительной шкалы. Например, если речь идет об историческом периоде, то серединой интервала будет являться определенная календарная дата. Так для интервала с 1 января 2012 года по 31 января 2012 серединой будет дата 16 января 2012.

Кроме обычных (закрытых) интервалов статистические методы исследований могут оперировать и «открытыми». У таких диапазонов одна из границ не определена. Например, открытый интервал может быть задан формулировкой «от 50 лет и старше». Середина в этом случае определяется методом аналогий - если все остальные диапазоны рассматриваемой последовательности имеют одинаковую ширину, то предполагается, что и этот открытый интервал имеет такую же размерность. В противном случае вам надо определить динамику изменения ширины интервалов, предшествующих открытому, и вывести его условную ширину, исходя из полученной тенденции изменения.

Инструкция

Если интервал является участком непрерывной числовой последовательности, то для нахождения ее середины используйте математические методы вычисления среднеарифметического значения. Минимальное значение (его начало) сложите с максимальным () и разделите результат пополам - это один из способов вычисления среднеарифметического значения. Например, это применимо, когда речь идет о возрастных интервала х. Скажем, серединой возрастного интервала в диапазоне от 21 года до 33 лет будет отметка в 27 лет, так как (21+33)/2=27.

Иногда удобнее использовать другой метод вычисления среднеарифметического значения между верхней и нижней границами интервала . В этом варианте сначала определите ширину диапазона - отнимите от максимального значения минимальное. Затем поделите полученную величину пополам и прибавьте результат к минимальному значению диапазона. Например, если нижняя соответствует значению 47,15, а верхняя - 79,13, то ширина диапазона составит 79,13-47,15=31,98. Тогда серединой интервала будет 63,14, так как 47,15+(31,98/2) = 47,15+15,99 = 63,14.

Если интервал не является участком обычной числовой последовательности, то вычисляйте его середину в соответствии с цикличностью и размерностью используемой измерительной шкалы. Например, если речь идет об историческом периоде, то серединой интервала будет являться определенная календарная дата. Так для интервала с 1 января 2012 года по 31 января 2012 серединой будет дата 16 января 2012.

Кроме обычных (закрытых) интервалов статистические методы исследований могут оперировать и «открытыми». У таких диапазонов одна из границ не определена. Например, открытый интервал может быть задан формулировкой «от 50 лет и старше». Середина в этом случае определяется методом аналогий - если все остальные диапазоны рассматриваемой последовательности имеют одинаковую ширину, то предполагается, что и этот открытый интервал такую же . В противном случае вам надо определить динамику ширины интервалов, предшествующих открытому, и его условную ширину, исходя из полученной тенденции изменения.

Источники:

  • что такое открытый интервал

При изучении вариации – различий индивидуальных значений признака у единиц изучаемой совокупности – рассчитывают ряд абсолютных и относительных показателей. На практике наибольшее применение среди относительных показателей нашел коэффициент вариации.

Инструкция

Учтите, что коэффициент вариации на практике используется не только для сравнительной оценки вариации, но и для характеристики однородности совокупности. Если данный показатель не превышает 0,333, или 33,3%, вариация признака считается слабой, а если больше 0,333 - сильной. В случае сильной вариации изучаемая статистическая совокупность считается неоднородной, а средняя величина – нетипичной, ее нельзя использовать как обобщающий показатель этой совокупности. Нижним пределом коэффициента вариации считается ноль, верхнего предела не существует. Однако вместе с увеличением вариации признака увеличивается и его значения.

При расчете коэффициента вариации вам придется использовать среднее отклонение. Оно определяется как квадратный корень , которую в свою очередь вы можете найти следующим образом: Д = Σ(Х-Хср)^2/N. Иными словами дисперсия – это средний квадрат отклонения от среднего арифметического значения. определяет, насколько в среднем отклоняются конкретные показатели ряда от их среднего значения. Оно является абсолютной мерой колеблемости признака, а потому четко интерпретируется.

Пример : Требуется определить средний возраст студента заочной формы обучения по данным, заданным в следующей таблице:

Возраст студентов, лет (х )

Число студентов, чел (f )

среднее значение интервала (x",xцентральн )

xi *f i

26 и старше

Итого:

Для вычисления средней в интервальных рядах сначала определяют среднее значение интервала как полу-сумму верхней и нижней границы, а затем рассчитывается средняя величина по формуле средне арифметическая взвешенная.

Выше дан пример с равными интервалами, причем 1-й и последний являются открытыми.

Ответ: средний возраст студента составляет 22,6 года или примерно 23 года.

Средняя гармоническая имеет более сложную конструкцию, чем средняя арифметическая. Используется в тех случаях, когда статистическая информация не содержит частот по отдельным значениям признака, а представлена произведением значения признака на частоту . Средняя гармоническая как вид степенной средней выглядит следующим образом:

В зависимости от формы представления исходных данных средняя гармоническая может быть рассчитана как простая и как взвешенная. Если исходные данные несгруппированны, то применяется средняя гармоническая простая :

К ней прибегают в случаях определения, например, средних затрат труда, материалов и т. д. на единицу продукции по нескольким предприятиям.

При работе со сгруппированными данными используется средняя гармоническая взвешенная :

Средняя геометрическая применяется в тех случаях, когда общий объем усредняемого признака является мультипликативной величиной ,т.е. определяется не суммированием, а умножением индивидуальныхзначений признака .

Форма средней геометрической взвешенной в практических расчётах не применяется .

Средняя квадратическая используется в тех случаях, когда при замене индивидуальных значений признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин .

Главная сфера её использования – измерение степени колеблемости индивидуальных значений признака относительно средней арифметической (среднее квадратическое отклонение). Кроме этого, средняя квадратическая применяется в тех случаях, когда необходимо вычислить средний величину признака, выраженного в квадратных или кубических единицах измерения (при вычислении средней величины квадратных участков, средних диаметров труб, стволов и т. д.).

Средняя квадратическая рассчитывается в двух формах:

Все степенные средние различаются между собой значениями показателя степени. При этом, чем выше показатель степени, тем больше количественное значение среднего показателя :

Это свойство степенных средних называется свойством мажорантности средних .

Расчет средней величины в интервальных вариационных рядах немного отличается от расчета в рядах дискретных. Как рассчитать среднюю арифметическую и среднюю гармоническую в дискретных рядах можно посмотреть вот . Такое различие вполне объяснимо – это связано с особенностью , в которых изучаемый признак приведен в интервале от и до.

Итак, посмотрим особенности расчета на примере.

Пример 1. Имеются данные о дневном заработке рабочих предприятия.

Число рабочих, чел.
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Начало решения задачи будет аналогичным правилам расчета средней величины, которые можно посмотреть .

Начинаем мы с определения варианты и частоты, поскольку ищем мы средний заработок за день, то варианта это первая колонка, а частота вторая. Данные у нас заданы явным количеством, поэтому расчет проведем по формуле средней арифметической взвешенной (так как данные приведены в табличном виде). Но на этом сходства заканчиваются и появляются новые действия.

Дневной заработок рабочего, руб. х Число рабочих, чел. f
500-1000 15
1000-1500 30
1500-2000 80
2000-2500 60
2500-3000 25
Итого 210

Дело в том, что интервальный рад представляет осредняемую величину в виде интервала. 500-1000, 2000-2500 и так далее. Чтобы решить эту проблему необходимо провести промежуточные действия, и только потом подсчитать среднюю величину по основной формуле.

Что же требуется в данном случае сделать. Все достаточно просто, чтобы провести расчет нам нужно, чтобы варианта была представлена одним числом, а не интервалом. Для получения такого значения находят так называемое ЦЕНТРАЛЬНОЕ ЗНАЧЕНИЕ ИНТЕРВАЛА (или середину интервала). Определяется оно путем сложение верхней и нижней границ интервала и делением на два.

Проведем необходимые расчеты и подставим данные в таблицу.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’
500-1000 15 750
1000-1500 30 1250
1500-2000 80 1750
2000-2500 60 2250
2500-3000 25 2750
Итого 210

После того как мы рассчитали центральные значения далее проведем расчеты в таблицы и подставим итоговые данные в формулу, аналогично тому как мы уже рассматривали ранее.

Дневной заработок рабочего, руб. х Число рабочих, чел. f х’ x’f
500-1000 15 750 11250
1000-1500 30 1250 37500
1500-2000 80 1750 140000
2000-2500 60 2250 135000
2500-3000 25 2750 68750
Итого ∑f = 210 ∑ x’f = 392500


В итоге получаем, что среднедневная заработная плата одного рабочего составляет 1869 рублей.

Это пример решения, если интервальный ряд представлен со всеми закрытыми интервалами. Но достаточно часто бывает, когда два интервала открытые, первый и последний. В таких ситуациях прямой расчет центрального значения невозможен, но есть два варианта как это сделать.

Пример 2. Имеются данные о продолжительности производственного стажа персонала предприятия. Рассчитать среднюю продолжительность стада одного сотрудника.

Число сотрудников, человек
до 3 19
3-6 21
6-9 15
9-12 10
12 и более 5
Итого 70

В данном случае принцип решения останется точно таким же. Единственно, что поменялось в этой задаче, так это первый и последний интервалы. До 3 лет и 12 лет и более это и есть те самые открытые интервалы. Именно тут возникнет вопрос, а как же найти центральное значение интервала для таких интервалов.

Поступить в этой ситуации можно двумя способами:

  1. Предположить какой бы мог быть интервал, учитывая, что нам приведены интервалы равные, то это вполне возможно. Интервал до 3 мог бы выглядеть как 0-3, и тогда его центральное значение будет (0+3)/2 = 1,5 года. Интервал 12 и более мог бы выглядеть как 12-15, и тогда его центральное значение было бы (12+15)/2 = 13,5 года. Все оставшиеся центральные значения интервала рассчитываются аналогично. В результате получаем следующее.
Длительность производственного стажа, лет х Число сотрудников, человек f х’ x’f
до 3 19 1,5 28,5
3-6 21 4,5 94,5
6-9 15 7,5 112,5
9-12 10 10,5 105,0
12 и более 5 13,5 67,5
Итого ∑f = 70 ∑ x’f = 408,0

Средняя продолжительность стажа 5,83 года.

  1. Принять за центральное значение, то данное которое имеется в интервале, без дополнительных расчетов. В нашем случае в интервале до 3 это будет 3, а в интервале 12 и более это будет 12. Такой способ больше подходит для ситуаций, когда интервалы неравные и предположить какой интервал мог бы быть сложно. Рассчитаем нашу задачу по таким данным далее.
Длительность производственного стажа, лет х Число сотрудников, человек f х’ x’f
до 3 19 3 57,0
3-6 21 4,5 94,5
6-9 15 7,5 112,5
9-12 10 10,5 105,0
12 и более 5 12 60,0
Итого ∑f = 70 ∑ x’f = 429,0

Средняя продолжительность стажа 6,13 года.

Домашнее задание

  1. Рассчитать средний размер посевной площади на одно фермерское хозяйство по следующим данным.
Размер посевной площади, га Количество фермерских хозяйств
0-20 64
20-40 58
40-60 32
60-80 21
80-100 12
Итого 187
  1. Рассчитайте средний возраст работника предприятия по следующим данным
Возраст персонала, лет Число сотрудников, человек
до 18 7
18-25 68
25-40 79
40-55 57
55 и старше 31
Итого 242

Теперь Вы умеете рассчитывать среднюю в интервальном вариационном ряду!