Ошибка выборочной средней в excel

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Стандартная ошибка среднего — это способ измерить, насколько разбросаны значения в наборе данных. Он рассчитывается как:

Стандартная ошибка = с / √n

куда:

  • s : стандартное отклонение выборки
  • n : размер выборки

Вы можете рассчитать стандартную ошибку среднего для любого набора данных в Excel, используя следующую формулу:

= СТАНДОТКЛОН (диапазон значений) / КОРЕНЬ ( СЧЁТ (диапазон значений))

В следующем примере показано, как использовать эту формулу.

Пример: Стандартная ошибка в Excel

Предположим, у нас есть следующий набор данных:

На следующем снимке экрана показано, как рассчитать стандартную ошибку среднего значения для этого набора данных:

Стандартная ошибка среднего в Excel

Стандартная ошибка оказывается равной 2,0014 .

Обратите внимание, что функция =СТАНДОТКЛОН() вычисляет выборочное среднее, что эквивалентно функции =СТАНДОТКЛОН.С() в Excel.

Таким образом, мы могли бы использовать следующую формулу для получения тех же результатов:

Стандартная ошибка среднего значения в Excel с использованием выборочного стандартного отклонения

И снова стандартная ошибка оказывается равной 2,0014 .

Как интерпретировать стандартную ошибку среднего

Стандартная ошибка среднего — это просто мера того, насколько разбросаны значения вокруг среднего. При интерпретации стандартной ошибки среднего следует помнить о двух вещах:

1. Чем больше стандартная ошибка среднего, тем более разбросаны значения вокруг среднего в наборе данных.

Чтобы проиллюстрировать это, рассмотрим, изменим ли мы последнее значение в предыдущем наборе данных на гораздо большее число:

Обратите внимание на скачок стандартной ошибки с 2,0014 до 6,9783.Это указывает на то, что значения в этом наборе данных более разбросаны вокруг среднего значения по сравнению с предыдущим набором данных.

2. По мере увеличения размера выборки стандартная ошибка среднего имеет тенденцию к уменьшению.

Чтобы проиллюстрировать это, рассмотрим стандартную ошибку среднего для следующих двух наборов данных:

Второй набор данных — это просто первый набор данных, повторенный дважды. Таким образом, два набора данных имеют одинаковое среднее значение, но второй набор данных имеет больший размер выборки, поэтому стандартная ошибка меньше.

Стандартная ошибка или, как часто называют, ошибка средней арифметической, является одним из важных статистических показателей. С помощью данного показателя можно определить неоднородность выборки. Он также довольно важен при прогнозировании. Давайте узнаем, какими способами можно рассчитать величину стандартной ошибки с помощью инструментов Microsoft Excel.

Расчет ошибки средней арифметической

Одним из показателей, которые характеризуют цельность и однородность выборки, является стандартная ошибка. Эта величина представляет собой корень квадратный из дисперсии. Сама дисперсия является средним квадратном от средней арифметической. Средняя арифметическая вычисляется делением суммарной величины объектов выборки на их общее количество.

В Экселе существуют два способа вычисления стандартной ошибки: используя набор функций и при помощи инструментов Пакета анализа. Давайте подробно рассмотрим каждый из этих вариантов.

Способ 1: расчет с помощью комбинации функций

Прежде всего, давайте составим алгоритм действий на конкретном примере по расчету ошибки средней арифметической, используя для этих целей комбинацию функций. Для выполнения задачи нам понадобятся операторы СТАНДОТКЛОН.В, КОРЕНЬ и СЧЁТ.

Для примера нами будет использована выборка из двенадцати чисел, представленных в таблице.

  1. Выделяем ячейку, в которой будет выводиться итоговое значение стандартной ошибки, и клацаем по иконке «Вставить функцию».

Открывается Мастер функций. Производим перемещение в блок «Статистические». В представленном перечне наименований выбираем название «СТАНДОТКЛОН.В».

Запускается окно аргументов вышеуказанного оператора. СТАНДОТКЛОН.В предназначен для оценивания стандартного отклонения при выборке. Данный оператор имеет следующий синтаксис:

«Число1» и последующие аргументы являются числовыми значениями или ссылками на ячейки и диапазоны листа, в которых они расположены. Всего может насчитываться до 255 аргументов этого типа. Обязательным является только первый аргумент.

Итак, устанавливаем курсор в поле «Число1». Далее, обязательно произведя зажим левой кнопки мыши, выделяем курсором весь диапазон выборки на листе. Координаты данного массива тут же отображаются в поле окна. После этого клацаем по кнопке «OK».

В ячейку на листе выводится результат расчета оператора СТАНДОТКЛОН.В. Но это ещё не ошибка средней арифметической. Для того, чтобы получить искомое значение, нужно стандартное отклонение разделить на квадратный корень от количества элементов выборки. Для того, чтобы продолжить вычисления, выделяем ячейку, содержащую функцию СТАНДОТКЛОН.В. После этого устанавливаем курсор в строку формул и дописываем после уже существующего выражения знак деления (/). Вслед за этим клацаем по пиктограмме перевернутого вниз углом треугольника, которая располагается слева от строки формул. Открывается список недавно использованных функций. Если вы в нем найдете наименование оператора «КОРЕНЬ», то переходите по данному наименованию. В обратном случае жмите по пункту «Другие функции…».

Снова происходит запуск Мастера функций. На этот раз нам следует посетить категорию «Математические». В представленном перечне выделяем название «КОРЕНЬ» и жмем на кнопку «OK».

Открывается окно аргументов функции КОРЕНЬ. Единственной задачей данного оператора является вычисление квадратного корня из заданного числа. Его синтаксис предельно простой:

Как видим, функция имеет всего один аргумент «Число». Он может быть представлен числовым значением, ссылкой на ячейку, в которой оно содержится или другой функцией, вычисляющей это число. Последний вариант как раз и будет представлен в нашем примере.

Устанавливаем курсор в поле «Число» и кликаем по знакомому нам треугольнику, который вызывает список последних использованных функций. Ищем в нем наименование «СЧЁТ». Если находим, то кликаем по нему. В обратном случае, опять же, переходим по наименованию «Другие функции…».

В раскрывшемся окне Мастера функций производим перемещение в группу «Статистические». Там выделяем наименование «СЧЁТ» и выполняем клик по кнопке «OK».

Запускается окно аргументов функции СЧЁТ. Указанный оператор предназначен для вычисления количества ячеек, которые заполнены числовыми значениями. В нашем случае он будет подсчитывать количество элементов выборки и сообщать результат «материнскому» оператору КОРЕНЬ. Синтаксис функции следующий:

В качестве аргументов «Значение», которых может насчитываться до 255 штук, выступают ссылки на диапазоны ячеек. Ставим курсор в поле «Значение1», зажимаем левую кнопку мыши и выделяем весь диапазон выборки. После того, как его координаты отобразились в поле, жмем на кнопку «OK».

После выполнения последнего действия будет не только рассчитано количество ячеек заполненных числами, но и вычислена ошибка средней арифметической, так как это был последний штрих в работе над данной формулой. Величина стандартной ошибки выведена в ту ячейку, где размещена сложная формула, общий вид которой в нашем случае следующий:

Результат вычисления ошибки средней арифметической составил 0,505793. Запомним это число и сравним с тем, которое получим при решении поставленной задачи следующим способом.

Но дело в том, что для малых выборок (до 30 единиц) для большей точности лучше применять немного измененную формулу. В ней величина стандартного отклонения делится не на квадратный корень от количества элементов выборки, а на квадратный корень от количества элементов выборки минус один. Таким образом, с учетом нюансов малой выборки наша формула приобретет следующий вид:

Способ 2: применение инструмента «Описательная статистика»

Вторым вариантом, с помощью которого можно вычислить стандартную ошибку в Экселе, является применение инструмента «Описательная статистика», входящего в набор инструментов «Анализ данных» («Пакет анализа»). «Описательная статистика» проводит комплексный анализ выборки по различным критериям. Одним из них как раз и является нахождение ошибки средней арифметической.

Но чтобы воспользоваться данной возможностью, нужно сразу активировать «Пакет анализа», так как по умолчанию в Экселе он отключен.

    После того, как открыт документ с выборкой, переходим во вкладку «Файл».

Далее, воспользовавшись левым вертикальным меню, перемещаемся через его пункт в раздел «Параметры».

Запускается окно параметров Эксель. В левой части данного окна размещено меню, через которое перемещаемся в подраздел «Надстройки».

В самой нижней части появившегося окна расположено поле «Управление». Выставляем в нем параметр «Надстройки Excel» и жмем на кнопку «Перейти…» справа от него.

Запускается окно надстроек с перечнем доступных скриптов. Отмечаем галочкой наименование «Пакет анализа» и щелкаем по кнопке «OK» в правой части окошка.

После выполнения последнего действия на ленте появится новая группа инструментов, которая имеет наименование «Анализ». Чтобы перейти к ней, щелкаем по названию вкладки «Данные».

После перехода жмем на кнопку «Анализ данных» в блоке инструментов «Анализ», который расположен в самом конце ленты.

Запускается окошко выбора инструмента анализа. Выделяем наименование «Описательная статистика» и жмем на кнопку «OK» справа.

Запускается окно настроек инструмента комплексного статистического анализа «Описательная статистика».

В поле «Входной интервал» необходимо указать диапазон ячеек таблицы, в которых находится анализируемая выборка. Вручную это делать неудобно, хотя и можно, поэтому ставим курсор в указанное поле и при зажатой левой кнопке мыши выделяем соответствующий массив данных на листе. Его координаты тут же отобразятся в поле окна.

В блоке «Группирование» оставляем настройки по умолчанию. То есть, переключатель должен стоять около пункта «По столбцам». Если это не так, то его следует переставить.

Галочку «Метки в первой строке» можно не устанавливать. Для решения нашего вопроса это не важно.

Далее переходим к блоку настроек «Параметры вывода». Здесь следует указать, куда именно будет выводиться результат расчета инструмента «Описательная статистика»:

  • На новый лист;
  • В новую книгу (другой файл);
  • В указанный диапазон текущего листа.

Давайте выберем последний из этих вариантов. Для этого переставляем переключатель в позицию «Выходной интервал» и устанавливаем курсор в поле напротив данного параметра. После этого клацаем на листе по ячейке, которая станет верхним левым элементом массива вывода данных. Её координаты должны отобразиться в поле, в котором мы до этого устанавливали курсор.

Далее следует блок настроек определяющий, какие именно данные нужно вводить:

  • Итоговая статистика;
  • К-ый наибольший;
  • К-ый наименьший;
  • Уровень надежности.

Для определения стандартной ошибки обязательно нужно установить галочку около параметра «Итоговая статистика». Напротив остальных пунктов выставляем галочки на свое усмотрение. На решение нашей основной задачи это никак не повлияет.

После того, как все настройки в окне «Описательная статистика» установлены, щелкаем по кнопке «OK» в его правой части.

  • После этого инструмент «Описательная статистика» выводит результаты обработки выборки на текущий лист. Как видим, это довольно много разноплановых статистических показателей, но среди них есть и нужный нам – «Стандартная ошибка». Он равен числу 0,505793. Это в точности тот же результат, который мы достигли путем применения сложной формулы при описании предыдущего способа.
  • Как видим, в Экселе можно произвести расчет стандартной ошибки двумя способами: применив набор функций и воспользовавшись инструментом пакета анализа «Описательная статистика». Итоговый результат будет абсолютно одинаковый. Поэтому выбор метода зависит от удобства пользователя и поставленной конкретной задачи. Например, если ошибка средней арифметической является только одним из многих статистических показателей выборки, которые нужно рассчитать, то удобнее воспользоваться инструментом «Описательная статистика». Но если вам нужно вычислить исключительно этот показатель, то во избежание нагромождения лишних данных лучше прибегнуть к сложной формуле. В этом случае результат расчета уместится в одной ячейке листа.

    Отблагодарите автора, поделитесь статьей в социальных сетях.

    Расчет с помощью комбинаций функций

    На примере рассмотрим составленный алгоритм действий по расчету ошибки средней арифметической с использованием комбинаций функций. Для того чтобы выполнить задачу, нужно использовать операторы СТАНДОТКЛОН.В, КОРЕНЬ и СЧЁТ. Выборка будет использоваться из 12 чисел, которые представлены в таблице.

    Выделите ячейку, в которой отобразится итоговое значение стандартной ошибки. Кликаете на иконку «Вставить функцию».

    Появится Мастер функций, в котором нужно произвести перемещение в блок «Статистические». Появится список наименований, выбираете «СТАНДОТКЛОН.В».

    Запустится окно аргументов выбранного оператора, предназначенного для оценивания стандартного отклонения при выборке. У него такой синтаксис — =СТАНДОТКЛОН.В(число1;число2;…). Устанавливаете курсор в полу «Число1». Далее, зажав левую кнопку мыши, выделяете курсором весь диапазон выборки, чтобы координаты этого массива отобразились там же в поле окна. Кликаете на ОК.

    В ячейке появится проделанный результат, но это еще не то, что мы хотим получить в итоге. Теперь нужно стандартное отклонение разделить на квадратный корень от числа элементов выборки. Выделяете ячейку с нужной функцией и устанавливаете курсор мышки в строку формул. Дописываете выражение, которое там уже существует, знаком деления (/). Далее нажимаете на пиктограмму перевернутого вниз углом треугольника (находится слева от строки формул). Должен открыться список недавно использованных функций. Находите оператора «КОРЕНЬ» и нажимаете на него. Если его нет в списке, то кликайте на «Другие функции…».

    Должен снова запуститься Мастер функций, в котором нужно перейти в категорию «Математические». Выделяете там «КОРЕНЬ» и кликаете ОК.

    Далее должно открыться окно аргументов функции КОРЕНЬ. Его синтаксис простой — =КОРЕНЬ(число). Устанавливаете курсор в поле «Число» и нажимаете на уже знакомый треугольник, чтобы показался список последних использованных функций. Находите «СЧЕТ» и нажимаете на него. Если в списке его нет, тогда нажимаете на «Другие функции…».

    Появится раскрывшееся окно Мастера функций, в котором нужно переместиться в группу «Статистические». В ней выделяете «СЧЕТ» и кликаете ОК.

    Должно запуститься окно аргументов функции СЧЕТ. Синтаксис функции будет таким — =СЧЁТ(значение1;значение2;…). Ставите курсор в строку «Значение1» и зажимаете левую кнопку мыши, чтобы выделить весь диапазон выборки. Когда координаты отобразятся, жмите ОК.

    Когда будет выполнено последнее действие, то не только произведется расчет количества ячеек, которые заполнены числами, но и вычисляется ошибка средней арифметической. Величина будет выведена в ячейку с размещенной сложной формулой, вид которой таков — =СТАНДОТКЛОН.В(B2:B13)/КОРЕНЬ(СЧЁТ(B2:B13)).

    Если выборка до 30 единиц, тогда лучше применять немного другую формулу — =СТАНДОТКЛОН.В(B2:B13)/КОРЕНЬ(СЧЁТ(B2:B13)-1).

    Применение инструмента «Описательная статистика»

    Когда будет открыт документ с выборкой, нужно перейти во вкладку «Файл».

    В левом вертикальном меню заходите в раздел «Параметры».

    Должно запуститься окно параметров Excel, в левой части которого нужно перейти в «Надстройки».

    В самом низу окна находите «Управление» в выставляете в нем параметр «Надстройки Excel». Кликаете на «Перейти…» справа от него.

    В окне надстроек появится список скриптов, которые доступны и нужно отметить галочкой «Пакет анализа», а затем нажать ОК.

    Теперь на странице должна появиться новая группа инструментов «Анализ». Для перехода к ней кликаете на вкладку «Данные».

    Кликаете на «Анализ данных» в блоке инструментов «Анализ» в самом конце.

    Запустится окно выбора инструмента анализа, в котором необходимо выделить «Описательная статистика» и нажать справа на ОК.

    Далее запустится окно настроек инструмента комплексного статистического анализа «Описательная статистика». Здесь нужно установить все так, в зависимости от того, что именно вы хотите получить в итоге.

    После всех совершенных манипуляций, инструмент «Описательная статистика» должен отобразить результаты обработки выборки на текущем листе. Разноплановых статистических показателей будет немало, но среди них находится и тот, который нам нужен – «Стандартная ошибка».

    Среднее арифметическое, как известно, используется для получения обобщающей характеристики некоторого набора данных. Если данные более-менее однородны и в них нет аномальных наблюдений (выбросов), то среднее хорошо обобщает данные, сведя к минимуму влияние случайных факторов (они взаимопогашаются при сложении).

    Когда анализируемые данные представляют собой выборку (которая состоит из случайных значений), то среднее арифметическое часто (но не всегда) выступает в роли приближенной оценки математического ожидания. Почему приближенной? Потому что среднее арифметическое – это величина, которая зависит от набора случайных чисел, и, следовательно, сама является случайной величиной. При повторных экспериментах (даже в одних и тех же условиях) средние будут отличаться друг от друга.

    Для того, чтобы на основе статистического анализа данных делать корректные выводы, необходимо оценить возможный разброс полученного результата. Для этого рассчитываются различные показатели вариации. Но то исходные данные. И как мы только что установили, среднее арифметическое также обладает разбросом, который необходимо оценить и учитывать в дальнейшем (в выводах, в выборе метода анализа и т.д.).

    Интуитивно понятно, что разброс средней должен быть как-то связан с разбросом исходных данных. Основной характеристикой разброса средней выступает та же дисперсия.

    Дисперсия выборочных данных – это средний квадрат отклонения от средней, и рассчитать ее по исходным данным не составляет труда, например, в Excel предусмотрены специальные функции. Однако, как же рассчитать дисперсию средней, если в распоряжении есть только одна выборка и одно среднее арифметическое?

    Расчет дисперсии и стандартной ошибки средней арифметической

    Чтобы получить дисперсию средней арифметической нет необходимости проводить множество экспериментов, достаточно иметь только одну выборку. Это легко доказать. Для начала вспомним, что средняя арифметическая (простая) рассчитывается по формуле:

    где xi – значения переменной,
    n – количество значений.

    Теперь учтем два свойства дисперсии, согласно которым, 1) — постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат и 2) — дисперсия суммы независимых случайных величин равняется сумме соответствующих дисперсий. Предполагается, что каждое случайное значение xi обладает одинаковым разбросом, поэтому несложно вывести формулу дисперсии средней арифметической:

    Используя более привычные обозначения, формулу записывают как:

    где σ 2 – это дисперсия, случайной величины, причем генеральная.

    На практике же, генеральная дисперсия известна далеко не всегда, точнее совсем редко, поэтому в качестве оной используют выборочную дисперсию:

    Стандартное отклонение средней арифметической называется стандартной ошибкой средней и рассчитывается, как квадратный корень из дисперсии.

    Формула стандартной ошибки средней при использовании генеральной дисперсии

    Формула стандартной ошибки средней при использовании выборочной дисперсии

    Последняя формула на практике используется чаще всего, т.к. генеральная дисперсия обычно не известна. Чтобы не вводить новые обозначения, стандартную ошибку средней обычно записывают в виде соотношения стандартного отклонения выборки и корня объема выборки.

    Назначение и свойство стандартной ошибки средней арифметической

    Стандартная ошибка средней много, где используется. И очень полезно понимать ее свойства. Посмотрим еще раз на формулу стандартной ошибки средней:

    Числитель – это стандартное отклонение выборки и здесь все понятно. Чем больше разброс данных, тем больше стандартная ошибка средней – прямо пропорциональная зависимость.

    Посмотрим на знаменатель. Здесь находится квадратный корень из объема выборки. Соответственно, чем больше объем выборки, тем меньше стандартная ошибка средней. Для наглядности изобразим на одной диаграмме график нормально распределенной переменной со средней равной 10, сигмой – 3, и второй график – распределение средней арифметической этой же переменной, полученной по 16-ти наблюдениям (которое также будет нормальным).

    Судя по формуле, разброс стандартной ошибки средней должен быть в 4 раза (корень из 16) меньше, чем разброс исходных данных, что и видно на рисунке выше. Чем больше наблюдений, тем меньше разброс средней.

    Казалось бы, что для получения наиболее точной средней достаточно использовать максимально большую выборку и тогда стандартная ошибка средней будет стремиться к нулю, а сама средняя, соответственно, к математическому ожиданию. Однако квадратный корень объема выборки в знаменателе говорит о том, что связь между точностью выборочной средней и размером выборки не является линейной. Например, увеличение выборки с 20-ти до 50-ти наблюдений, то есть на 30 значений или в 2,5 раза, уменьшает стандартную ошибку средней только на 36%, а со 100-а до 130-ти наблюдений (на те же 30 значений), снижает разброс данных лишь на 12%.

    Лучше всего изобразить эту мысль в виде графика зависимости стандартной ошибки средней от размера выборки. Пусть стандартное отклонение равно 10 (на форму графика это не влияет).

    Видно, что примерно после 50-ти значений, уменьшение стандартной ошибки средней резко замедляется, после 100-а – наклон постепенно становится почти нулевым.

    Таким образом, при достижении некоторого размера выборки ее дальнейшее увеличение уже почти не сказывается на точности средней. Этот факт имеет далеко идущие последствия. Например, при проведении выборочного обследования населения (опроса) чрезмерное увеличение выборки ведет к неоправданным затратам, т.к. точность почти не меняется. Именно поэтому количество опрошенных редко превышает 1,5 тысячи человек. Точность при таком размере выборки часто является достаточной, а дальнейшее увеличение выборки – нецелесообразным.

    Подведем итог. Расчет дисперсии и стандартной ошибки средней имеет довольно простую формулу и обладает полезным свойством, связанным с тем, что относительно хорошая точность средней достигается уже при 100 наблюдениях (в этом случае стандартная ошибка средней становится в 10 раз меньше, чем стандартное отклонение выборки). Больше, конечно, лучше, но бесконечно увеличивать объем выборки не имеет практического смысла. Хотя, все зависит от поставленных задач и цены ошибки. В некоторых опросах участие принимают десятки тысяч людей.

    Дисперсия и стандартная ошибка средней имеют большое практическое значение. Они используются в проверке гипотез и расчете доверительных интервалов.

    Среднее арифметическое, как известно, используется для получения обобщающей характеристики некоторого набора данных. Если данные более-менее однородны и в них нет аномальных наблюдений (выбросов), то среднее хорошо обобщает данные, сведя к минимуму влияние случайных факторов (они взаимопогашаются при сложении).

    Когда анализируемые данные представляют собой выборку (которая состоит из случайных значений), то среднее арифметическое часто (но не всегда) выступает в роли приближенной оценки математического ожидания. Почему приближенной? Потому что среднее арифметическое – это величина, которая зависит от набора случайных чисел, и, следовательно, сама является случайной величиной. При повторных экспериментах (даже в одних и тех же условиях) средние будут отличаться друг от друга.

    Для того, чтобы на основе статистического анализа данных делать корректные выводы, необходимо оценить возможный разброс полученного результата. Для этого рассчитываются различные показатели вариации. Но то исходные данные. И как мы только что установили, среднее арифметическое также обладает разбросом, который необходимо оценить и учитывать в дальнейшем (в выводах, в выборе метода анализа и т.д.).

    Интуитивно понятно, что разброс средней должен быть как-то связан с разбросом исходных данных. Основной характеристикой разброса средней выступает та же дисперсия.

    Дисперсия выборочных данных – это средний квадрат отклонения от средней, и рассчитать ее по исходным данным не составляет труда, например, в Excel предусмотрены специальные функции. Однако, как же рассчитать дисперсию средней, если в распоряжении есть только одна выборка и одно среднее арифметическое?

    Расчет дисперсии и стандартной ошибки средней арифметической

    Чтобы получить дисперсию средней арифметической нет необходимости проводить множество экспериментов, достаточно иметь только одну выборку. Это легко доказать. Для начала вспомним, что средняя арифметическая (простая) рассчитывается по формуле:

    формула средней арифметической

    где xi – значения переменной,
    n – количество значений.

    Теперь учтем два свойства дисперсии, согласно которым, 1) — постоянный множитель можно вынести за знак дисперсии, возведя его в квадрат и 2) — дисперсия суммы независимых случайных величин равняется сумме соответствующих дисперсий. Предполагается, что каждое случайное значение xi обладает одинаковым разбросом, поэтому несложно вывести формулу дисперсии средней арифметической:

    Формула дисперсии средней арифметической

    Используя более привычные обозначения, формулу записывают как:

    Дисперсия средней арифметической

    где σ2 – это дисперсия, случайной величины, причем генеральная.

    На практике же, генеральная дисперсия известна далеко не всегда, точнее совсем редко, поэтому в качестве оной используют выборочную дисперсию:

    Дисперсия средней арифметической по выборке

    Стандартное отклонение средней арифметической называется стандартной ошибкой средней и рассчитывается, как квадратный корень из дисперсии.

    Формула стандартной ошибки средней при использовании генеральной дисперсии

    Стандартная ошибка средней

    Формула стандартной ошибки средней при использовании выборочной дисперсии

    Стандартная ошибка средней по выборке

    Последняя формула на практике используется чаще всего, т.к. генеральная дисперсия обычно не известна. Чтобы не вводить новые обозначения, стандартную ошибку средней обычно записывают в виде соотношения стандартного отклонения выборки и корня объема выборки.

    Назначение и свойство стандартной ошибки средней арифметической

    Стандартная ошибка средней много, где используется. И очень полезно понимать ее свойства. Посмотрим еще раз на формулу стандартной ошибки средней:

    Стандартная ошибка выборочной средней

    Числитель – это стандартное отклонение выборки и здесь все понятно. Чем больше разброс данных, тем больше стандартная ошибка средней – прямо пропорциональная зависимость.

    Посмотрим на знаменатель. Здесь находится квадратный корень из объема выборки. Соответственно, чем больше объем выборки, тем меньше стандартная ошибка средней. Для наглядности изобразим на одной диаграмме график нормально распределенной переменной со средней равной 10, сигмой – 3, и второй график – распределение средней арифметической этой же переменной, полученной по 16-ти наблюдениям (которое также будет нормальным).

    Зависимость стандартной ошибки средней от объем выборки

    Судя по формуле, разброс стандартной ошибки средней должен быть в 4 раза (корень из 16) меньше, чем разброс исходных данных, что и видно на рисунке выше. Чем больше наблюдений, тем меньше разброс средней.

    Казалось бы, что для получения наиболее точной средней достаточно использовать максимально большую выборку и тогда стандартная ошибка средней будет стремиться к нулю, а сама средняя, соответственно, к математическому ожиданию. Однако квадратный корень объема выборки в знаменателе говорит о том, что связь между точностью выборочной средней и размером выборки не является линейной. Например, увеличение выборки с 20-ти до 50-ти наблюдений, то есть на 30 значений или в 2,5 раза, уменьшает стандартную ошибку средней только на 36%, а со 100-а до 130-ти наблюдений (на те же 30 значений), снижает разброс данных лишь на 12%.

    Лучше всего изобразить эту мысль в виде графика зависимости стандартной ошибки средней от размера выборки. Пусть стандартное отклонение равно 10 (на форму графика это не влияет).

    Распределение исходных данных и средней

    Видно, что примерно после 50-ти значений, уменьшение стандартной ошибки средней резко замедляется, после 100-а – наклон постепенно становится почти нулевым.

    Таким образом, при достижении некоторого размера выборки ее дальнейшее увеличение уже почти не сказывается на точности средней. Этот факт имеет далеко идущие последствия. Например, при проведении выборочного обследования населения (опроса) чрезмерное увеличение выборки ведет к неоправданным затратам, т.к. точность почти не меняется. Именно поэтому количество опрошенных редко превышает 1,5 тысячи человек. Точность при таком размере выборки часто является достаточной, а дальнейшее увеличение выборки – нецелесообразным.

    Подведем итог. Расчет дисперсии и стандартной ошибки средней имеет довольно простую формулу и обладает полезным свойством, связанным с тем, что относительно хорошая точность средней достигается уже при 100 наблюдениях (в этом случае стандартная ошибка средней становится в 10 раз меньше, чем стандартное отклонение выборки). Больше, конечно, лучше, но бесконечно увеличивать объем выборки не имеет практического смысла. Хотя, все зависит от поставленных задач и цены ошибки. В некоторых опросах участие принимают десятки тысяч людей.

    Дисперсия и стандартная ошибка средней имеют большое практическое значение. Они используются в проверке гипотез и расчете доверительных интервалов.

    Поделиться в социальных сетях:


    Загрузить PDF


    Загрузить PDF

    В этой статье мы расскажем вам, как в Excel вычислить стандартную ошибку среднего. Для этого стандартное отклонение (σ) нужно разделить на квадратный корень (√) из размера выборки (N).

    Шаги

    1. Изображение с названием Calculate Standard Error of the Mean in Excel Step 1

      1

      Запустите Excel. Нажмите на значок в виде белой буквы «Х» на зеленом фоне.

    2. Изображение с названием Calculate Standard Error of the Mean in Excel Step 2

      2

      Откройте или создайте таблицу Excel. Чтобы открыть готовую таблицу с данными, нажмите «Открыть» на левой панели. Чтобы создать таблицу, нажмите «Создать» и введите данные.

    3. Изображение с названием Calculate Standard Error of the Mean in Excel Step 3

      3

      Вычислите стандартное отклонение. Чтобы сделать это, нужно выполнить несколько действий, но в Excel можно просто ввести следующую формулу: =СТАНДОТКЛОН.В(''диапазон ячеек'').

      • Например, если данные находятся в ячейках с A1 по A20, в пустой ячейке введите =СТАНДОТКЛОН.В(A1:A20), чтобы вычислить стандартное отклонение.
    4. Изображение с названием Calculate Standard Error of the Mean in Excel Step 4

      4

      Введите формулу для вычисления стандартной ошибки среднего в пустой ячейке. Формула выглядит так:=СТАНДОТКЛОН.В(''диапазон ячеек'')/КОРЕНЬ(СЧЁТ("диапазон ячеек")).

      • Например, если данные находятся в ячейках с A1 по A20, в пустой ячейке введите формулу =СТАНДОТКЛОН.В(A1:A20)/КОРЕНЬ(СЧЁТ(A1:A20)). Так вы вычислите стандартную ошибку среднего.

      Реклама

    Об этой статье

    Эту страницу просматривали 33 679 раз.

    Была ли эта статья полезной?

    Использование математических функций в Microsoft Excel может упростить быстрое и точное выполнение сложных математических вычислений. Научившись вычислять стандартную ошибку в Excel, вы получите точные результаты стандартной ошибки в наборе данных. Автоматический расчет может снизить риск возможных ошибок, а также сэкономить ваше время. В этой статье мы обсудим, что такое расчет стандартной ошибки, почему он важен и как его выполнить в Excel, включая советы по более эффективному выполнению этого расчета.

    Что такое расчет стандартной ошибки?

    Расчет стандартной ошибки говорит вам, насколько среднее значение выборочного набора данных может отличаться от общего среднего значения данных, которые вы оцениваете. Например, компания, изучающая рейтинги удовлетворенности клиентов среди населения, может попытаться сделать это, собрав рейтинги у части своих клиентов. Расчет стандартной ошибки позволяет компании определить, будет ли информация, которую они собирают с помощью этой выборки, близка к общему мнению их клиентов в зависимости от размера выборки.

    Почему важен расчет стандартной ошибки?

    Стандартная ошибка может быть ценным расчетом при использовании выборочных наборов данных, поскольку она позволяет оценить их надежность. По мере увеличения числа выборок, включенных в расчет стандартного отклонения, размер стандартной ошибки уменьшается. Это указывает на то, что вы можете в большей степени доверять точности выборки, поскольку она относится к генеральной совокупности, поскольку вы включили больший размер выборки.

    Выполните следующие действия, чтобы создать в Excel формулу, вычисляющую стандартную ошибку для набора данных:

    1. Введите свои данные

    Чтобы использовать Microsoft Excel для выполнения расчетов, вы должны сначала предоставить все необходимые данные. Введите каждую точку данных в отдельную ячейку. Хотя вам не нужно группировать все данные вместе, это может упростить создание формул позже в процессе, если вы это сделаете. Расположение данных в виде вертикальной линии, горизонтальной линии или прямоугольного расположения позволяет включать все данные в формулы с использованием простых обозначений вместо того, чтобы выбирать каждую ячейку по отдельности.

    В этом примере компания использует Microsoft Excel для отслеживания ежедневных продаж в течение пяти рабочих дней, чтобы найти стандартную ошибку в течение недели.

    АВ1

    257
    345
    468
    557
    646

    2. Создайте ярлыки

    Использование меток в документе Microsoft Excel может упростить идентификацию информации на листе. Это не только облегчает понимание листа при просмотре результатов ваших расчетов, но также упрощает правильный ввод формул и позволяет избежать ошибок. Помечая различные ячейки, в которые вы вводите ключевую информацию, вы получаете руководство по выбору ячеек для включения в формулы.

    Для расчета стандартной ошибки, в дополнение к маркировке данных, вы можете включить метки для стандартного отклонения, количество оцениваемых элементов и стандартную ошибку.

    AB1Продажи за день**Стандартное отклонение257
    345Суточный подсчет468
    557Стандартная ошибка**646

    3. Рассчитайте стандартное отклонение

    Стандартное отклонение — одна из двух важных переменных при расчете стандартной ошибки набора данных. Microsoft Excel упрощает вычисление стандартного отклонения, автоматически обрабатывая все математические уравнения с помощью функции «СТАНДОТКЛОН()». Щелкните ячейку, которую вы хотите использовать для сохранения значения стандартного отклонения, и введите «=**СТАНДОТКЛОН([Cell 1]:[Cell 2])», где ячейка 1 — это первая ячейка данных в введенном вами наборе, а ячейка 2 — последняя ячейка данных. Excel автоматически включает данные для всех ячеек между двумя введенными вами ячейками при расчете стандартного отклонения.

    В этом примере пользователь вводит «= СТАНДОТКЛОН (A2: A6)» в ячейку под меткой стандартного отклонения. Excel не отображает эту формулу на листе. Вместо этого он вычисляет значение стандартного отклонения и отображает результат. Для этого шага и последующих шагов курсивом показана формула, которую вводит пользователь, а текст без курсива показывает, как ячейки отображаются в электронной таблице.

    AB1Дневной объем продаж**Стандартное отклонение257=СТАНДОТКЛОН(A2:A6)345Дневной подсчет468
    557Стандартная ошибка646
    Связанный: [What Is Standard Deviation? How It Works and Other FAQs**](https://buom.ru/career-advice/career-development/how-do-you-find-standard-deviation)

    4. Считайте свои вещи

    Второй важной переменной при расчете стандартной ошибки является общее количество элементов, включенных в расчет стандартного отклонения. Как и в случае со стандартным отклонением, в Excel есть функция, позволяющая автоматически генерировать значение этой переменной. Нажмите на ячейку, которую вы хотите использовать для хранения значения вашего счетчика, и введите «=COUNT([Cell 1]:[Cell 2])», где ячейка 1 — это первая ячейка данных в введенном вами наборе, а ячейка 2 — последняя ячейка данных.

    В примере пользователь вводит «=COUNT(A2:A6)» в ячейку под меткой ежедневного подсчета. Как и при расчете стандартного отклонения, хотя формула отображается на панели в верхней части экрана, как только пользователь нажимает клавишу ввода, на самом листе отображается значение счетчика вместо формулы.

    AB1Продажи за день**Стандартное отклонение2579,449867345Подсчет за день468=СЧЁТ(A2:A6)557Стандартная ошибка646
    Связанный: [Basic Excel Formulas and How To Use Them**](https://buom.ru/career-advice/career-development/excel-formulas)

    5. Рассчитайте стандартную ошибку

    Теперь, когда вы вычислили обе переменные, вы можете использовать последнюю функцию Microsoft Excel, чтобы легко вычислить стандартную ошибку для вашего набора данных. Нажмите на ячейку, в которой вы хотите сохранить значение стандартной ошибки, и введите «=[Standard deviation result cell]/SQRT([Count result cell])» в качестве формулы. Разделив стандартное отклонение на квадратный корень из числа элементов в расчете отклонения, вы получите стандартную ошибку, которую Excel вычислит автоматически.

    В этом примере пользователь вводит «=B2/SQRT(B4)» в ячейку под меткой стандартной ошибки. Если пользователь обнаружит ошибку в исходном наборе данных или захочет обновить набор данных с помощью новых чисел недели, он может изменить значения в ячейках набора данных, и все остальные значения обновятся автоматически.

    AB1Продажи за день**Стандартное отклонение2579,449867345Подсчет за день4685557Стандартная ошибка*646=B2/SQRT(B4)*## Советы по расчету стандартной ошибки в Excel

    Если вы используете Microsoft Excel для расчета стандартной ошибки, помните об этих советах:

    • Сократите свои расчеты. Хотя отдельные расчеты стандартного отклонения и количества могут облегчить работу с таблицей, они не являются обязательными, и вы можете включить только одну формулу для всех своих расчетов. Для этого замените каждую отдельную ячейку в формуле стандартной ошибки формулой, которую вы ввели в эти ячейки, например «=СТАНДОТКЛОН(A2:A6)/КОРЕНЬ(СЧЁТ(A2:A6)).»

    • Спланируйте свой документ. Прежде чем создавать макет для документа электронной таблицы, найдите время, чтобы спланировать свои потребности, чтобы создать более эффективный дизайн. Понимание типа данных, которые вы собираетесь включить, в том числе количество записей и является ли ваш набор данных статическим или вы планируете добавить его в будущем, может помочь вам выбрать правильное размещение для ваших меток и вычислений.

    • Расширяйте свои диапазоны. При создании формул для вашего стандартного отклонения и подсчета вы можете расширить диапазоны за пределы вашей конечной точки данных, если вы собираетесь добавить статистику в будущем. Функции, используемые для расчета стандартного отклонения и подсчета, игнорируют пустые ячейки, что означает, что вы можете расширить свои диапазоны за пределы вашей конечной точки и получить правильные результаты сейчас, а также позволяет вам добавлять дополнительные точки в будущем, и Excel вычисляет их без необходимости обновлять ваш формулы.

    Обратите внимание, что ни одна из компаний, упомянутых в этой статье, не связана с компанией Indeed.

    Возможно, вам также будет интересно:

  • Ошибка выборки расчет ошибки выборки
  • Ошибка вывода средств с мелбет
  • Ошибка выборочной средней абсолютная и относительная
  • Ошибка выборки примеры с решениями
  • Ошибка вывода на яндекс карте

  • Понравилась статья? Поделить с друзьями:
    0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии