Ошибка выборки это разность между

Определение ошибок выборки

Разность между показателями выборочной
и генеральной совокупностей называется
ошибкой выборки:



генеральное среднее;



выборочное среднее;



генеральная дисперсия;



выборочная дисперсия;

Ошибки выборки подразделяют на ошибки
регистрации и ошибки репрезентативности.

Ошибки регистрации возникают из-за
неправильных или неточных сведений.
Источником таких ошибок могут быть
непонимание вопроса, невнимательность
регистратора, пропуск или повторный
счет некоторых единиц совокупности.

Среди ошибок регистрации выделяют
систематические, т.е. обусловленные
причинами, действующими в каком-то одном
направлении и искажающие результаты
работы (округление цифр, тяготение к
полным десяткам и сотням и т.д.), и
случайные, проявляющиеся в различных
направлениях, уравновешивающих друг
друга и лишь изредка дающих заметный
суммарный итог.

Ошибки репрезентативности также могут
быть систематическими и случайными.

Изучение и измерение случайных ошибок
репрезентативности является основной
задачей выборочного метода.

При случайном и механическом отборах
средняя ошибка выборки для средней
величины определяется по формуле:



при повторном отборе;



при бесповторном отборе,



объем выборки,



объем генеральной совокупности.

На практике значение генеральных
параметров, как правило, не известно.
Поэтому их заменяют исправленными
выборочными характеристиками:

При

Формулы для расчета средней ошибки
выборочной доли имеют следующий вид:



при повтор. отборе;



при бесповторном отборе;



дисперсия доли;

Это так называемые средние или стандартные
ошибки.

Предельная ошибка выборки

представляет
собой t-кратную среднюю
ошибку.

Здесь t – коэффициент
доверия, который определяется по таблице
значений интегральной функции Лапласа
при заданной доверительной вероятности.

0,683

0,954

0,997

t

1

2

3

Зная предельную ошибку можно определить
доверительные интервалы, в которых
находятся значения генеральных
параметров.

Пример:

Для определения среднего срока пользования
краткосрочным кредитом в банке была
произведена 5% механическая выборка, в
которую попали 200 счетов. По результатам
выборки установлено, что средний срок
пользования кредитом составляет 60 дней
при среднеквадратичном отклонении 20
дней.

В 8 счетах срок пользования кредитом
превышал 6 месяцев. Необходимо с
вероятностью 0,99 определить пределы, в
которых находится срок пользования
краткосрочным кредитом банка и доля
краткосрочных кредитов со сроком
пользования более полугода.

Решение:

Среднюю ошибку выборки определяют по
формуле для бесповторного отбора.

Т.е. с вероятностью 0,99 можно утверждать,
что средний срок пользования краткосрочным
кредитом составляет от 56 до 64 дней.

По итогам выборки определим долю кредитов
со сроком пользования более полугода.

С вероятностью 0,99 можно гарантировать,
что доля кредитов банка со сроком
использования более полугода оставляет

общего числа кредитов.

Определение
оптимальной численности выборки

На
практике обычно расчет объема выборки
производят по формуле для повторного
отбора:

Если
полученный объем выборки превышает 5%
численности генеральной совокупности,
то расчеты корректируют на бесповторность:

В
данных формулах присутствуют значения
генеральной дисперсии, которые как
правило неизвестны. Для ее оценки можно
использовать:

1.
Выборочную дисперсию по данным прошлых
или пробных обследований.

2.
Дисперсию найденную из соотношения для
среднего квадратичного отклонения:

(если
все х >0 и х
min

0)

3.
Дисперсию, вычисленную из соотношения
для нормального распределения

4.
Дисперсию, определенную из соотношения
для асимметричного распределения

В
качестве оценки генеральной дисперсии
доли используют максимально возможную
дисперсию альтернативного признака:

Пример:
Определить численность выборки по
следующим данным. Для определения
средней цены говядины на 5000 рынках
города предполагается провести выборочную
регистрацию цен. Известно, что цены на
говядину колеблются от 40 до 70 руб/кг.
Сколько торговых точек необходимо
обследовать, чтобы с вероятностью 0,954
ошибка выборки при определении средней
цены не превышала 2 руб. за 1 кг.

Решение:
Предположим, что распределение цен
соответствует нормальному закону. Тогда

P(t)
= 0,954. Следовательно t
= 2.

Поскольку
доля отбора не превышает 5%, то к формуле
бемповторного отбора можно не переходить.
Т.е. для того, чтобы с вероятностью 0, 954
гарантировать, что ошибка при определении
функцией цены говядины не превысит 2
руб/кг необходимо исследовать 25 торговых
точек на рынках города.

Определение:
Относительная ошибка выборки– это
отношение предельной ошибки выборки к
среднему значению признака, выраженного
в %.

Расчёт
объема выборки при заданном уровне
относительной ошибки выборки осуществляется
по формулам:


коэффициент вариации

Пример:
В городе зарегистрировано 30000 безработных.
Для определения средней продолжительности
безработицы организуется выборочное
обследование. По данным прошлых лет
известно, что коэффициент вариации
объема продолжительности безработицы
составляет 40%. Какое число безработных
необходимо охватить выборочным
наблюдением, чтобы с вероятностью 0,997
утверждать, что полученным предельная
ошибка выборки не превышает 5% средней
продолжительности безработицы.

Решение:
P(t)
= 0,997. Следовательно t
= 3.

Объем выборки всегда округляют в большую
сторону.

Ответ: 566.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #
  • #

From Wikipedia, the free encyclopedia

In statistics, sampling errors are incurred when the statistical characteristics of a population are estimated from a subset, or sample, of that population. Since the sample does not include all members of the population, statistics of the sample (often known as estimators), such as means and quartiles, generally differ from the statistics of the entire population (known as parameters). The difference between the sample statistic and population parameter is considered the sampling error.[1] For example, if one measures the height of a thousand individuals from a population of one million, the average height of the thousand is typically not the same as the average height of all one million people in the country.

Since sampling is almost always done to estimate population parameters that are unknown, by definition exact measurement of the sampling errors will not be possible; however they can often be estimated, either by general methods such as bootstrapping, or by specific methods incorporating some assumptions (or guesses) regarding the true population distribution and parameters thereof.

Description[edit]

Sampling Error[edit]

The sampling error is the error caused by observing a sample instead of the whole population.[1] The sampling error is the difference between a sample statistic used to estimate a population parameter and the actual but unknown value of the parameter.[2]

Effective Sampling[edit]

In statistics, a truly random sample means selecting individuals from a population with an equivalent probability; in other words, picking individuals from a group without bias. Failing to do this correctly will result in a sampling bias, which can dramatically increase the sample error in a systematic way. For example, attempting to measure the average height of the entire human population of the Earth, but measuring a sample only from one country, could result in a large over- or under-estimation. In reality, obtaining an unbiased sample can be difficult as many parameters (in this example, country, age, gender, and so on) may strongly bias the estimator and it must be ensured that none of these factors play a part in the selection process.

Even in a perfectly non-biased sample, the sample error will still exist due to the remaining statistical component; consider that measuring only two or three individuals and taking the average would produce a wildly varying result each time. The likely size of the sampling error can generally be reduced by taking a larger sample.[3]

Sample Size Determination[edit]

The cost of increasing a sample size may be prohibitive in reality. Since the sample error can often be estimated beforehand as a function of the sample size, various methods of sample size determination are used to weigh the predicted accuracy of an estimator against the predicted cost of taking a larger sample.

Bootstrapping and Standard Error[edit]

As discussed, a sample statistic, such as an average or percentage, will generally be subject to sample-to-sample variation.[1] By comparing many samples, or splitting a larger sample up into smaller ones (potentially with overlap), the spread of the resulting sample statistics can be used to estimate the standard error on the sample.

In Genetics[edit]

The term «sampling error» has also been used in a related but fundamentally different sense in the field of genetics; for example in the bottleneck effect or founder effect, when natural disasters or migrations dramatically reduce the size of a population, resulting in a smaller population that may or may not fairly represent the original one. This is a source of genetic drift, as certain alleles become more or less common), and has been referred to as «sampling error»,[4] despite not being an «error» in the statistical sense.

See also[edit]

  • Margin of error
  • Propagation of uncertainty
  • Ratio estimator
  • Sampling (statistics)

References[edit]

  1. ^ a b c Sarndal, Swenson, and Wretman (1992), Model Assisted Survey Sampling, Springer-Verlag, ISBN 0-387-40620-4
  2. ^ Burns, N.; Grove, S. K. (2009). The Practice of Nursing Research: Appraisal, Synthesis, and Generation of Evidence (6th ed.). St. Louis, MO: Saunders Elsevier. ISBN 978-1-4557-0736-2.
  3. ^ Scheuren, Fritz (2005). «What is a Margin of Error?». What is a Survey? (PDF). Washington, D.C.: American Statistical Association. Archived from the original (PDF) on 2013-03-12. Retrieved 2008-01-08.
  4. ^ Campbell, Neil A.; Reece, Jane B. (2002). Biology. Benjamin Cummings. pp. 450–451. ISBN 0-536-68045-0.

3. Ошибки выборки

Каждая единица при выборочном наблюдении должна иметь равную с другими возможность быть отобранной – это является основой собственнослучайной выборки.

Собственнослучайная выборка – это отбор единиц из всей генеральной совокупности посредством жеребьевки или другим подобным способом.

Принципом случайности является то, что на включение или исключение объекта из выборки не может повлиять любой фактор, кроме случая.

Доля выборки – это отношение числа единиц выборочной совокупности к числу единиц генеральной совокупности:

Собственнослучайный отбор в чистом виде является исходным среди всех других видов отбора, в нем заключаются и реализуются основные принципы выборочного статистического наблюдения.

Два основных вида обобщающих показателей, которые используют в выборочном методе – это средняя величина количественного признака и относительная величина альтернативного признака.

Выборочная доля (w), или частность, определяется отношением числа единиц, обладающих изучаемым признаком m, к общему числу единиц выборочной совокупности (n):

Для характеристики надежности выборочных показателей различают среднюю и предельную ошибки выборки.

Ошибка выборки, ее еще называют ошибкой репрезентативности, представляет собой разность соответствующих выборочных и генеральных характеристик:

1) для средней количественного признака:

?х =|х – х|;

2) для доли (альтернативного признака):

?w =|х – p|.

Только выборочным наблюдениям присуща ошибка выборки

Выборочная средняя и выборочная доля – это случайные величины, принимающие различные значения в зависимости от единиц изучаемой статистической совокупности, которые попали в выборку. Соответственно ошибки выборки – тоже случайные величины и также могут принимать различные значения. Поэтому определяют среднюю из возможных ошибок – среднюю ошибку выборки.

Средняя ошибка выборки определяется объемом выборки: чем больше численность при прочих равных условиях, тем меньше величина средней ошибки выборки. Охватывая выборочным обследованием все большее количество единиц генеральной совокупности, все более точно характеризуем всю генеральную совокупность.

Средняя ошибка выборки зависит от степени варьирования изучаемого признака, в свою очередь степень варьирования характеризуется дисперсией ?2 или w(l – w) – для альтернативного признака. Чем меньше вариация признака и дисперсия, тем меньше средняя ошибка выборки, и наоборот.

При случайном повторном отборе средние ошибки теоретически рассчитывают по следующим формулам:

1) для средней количественного признака:

где ?2 – средняя величина дисперсии количественного признака.

2) для доли (альтернативного признака):

Так как дисперсия признака в генеральной совокупности ?2 точно неизвестна, на практике пользуются значением дисперсии S2 , рассчитанным для выборочной совокупности на основании закона больших чисел, согласно которому выборочная совокупность при достаточно большом объеме выборки достаточно точно воспроизводит характеристики генеральной совокупности.

Формулы средней ошибки выборки при случайном повторном отборе следующие. Для средней величины количественного признака: генеральная дисперсия выражается через выборную следующим соотношением:

где S2 – значение дисперсии.

Механическая выборка – это отбор единиц в выборочную совокупность из генеральной, которая разбита по нейтральному признаку на равные группы; производится так, что из каждой такой группы в выборку отбирается лишь одна единица.

При механическом отборе единицы изучаемой статистической совокупности предварительно располагают в определенном порядке, после чего отбирают заданное число единиц механически через определенный интервал. При этом размер интервала в генеральной совокупности равен обратному значению доли выборки.

При достаточно большой совокупности механический отбор по точности результатов близок к собственнослучайному Поэтому для определения средней ошибки механической выборки используют формулы собственнослучайной бесповторной выборки.

Для отбора единиц из неоднородной совокупности применяется так называемая типическая выборка, используется, когда все единицы генеральной совокупности можно разбить на несколько качественно однородных, однотипных групп по признакам, от которых зависят изучаемые показатели.

Затем из каждой типической группы собственнослучайной или механической выборкой производится индивидуальный отбор единиц в выборочную совокупность.

Типическая выборка обычно применяется при изучении сложных статистических совокупностей.

Типическая выборка дает более точные результаты. Типизация генеральной совокупности обеспечивает репрезентативность такой выборки, представительство в ней каждой типологической группы, что позволяет исключить влияние межгрупповой дисперсии на среднюю ошибку выборки. Поэтому при определении средней ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.

Серийная выборка предполагает случайный отбор из генеральной совокупности равновеликих групп для того, чтобы в таких группах подвергать наблюдению все без исключения единицы.

Поскольку внутри групп (серий) обследуются все без исключения единицы, средняя ошибка выборки (при отборе равновеликих серий) зависит только от межгрупповой (межсерийной) дисперсии.

Данный текст является ознакомительным фрагментом.

Читайте также

Ошибки резидента

Ошибки резидента
Относиться к ошибкам можно по-разному: можно бояться их совершить и переживать из-за каждой из них, можно радоваться своим ошибкам и кризисам, как указателям на пути к успеху и личным победам. Неизменно в ошибках только одно – за них приходится платить.

Формирование выборки

Формирование выборки
Процедура выборки является неотъемлемым этапом проекта внутреннего аудита. Она подробно описана в различных источниках, посвященных теме аудита. Однако во многом такие описания носят академичный характер. Предлагаю заострить внимание на тех

Ошибки в инвестициях – это ошибки инвесторов

Ошибки в инвестициях – это ошибки инвесторов
Сейчас я больше, чем когда бы то ни было, убежден в том, что все ошибки в инвестициях на самом деле ошибки инвесторов.Инвестиции не совершают ошибок. В отличие от инвесторов.Инвестирование – это выбор. Именно об этой

29. Определение необходимой численности выборки

29. Определение необходимой численности выборки
Одним из научных принципов в теории выбороч–ного метода является обеспечение достаточного чи–сла отобранных единиц.Уменьшение стандартной ошибки выборки всег–да связано с увеличением объема выборки. Расчет

30. Способы отбора и виды выборки. Собственно случайная выборка

30. Способы отбора и виды выборки. Собственно случайная выборка
В теории выборочного метода разработаны раз–личные способы отбора и виды выборки, обеспечи–вающие репрезентативность. Под способом отбора понимают порядок отбора единиц из генеральной со–вокупности.

31. Механическая и типическая выборки

31. Механическая и типическая выборки
При чисто механической выборке вся ге–неральная совокупность единиц должна быть прежде всего представлена в виде списка единиц отбора, со–ставленного в каком-то нейтральном по отношению к изучаемому признаку порядке. Затем список

32. Серийная и комбинированная выборки

32. Серийная и комбинированная выборки
Серийная (гнездовая) выборка – это такой вид формирования выборочной совокупности, когда в случайном порядке отбираются не единицы, подле–жащие обследованию, а группы единиц (серии, гнез–да). Внутри отобранных серий (гнезд)

33. Многоступенчатая, многофазная и взаимопроникающая выборки.

33. Многоступенчатая, многофазная и взаимопроникающая выборки.
Особенность многоступенчатой выборки со–стоит в том, что выборочная совокупность формиру–ется постепенно, по ступеням отбора. На первой ступени с помощью заранее определенного спосо–ба и вида отбора

3. Определение необходимой численности выборки

3. Определение необходимой численности выборки
Одним из научных принципов в теории выборочного метода является обеспечение достаточного числа отобранных единиц. Теоретически необходимость соблюдения этого принципа представлена в доказательствах предельных теорем

4. Способы отбора и виды выборки

4. Способы отбора и виды выборки
В теории выборочного метода разработаны различные способы отбора и виды выборки, обеспечивающие репрезентативность. Под способом отбора понимают порядок отбора единиц из генеральной совокупности. Различают два способа отбора: повторный

36. Ошибки выборки

36. Ошибки выборки
Собственнослучайная выборка – это отбор единиц из всей генеральной совокупности посредством жеребьевки или другим подобным способом. Принципом случайности является то, что на включение или исключение объекта из выборки не может повлиять любой фактор,

Лексические ошибки

Лексические ошибки
1. Неправильное использование слов и терминовОсновная масса ошибок в деловых письмах относится к лексическим. Недостаточная грамотность приводит не только к курьезной бессмыслице, но и абсурду.Отдельные термины и профессиональные жаргонные слова

5 Наши ошибки

5
Наши ошибки
Мы настаиваем: выбранный курс рыночных реформ был верным. И они вовсе не потерпели неудачу, они только еще раз споткнулись. Но ошибки и упущения были. Это и наши ошибки, и ошибки руководства страны, которые мы не сумели предотвратить. Ошибки — во многом

Важность размера выборки

Важность размера выборки
Как я уже говорил, люди склонны уделять слишком много внимания редким случаям возникновения какого-то феномена, несмотря на то что со статистической точки зрения из нескольких случаев невозможно извлечь много информации. Это – основная причина

Репрезентативные выборки

Репрезентативные выборки
Репрезентативность наших тестов для целей предсказания будущего определяется двумя факторами:– Количество рынков: тесты, проводимые на различных рынках, будут, скорее всего, включать рынки с разной степенью волатильности типов

Размер выборки

Размер выборки
Концепция размера выборки проста: для того чтобы делать статистически достоверные заключения, нужно иметь достаточно большую выборку. Чем меньше выборка, тем грубее выводы, которые можно сделать; чем выборка больше, тем выводы качественнее. Нет никакого

Возможно, вам также будет интересно:

  • Ошибка выборки контроль и ремонт выборки
  • Ошибка выборки это в социологии
  • Ошибка выборки как правило выражается в чем
  • Ошибка выборки или ошибка репрезентативности это
  • Ошибка выборки и распределение вероятности ошибки выборки

  • Понравилась статья? Поделить с друзьями:
    0 0 голоса
    Рейтинг статьи
    Подписаться
    Уведомить о
    guest

    0 комментариев
    Старые
    Новые Популярные
    Межтекстовые Отзывы
    Посмотреть все комментарии