abc-analiz

Получить бесплатно файл для проведения ABC-анализа

(версия 3.0)

Ваш e-mail: *
Ваше имя: *
Подписчиков:

 

Поиск аномальных значений в Excel

Получить бесплатно файл Excel для обнаружения аномальных значений

(версия 2.0)

 

Ваш e-mail: *
Ваше имя: *

 

Главная Теория и практика Вариация Дисперсия, стандартное отклонение, коэффициент вариации

Дисперсия, стандартное отклонение, коэффициент вариации

Здравствуйте, уважаемые любители статистики и посетители блога statanaliz.info.

Из предыдущей статьи мы узнали, что такое вариация данных и рассмотрели такие показатели, как размах вариации и среднее линейное отклонение. Оба показателя отличаются и методом расчета (это очевидно), и интерпретацией. Однако статистические показатели изменчивости на этом не заканчиваются. Сегодня я расскажу о том, что такое дисперсия, стандартное отклонение (оно же среднеквадратическое отклонение, оно же сигма) и коэффициент вариации. Эти показатели достаточно часто встречаются в литературе и различных публикациях, поэтому с ними следует хорошенько разобраться. Фактически любой статистический показатель – это фундамент анализа данных и без хорошего понимания - никак.

 

Напомню, что среднее линейное отклонение отражает среднее абсолютное отклонение значений от их средней величины. При расчете этого показателя, чтобы избежать взаимопогашения положительных и отрицательных отклонений, используется модуль, то есть каждое отклонение от средней берется с положительным знаком. Та же идея лежит в расчете другого известного в статистике показателя, только отклонения берутся не по модулю, а возводятся в квадрат. Квадрат любого числа, как известно, всегда будет положительным.

Дисперсия

Уверен, многие уже догадались, что речь идет о дисперсии. Дисперсия звучит красиво и очень научно. Стоит упомянуть в разговоре, и правда на твоей стороне. Дисперсия в статистике очень важный показатель, который активно используется в других видах статистического анализа (проверка гипотез, анализ причинно-следственных связей и др.). В общем, невозможно быть хорошим аналитиком и не знать что такое дисперсия. Засмеют.

Как и среднее линейное отклонение, дисперсия также отражает меру разброса данных вокруг средней величины.

Формула для расчета дисперсии выглядит так:

 

Формула расчета дисперсии

где

D – дисперсия,

x – анализируемый показатель, с черточкой сверху – среднее значение показателя,

n – количество значений в анализируемой совокупности данных.

Примечание. Для расчета дисперсии в Excel предусмотрена специальная функция.

 

Язык знаков полезно перевести на язык слов. Получится, что дисперсия - это средний квадрат отклонений. То есть вначале рассчитывается среднее значение, затем берется разница между каждым исходным и средним значением, возводится в квадрат, складывается и затем делится на количество значений в данной совокупности. Разница между отдельным значением и средней отражает меру отклонения. В квадрат возводится для того, чтобы все отклонения стали исключительно положительными числами и чтобы избежать взаимоуничтожения положительных и отрицательных отклонений при их суммировании. Затем, имея квадраты отклонений, мы просто рассчитываем среднюю арифметическую. Средний – квадрат – отклонений. Отклонения возводятся в квадрат, и считается средняя. Разгадка магического слова «дисперсия» заключается всего в трех словах.

Однако в чистом виде, как, например, средняя арифметическая, или индекс, дисперсия не используется. Это скорее вспомогательный и промежуточный показатель, который используется для других видов статистического анализа. У нее даже единицы измерения нормальной нет. Судя по формуле, это квадрат единицы измерения исходных данных. Без бутылки, как говорится, не разберешься.

Стандартное отклонение

Дабы вернуть дисперсию в реальность, то есть использовать результат расчета для более приземленных целей, из нее извлекают квадратный корень. Получается так называемое стандартное отклонение. В статистике этот показатель еще называют среднеквадратическим отклонением, но первое название более короткое и распространенное. Будем им пользоваться. Формула стандартного отклонения имеет вид:

Формула расчета стандартного отклонения

Примечание. Стандартное отклонение в Excel рассчитывается очень просто.

 

Кстати, стандартное отклонение еще называют сигмой – от греческой буквы, которой его обозначают. Отсюда и название известного статистического метода «6-сигма». То есть 6 стандартных отклонений. Почему 6, расскажу в другой раз.

Стандартное отклонение, очевидно, также характеризует меру рассеяния данных, но теперь (в отличие от дисперсии) его можно сравнивать с исходными данными, так как единицы измерения у них одинаковые (это явствует из формулы расчета). Но и этот показатель в чистом виде не очень информативен, так как в нем заложено слишком много промежуточных расчетов, которые сбивают с толку (отклонение, в квадрат, сумма, среднее, корень). Тем не менее, со стандартным отклонением уже можно работать непосредственно, потому что свойства данного показателя хорошо изучены и известны. К примеру, есть такое правило трех сигм, которое гласит, что в данных с нормальным распределением 997 значений из 1000 будут находиться не далее, чем 3 сигмы в ту или иную сторону от среднего значения. Сигма, как мера неопределенности, также участвует во многих статистических расчетах. С ее помощью устанавливают степень точности различных оценок и прогнозов. Если вариация очень большая, то стандартное отклонение тоже получится большим, следовательно, и прогноз будет неточным, что выразится, к примеру, в очень широких доверительных интервалах.

Коэффициент вариации

Из всех показателей вариации стандартное отклонение в наибольшей степени используется для проведения других видов статистического анализа. Как я уже писал выше, это оценка точности, качества и др. Однако среднеквадратическое отклонение дает абсолютную оценку меры разбросанности значений и чтобы понять, насколько она велика относительно самих значений, требуется относительный показатель. Такой показатель существует и называется он коэффициент вариации. Формула коэффициента вариации очень проста:

Формула расчета коэффициента вариации 

Примечание. Коэффициент вариации в Excel также считается быстро.

 

Как видно, это отношение стандартного отклонения к средней величине. Данный показатель измеряется в процентах (если умножить на 100%). Имея коэффициенты вариации, можно сравнивать однородность самых разных явлений независимо от их масштаба и единиц измерения. Данный факт и делает коэффициент вариации столь популярным.

В статистике принято, что, если значение коэффициента вариации менее 33%, то совокупность считается однородной, если больше 33%, то – неоднородной. Мне здесь трудно что-то прокомментировать. Не знаю, кто и почему так определил, но это считается аксиомой.

Чувствую, что я увлекся сухой теорией и нужно привести что-то наглядное и образное. С другой стороны все показатели вариации описывают примерно одно и то же, только рассчитываются по-разному. Поэтому разнообразием примеров блеснуть трудно, Отличаться могут лишь значения показателей, но не их суть. Вот и сравним, как отличаются значения различных показателей вариации для одной и той же совокупности данных. Это поможет несколько систематизировать представление о показателях вариации. Возьмем пример с расчетом среднего линейного отклонения (из предыдущей статьи). Вот исходные данные:

 

Данные об отгрузках для расчета показателей вариации

 

И график для напоминания

 

 

Изображение расчета среднего линейного отклонения

По этим данным рассчитаем: среднее значение, размах вариации, среднее линейное отклонение, дисперсию и стандартное отклонение.

Среднее значение – это обычная средняя арифметическая.

 

Расчет среднего значения

 

Размах вариации – разница между максимумом и минимумом:

 

Расчет размаха вариации

 

Среднее линейное отклонение считается по формуле:

 

Расчет среднего линейного отклонения

 

 

Дисперсия считается по формуле:

 

Расчет дисперсии отгрузок

 

Стандартное отклонение – корень из дисперсии:

 

Расчет стандартного отклонения

 

Расчет сведем в табличку.

 

Результат расчета показателей вариации

 

Как видно, среднее линейное отклонение и стандартное отклонение дают похожие значения степени вариации данных. Дисперсия – это сигма в квадрате, поэтому она всегда будет относительно большим числом, что, собственно, ни о чем не говорит. Размах вариации – это разница между крайними значениями и может говорить о многом.

Подведем некоторые итоги.

Вариация показателя отражает изменчивость процесса или явления. Ее степень может измеряться с помощью нескольких показателей.

  1. Размах вариации – разница между максимумом и минимумом. Отражает диапазон возможных значений.
  2. Среднее линейное отклонение – отражает среднее из абсолютных (по модулю) отклонений всех значений анализируемой совокупности от их средней величины.
  3. Дисперсия – средний квадрат отклонений.
  4. Стандартное отклонение – корень из дисперсии (среднего квадрата отклонений).
  5. Коэффициент вариации – наиболее универсальных показатель, отражающий степень разбросанности значений независимо от их масштаба и единиц измерения. Коэффициент вариации измеряется в процентах и может быть использован для сравнения вариации различных процессов и явлений.

Таким образом, в статистическом анализе существует система показателей, отражающих однородность явлений и устойчивость процессов. Часто показатели вариации не имеют самостоятельного смысла и используются для дальнейшего анализа данных. Исключением является коэффициент вариации, который характеризует однородность данных, что является ценной статистической характеристикой.

На сегодня все. В следующий раз расскажу еще что-нибудь интересное. До скорых встреч на блоге statanaliz.info.

Отнести науку статистического анализа данных в массы.

Комментарии  

 
0 #65 Дисперсия, стандартное отклонение, коэффициент вариацииДина 10.04.2014 15:25
Цитирую Валерия:
Добрый день! Пытаюсь самостоятельно разобраться в матстатистике...благодаря вашему блогу у меня это получается! Очень доходчиво, наглядно и просто! Спасибо большое!!!

Действительно! Полностью присоединяюсь к словам, такая же ситуация. Только благодаря вашему блогу удалось разобраться и понять более-менее суть! Очень понятно и доходчиво! У вас просто талант объяснять! :-) :-*
Цитировать
 
 
0 #64 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 11.03.2014 11:57
Цитирую Дмитрий:
Здравствуйте, вопрос такой, почему повсеместно используется преимущественно стандартное отклонение вместе среднего линейного ? Чем оно лучше и точнее для расчетов ? Почему именно среднеквадратич ное отклонение ? Можно же было считать и среднекубическо е, как вариант. Почему-то в интернете нет ответа на этот столь важный вопрос, в силу каких причин именно среднеквадратич ное отклонение стало главной характеристикой , а не среднее линейное.

Здравствуйте.
Думаю, на то есть несколько причин. Первое – это то, что сигма является одним из параметров нормального распределения со всеми вытекающим отсюда последствиями. Второе – это то, что у сигмы есть некоторые отличные математические свойства, которых нет у других показателей вариации. Третье – это то, что сигма есть корень из дисперсии, а дисперсия также обладает рядом свойств. Другими словами, сигму можно использовать не только как самодостаточный показатель, но и для различных математических манипуляций.
Однако иногда действительно вместо стандартного отклонения можно использовать среднелинейное отклонение. Нужно смотреть на суть анализа.
Цитировать
 
 
0 #63 Дисперсия, стандартное отклонение, коэффициент вариацииДмитрий 11.03.2014 11:20
Здравствуйте, вопрос такой, почему повсеместно используется преимущественно стандартное отклонение вместе среднего линейного ? Чем оно лучше и точнее для расчетов ? Почему именно среднеквадратич ное отклонение ? Можно же было считать и среднекубическо е, как вариант. Почему-то в интернете нет ответа на этот столь важный вопрос, в силу каких причин именно среднеквадратич ное отклонение стало главной характеристикой , а не среднее линейное.
Цитировать
 
 
-1 #62 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 09.02.2014 06:16
Цитирую Юрий.:
А где можно найти программу для расчёта гомеостатичност и, селекционной ценности, индекса условий среды выращивания с/х культуры, показателя реализации потенциала урожайности и им подобных величин?

Я не специалист по с/х, но думаю, что такие специфичные показатели должны быть в специализирован ном ПО. Какое - не знаю. А лучше разобраться самому и рассчитать в Excel.
Цитировать
 
 
0 #61 RE: Дисперсия, стандартное отклонение, коэффициент вариацииЮрий. 09.02.2014 05:05
А где можно найти программу для расчёта гомеостатичност и, селекционной ценности, индекса условий среды выращивания с/х культуры, показателя реализации потенциала урожайности и им подобных величин?
Цитировать
 
 
0 #60 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 25.01.2014 11:43
Цитирую qalya:
pomogite pojalusta rewit zadachu po statistike..
В соответствии с результатами опытных испытаний электроламп на продолжительнос ть горения средняя величина этого показателя составляет 6 часов. Средний квадрат продолжительнос ти горения электроламп равен 61.
Определите коэффициент вариации.


Дисперсию еще можно рассчитать как разность между средним квадратом значений и квадратом среднего значения:
D=Срзнач(X^2) - (СрзначX)^2 = 61-6^2=61-36=25
Отсюда среднекдвадрати ческое отклонение:
Корень из 25 = 5
Отсюда коэффициент вариации: ср.квадр.отклон. / среднее = 5/6 = 83,3%
Цитировать
 
 
0 #59 RE: Дисперсия, стандартное отклонение, коэффициент вариацииqalya 25.01.2014 11:15
pomogite pojalusta rewit zadachu po statistike..
В соответствии с результатами опытных испытаний электроламп на продолжительнос ть горения средняя величина этого показателя составляет 6 часов. Средний квадрат продолжительнос ти горения электроламп равен 61.
Определите коэффициент вариации.
Цитировать
 
 
+2 #58 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 29.11.2013 06:44
Цитирую Марк:
Добрый день!

Спасибо за материал, очень наглядно, но есть один вопрос. Насколько я понял, дисперсия является по сути средним гармоническим отклонения случайной величины. А в чём удобство - сначала возводить в квадрат каждую величину, затем суммировать, потом делить на общее число членов и извлекать корень? При этом ведь теряется всяческая линейность. Разве не более правильно пользоваться средним арифметическим от модулей (чтобы избавиться от взаимных уничтожений) всех разностей?

Можно и среднюю арифметическую модулей. Такой показатель назывется среднелинейным отклонением. Однако дисперсия - это мера разброса, которая обладает рядом полезных свойств. Об этом скоро будет статья.
Цитировать
 
 
+2 #57 ДисперсияМарк 28.11.2013 18:10
Добрый день!

Спасибо за материал, очень наглядно, но есть один вопрос. Насколько я понял, дисперсия является по сути средним гармоническим отклонения случайной величины. А в чём удобство - сначала возводить в квадрат каждую величину, затем суммировать, потом делить на общее число членов и извлекать корень? При этом ведь теряется всяческая линейность. Разве не более правильно пользоваться средним арифметическим от модулей (чтобы избавиться от взаимных уничтожений) всех разностей?
Цитировать
 
 
0 #56 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 24.11.2013 13:30
Цитирую moon27:
Добрый день.

Спасибо за предыдущий ответ.
Цитата:
Первым делом нужно посмотреть на характер данных, то есть определить, есть ли в них тенденция и цикличность

Засучив рукава начал копать в сторону тенденций.
И наткнулся на один камень. Преткновения)
Есть статистические данные и есть линии тренда. Линий тренда много - логарифмические , линейные и т.д.
Как я понял, необходимо правильно выбрать тип линии тренда, чтобы величина достоверности аппроксимации была как можно ближе к 1.
А как правильно выбрать тип линии тренда, если есть просто временной ряд изменения некоей переменной. И непонятен их характер сейчас и неизвестно как они будут вести себя в будущем.
Есть ли какая-либо программа,котор ая сама определяет наилучший тип линии тренда для исходных данных или может Эксель умеет это определять ?

С уважением.


Бывают разные тенденции да. Лучше всего можно определить на глазок, то есть нарисовать график и лично прикинуть, на что похожа форма тенденции. Качество тренда определяет т.н. коэффициент детерминации R2 (эр в квадрате). Это в теории. На практике лучше не сильно увлекаться максимизацией R2, т.к. слишком хорошо подобранная функция может выдать абсурдный прогноз. Например полином большой степени способен почти повторить каждую точку, но прогноз будет за гранью добра и зла. В общем и целом старайтесь ограничиться уравнением прямой. Может не очень точно, зато более надежно.
Цитировать
 
 
0 #55 RE: Дисперсия, стандартное отклонение, коэффициент вариацииmoon27 24.11.2013 09:26
Добрый день.

Спасибо за предыдущий ответ.
Цитата:
Первым делом нужно посмотреть на характер данных, то есть определить, есть ли в них тенденция и цикличность

Засучив рукава начал копать в сторону тенденций.
И наткнулся на один камень. Преткновения)
Есть статистические данные и есть линии тренда. Линий тренда много - логарифмические , линейные и т.д.
Как я понял, необходимо правильно выбрать тип линии тренда, чтобы величина достоверности аппроксимации была как можно ближе к 1.
А как правильно выбрать тип линии тренда, если есть просто временной ряд изменения некоей переменной. И непонятен их характер сейчас и неизвестно как они будут вести себя в будущем.
Есть ли какая-либо программа,котор ая сама определяет наилучший тип линии тренда для исходных данных или может Эксель умеет это определять ?

С уважением.
Цитировать
 
 
0 #54 ОтвечаюAdministrator 19.11.2013 10:23
Попробую ответить. Первое, что нужно запомнить, статистика – это инструмент. Как топор для плотника. Сам он ничего не делает, гораздо важнее умение самого плотника. Так вот, статанализ – это набор методов, которые при определенном стечении обстоятельств (навыки аналитика + качественные данные), помогают получить полезную информацию, если таковая вообще есть.
Теперь конкретно по прогнозу. Первым делом нужно посмотреть на характер данных, то есть определить, есть ли в них тенденция и цикличность. Если есть, то эти составляющие динамики можно рассчитать и продлить на будущее. В данном комменте уж не буду писать формулы. На то должна быть отдельная статья, и не одна. Так вот если есть закономерности, то они продлеваются и таким образом получается прогноз с некоторым допуском на ошибку. Лучший способ это обнаружить – просто нарисовать график. В предлагаемых данных закономерностей не обнаружено, по крайней мере, визуально. Поэтому искать в них цикличность и сезонность нецелесообразно . Для прогноза в этом случае лучше всего взять обычную среднюю арифметическую. Хотя последнее значение резко пошло вверх – совсем непонятно почему. Возможно, следующее значение снова будет ниже, или наоборот, рост продолжиться. Статистика бессильна делать подобные прогнозы. Нужно просто понять, почему так произошло, ну, и подумать, что может быть дальше. Если это случайный всплеск, то, скорее всего, следующее значение снова будет близко к среднему.
Качество прогноза определяется простым сравнением факт/прогноз*100%. Чем ближе к 1, тем точнее прогноз.
Универсальной методологии прогнозирования не существует. Конкретный метод выбирается исходя из характера данных.
Кстати, одним из факторов выбора метода должна являться простота. Чем проще метод, тем он надежнее и предпочтительне е.
Примерно так.
Цитировать
 
 
0 #53 RE: Дисперсия, стандартное отклонение, коэффициент вариацииmoon27 19.11.2013 06:11
Добрый день. Никак не могу запустить изучение статанализа в более-менее системном виде. Там увижу коэффициент вариации, там тренд, там распределение - квартальное, сезонноное, экспоненциально е, экстремальное. Но всё слишком фрагментарно. Можно на примере рассмотреть простейшие шаги ?

Допустим, есть группа товаров и динамика их стоимости в течении 20 дней. Выберем один товар. Пусть он стоит 1 рубль. Царский).
По таблице видно, что в 1-й день его удалось продать с коэффициентом 1.12 - о есть за 1,12 коп.
В 4-й день, его удалось продать с коэффициентом 0.87 – то есть ниже себестоимости – за 87 коп.
И так далее.
Вопрос, если есть данные об изменении переменной за 20 дней, то какие методы можно приложить к этим данным, чтобы получить прогноз – за сколько удастся продать этот товар в 21–й день ? (Причём, на 21–й день у меня уже есть реальные данные).
Что вообще можно сказать об этом товаре ? С чего можно начать ? Можно ли простыми понятиями, не усложняя, описать самые эффективные. для данного случая - методы прогноза, хотя бы на 1 день ? Как определить точность прогноза в процентах ?
То есть показать микрометодологи ю прогнозирования , чтобы экстраполироват ь эти знания на временные ряды гораздо большей длины ?

Ссылка примера
http://my-files.ru/Download/vddr/Primer.xls

С уважением, Андрей.
Цитировать
 
 
0 #52 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 13.11.2013 13:01
Цитирую moon27:
Добрый день, Дмитрий.
......
Хочу предложить вам Идею сайта.
С уважением, ваш покорный слуга)


Добрый день.
Спасибо за такой комментарий, было интересно читать. Вот бы все так писали!
Отвечаю.
Про учебники согласен. Копи-паст – это любимый способ написания для многих. Проблема разжевывания статистики нигде не решена. Я в меру своих сил именно за это и взялся. Хотя сам только любитель-практик, использующий некоторые методы для нужд снабжения и управления запасами.
На счет отличий моего сайта. Все-таки они есть. Иначе все изложенное можно было бы уместить в 5 статей. У меня их уже штук 50. Как получается, так получается. Это первый опыт, поэтому многое узнаю по ходу дела. Советы принимаются с распростертыми объятиями. Сам никогда не преподавал и не обучал других. Все излагаемое стараюсь оценить со стороны. Некоторым даже нравится.
За Вашу идею ставлю крепкую пятерку. Именно она у меня маячит перед глазами. Но увы и ах, сайт – это хобби, на которое не каждый день отводится даже полчаса. Поэтому скорость наполнения запредельно низкая. Для того, чтобы выделить этот «ген», вначале нужно перелопатить кучу «руды» в виде обычных статей. Далее начну собирать крупицы самых полезных знаний, которые и составят будущий «ген». Но сегодняшний этап – это пока работа с «рудой».
Далее этот самый ген нужно будет все равно разжевывать. Например, 99% людей понятия не имеет, что такое стандартное отклонение. Все равно придется отсылать к статьям, разжевывающим то или иное понятие. Вот эти статьи сейчас и пишутся.
Так что «лайт система» - это здорово, но она не может висеть в воздухе. Нужен прочный фундамент. Я лучше потом еще раз напишу все более сжато и красиво, опираясь на предыдущий опыт изложения материала. Народ все-таки своими вопросами корректирует мое понимание доступности и указывает моменты, требующие более тщательного объяснения.
После достаточно наполнения статьями будут выпускаться различные краткие справочники, файлики для проведения анализа и т.д. Кстати, первые пробные варианты уже висят на сайте. Можно пользоваться файлом для проведения АВС-анализа, например.

С приветом
Автор настоящего блога.
Дмитрий.

P.S. В отличие от кикбоксинга у статистического анализа бывают разные цели. Поэтому написать общее, понятное и полезное для всех невозможно. Одному нужно анализировать динамику, другому разброс данных, третьему еще что-то. Так что в любом случае все материалы придется разбивать на кучу разделов по интересам. Далее пойдут краткие пошаговые инструкции.
Цитировать
 
 
0 #51 RE: Дисперсия, стандартное отклонение, коэффициент вариацииmoon27 13.11.2013 10:42
Добрый день, Дмитрий.

Хочу предложить вам Идею сайта.
Когда-то, когда деревья были большими, я учился на философском факультете. Правда не окончил его, но склонность к обобщению явлений внешнего мира у меня осталась. С некоторых пор я начал интересоваться статистикой. И следуя своей особенности стал искать предельно общую информацию на эту тему.
И… ничего не нашёл.
Большинство учебников, изданий, пособий рассчитаны на подготовленных людей и изобилует избыточной информацией.
Большинство авторов просто копирует из памяти всё, то что они запомнили в университете. Не в состоянии обобщить и скомпилировать общий подход.
Некоторые добрые самаритяне, всё же вспоминают об обывателях, на каком-то этапе жизни заинтересовавши хся статистикой и пытающихся самостоятельно её изучать. Но, и они, или слишком вольны и многословны, или, забываясь, скатываются на различные спецификации.

Я понимаю что это происходит потому, что большинство авторов не обладают способностью мыслить системно. Просто нет таланта. Человек отучился в университете, запомнил большое кол-во информации на эту тему, сложил более-менее большие фрагменты этой науки в своей голове, но связать эти фрагменты и выделить предельно общий, единообразный метод подхода к анализу так и не смог.

Полистав ваш сайт, я пришёл квыводу, что он ничем не обличается от десятков других – непрофессионал, как я, пришёл, посмотрел, ничего не понял и ушёл.

В связи с этим, Дмитрий, я предлагаю Идею сайта.
Суть её заключается в том, чтобы выделить некие первичные элементы статистического анализа и на их основе создать некий Ген статистического анализа.
То есть, есть одна независимая и одна зависимая переменная, которая принимает, допустим пять значений.
И всё. Далее, изложить элементарные методы обработки этих переменных и их значений. Пошагово. Среднее, станд.отклонение, коэффициент вариации, корреляция и так далее.

То есть сделать некую лайт систему, которая поможет любому человеку разобраться с первичной информацией.

Поясню мысль. Я занимаюсь, на любительском уровне, для души, кикбоксингом - 6 лет.
Я знаю, что такое подсечка, клинч, бекфист и прочее. Но в реале, на улице, мне пригождались лишь 4-5 отработанных приёмов.
В результате, сейчас, я могу обучить любого человека эффективно сопротивляться, с нуля - за полгода. То есть через полгода, человек будет приблизительно равен мне. Потому что он будет знать – Главное.

Так вот я предлагаю создать сайт посвящённый - Главному. В частности сделать на сайте два раздела. Первый раздел – некий парламентский уровень – там будет обсуждаться, что должно войти в лайт-систему, степень её сложности, чем можно пренебречь. Второй раздел – квинтэссенция всех обсуждений – немногословная, предельно общая, пригодная для понимания всеми, статистическая система.

С уважением, ваш покорный слуга)
Цитировать
 
 
0 #50 RE: Дисперсия, стандартное отклонение, коэффициент вариацииKate 28.09.2013 18:41
X до 0,01

Цитирую Kate:
Да просто преподаватель имел в виду, округлить до сотых, во всяком случае, других вариантов нет. )
Цитировать
 
 
0 #49 RE: Дисперсия, стандартное отклонение, коэффициент вариацииKate 28.09.2013 18:40
Да просто преподаватель имел в виду, округлить до сотых, во всяком случае, других вариантов нет. )
Цитировать
 
 
0 #48 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 17.09.2013 16:47
Цитирую Кукумбер:
немного не понятно, а зачем нам вообще нужна дисперсия и стандартное отклонение? как это применяется в практике? что дает?

Сама по себе дисперсия мало о чем говорит. Ее обычно привязывают к чему-то. Например, коэффициент вариации.
Дисперсия и стандартное отклонение гораздо чаще используется при выборочном наблюдении, когда определяют пределы ошибки оценки показателей, а также в проверке статистических гипотез. То есть в тех методах, о которых на блоге еще мало написано. Поэтому следите за обновлениями и узнаете, где используется дисперсия
Цитировать
 
 
0 #47 RE: Дисперсия, стандартное отклонение, коэффициент вариацииКукумбер 17.09.2013 15:38
немного не понятно, а зачем нам вообще нужна дисперсия и стандартное отклонение? как это применяется в практике? что дает?
Цитировать
 
 
0 #46 RE: Дисперсия, стандартное отклонение, коэффициент вариацииДенис 22.06.2013 08:46
Цитирую Administrator:
Цитирую Денис:
Спасибо за материал, прочитал, разбираюсь! Но немного не понятна одна вещь: у меня вот такая задача - Найти среднее значение, дисперсию, стандартное отклонение, коофициент вариации для Х до 0,1
дисперсия стандартное отклонение 0,01
коофициент вариации 0,1
расчитать коофициент кореляции между Х и У.
Х - 29,32,37,32,32,35,33
У - 33,32,35,34,37,34,31

я посчитал по формулам в Экселе:
среднее линейное отклонение - 1,836734694
стандартное отклонение - 2,544836041
дисперсия - 6,476190476
коофициент вариации - 0,071706185

Вот что значит до 0,1???? и про кореляцию я пока не понял... Помогите решить... горю просто! Заранее спс за любой ответ!


Коэф.корреляциия в эксель считается через функцию =КОРРЕЛ().
Что такое "до 0,1" не ясно. Либо опечатка, либо автор с перепоя


СПАСИБО!
Цитировать
 
 
0 #45 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 22.06.2013 05:08
Цитирую Денис:
Спасибо за материал, прочитал, разбираюсь! Но немного не понятна одна вещь: у меня вот такая задача - Найти среднее значение, дисперсию, стандартное отклонение, коофициент вариации для Х до 0,1
дисперсия стандартное отклонение 0,01
коофициент вариации 0,1
расчитать коофициент кореляции между Х и У.
Х - 29,32,37,32,32,35,33
У - 33,32,35,34,37,34,31

я посчитал по формулам в Экселе:
среднее линейное отклонение - 1,836734694
стандартное отклонение - 2,544836041
дисперсия - 6,476190476
коофициент вариации - 0,071706185

Вот что значит до 0,1???? и про кореляцию я пока не понял... Помогите решить... горю просто! Заранее спс за любой ответ!


Коэф.корреляциия в эксель считается через функцию =КОРРЕЛ().
Что такое "до 0,1" не ясно. Либо опечатка, либо автор с перепоя
Цитировать
 
 
0 #44 нужна помощьДенис 21.06.2013 17:13
Спасибо за материал, прочитал, разбираюсь! Но немного не понятна одна вещь: у меня вот такая задача - Найти среднее значение, дисперсию, стандартное отклонение, коофициент вариации для Х до 0,1
дисперсия стандартное отклонение 0,01
коофициент вариации 0,1
расчитать коофициент кореляции между Х и У.
Х - 29,32,37,32,32,35,33
У - 33,32,35,34,37,34,31

я посчитал по формулам в Экселе:
среднее линейное отклонение - 1,836734694
стандартное отклонение - 2,544836041
дисперсия - 6,476190476
коофициент вариации - 0,071706185

Вот что значит до 0,1???? и про кореляцию я пока не понял... Помогите решить... горю просто! Заранее спс за любой ответ!
Цитировать
 
 
+1 #43 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 08.02.2013 10:47
Цитирую yv.bondarenko@gmal :
Большое спасибо.
Я воспользовался T-критерием Граббса.

T = (xi - xср)/S
где
xi - текущее значение выборки
xср - среднее арифметическое по выборке
S - среднее квадратичное отклонение

Далее используя процентные точки критерия Смирнова –Грабса Ti сравнивал с табличным значением при альфа = 0,10 при 20 наблюдениях.
Таким образом я определил аномалии (я так думаю).
На выходе получил "Выпадает 300"
Когда 300 поменял на 10. У меня не обнаружилось аномалий в значениях.
Как вы думаете такой подход имеет право быть использованным в продуктивной среде?
Спасибо

Никогда не слышал про этого Граббса, но идея в этом критерии та же - каждое значение сравнивается со средним. Отклонения выше некотого порога считаются аномальным. Поэтому можно использовать, да.
Но лучше стараться все упростить, без всяких таблиц и альф. Тем более, что многое зависит еще от самих данных и пороги аномальности могут меняться.
Цитировать
 
 
0 #42 RE: Дисперсия, стандартное отклонение, коэффициент вариацииyv.bondarenko@gmal 08.02.2013 10:29
Большое спасибо.
Я воспользовался T-критерием Граббса.

T = (xi - xср)/S
где
xi - текущее значение выборки
xср - среднее арифметическое по выборке
S - среднее квадратичное отклонение

Далее используя процентные точки критерия Смирнова –Грабса Ti сравнивал с табличным значением при альфа = 0,10 при 20 наблюдениях.
Таким образом я определил аномалии (я так думаю).
На выходе получил "Выпадает 300"
Когда 300 поменял на 10. У меня не обнаружилось аномалий в значениях.
Как вы думаете такой подход имеет право быть использованным в продуктивной среде?
Спасибо
Цитировать
 
 
0 #41 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 08.02.2013 10:19
Цитирую yv.bondarenko@gmal :
Цитирую Administrator:
[quote
В экселе есть функция условного форматирования. Я с ее помощью выявляю резкие отклонения от среднего значения. Возможно, здесь тоже окажется полезной.
А вообще нужно смотреть на конкретную задачу с реальными данными. Методологию подбирать под конкретную ситуацию.

Согласен, что эксель могучее ПО.
1. Но я не знаю какой этот ряд будет
2. Я разрабатываю автоматизирован ную систему, которая должна отбрасывать аномальные показатели.
3. Мне нужна методика для выявления ненормальных отклонений
4. Можете что-то посоветовать или описать?
5. Спасибо


Есть некоторый столбец, где появляются непредсказуемые данные. Часть из них аномальные и их нужно удалить автоматически, правильно я понимаю? Если да, то на ум приходит такое решение. Рядом со столбцом с фактическим данными делаем еще один с формулой ЕСЛИ. В формуле ЕСЛИ пишем условие, что, если фактическое значение по модулю отклоняется от средней по совокупности данных на некоторую величину (определяющую порог аномальности), то ставится то, что вы хотите видеть вместо аномального значения, в противном случае возвращается фактическое значение. Это если брать абсолютное отклонение. Можно такое же написать и для относительного отклонения (в процентах). Вариантов найти и заменить аномальные значения здесь много.
Немножко понятно, о чем я?
Цитировать
 
 
0 #40 RE: Дисперсия, стандартное отклонение, коэффициент вариацииyv.bondarenko@gmal 08.02.2013 07:52
Цитирую Administrator:
[quote
В экселе есть функция условного форматирования. Я с ее помощью выявляю резкие отклонения от среднего значения. Возможно, здесь тоже окажется полезной.
А вообще нужно смотреть на конкретную задачу с реальными данными. Методологию подбирать под конкретную ситуацию.

Согласен, что эксель могучее ПО.
1. Но я не знаю какой этот ряд будет
2. Я разрабатываю автоматизирован ную систему, которая должна отбрасывать аномальные показатели.
3. Мне нужна методика для выявления ненормальных отклонений
4. Можете что-то посоветовать или описать?
5. Спасибо
Цитировать
 
 
+1 #39 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 07.02.2013 21:15
Цитирую yv.bondarenko@gmai l:
Цитирую Administrator:
А что мешает просто удалить это значение?

Это абстрактный ряд. Я узнаю о значениях только в момент выборки. И значений может быть больше 2000. Мне надо определить аномальные значения в ряду. Вопрос как? На примере простого 1,3,7,9,3,7,5,9,300,8.
Спасибо

В экселе есть функция условного форматирования. Я с ее помощью выявляю резкие отклонения от среднего значения. Возможно, здесь тоже окажется полезной.
А вообще нужно смотреть на конкретную задачу с реальными данными. Методологию подбирать под конкретную ситуацию.
Цитировать
 
 
-1 #38 RE: Дисперсия, стандартное отклонение, коэффициент вариацииyv.bondarenko@gmail 07.02.2013 21:12
Цитирую Administrator:
А что мешает просто удалить это значение?

Это абстрактный ряд. Я узнаю о значениях только в момент выборки. И значений может быть больше 2000. Мне надо определить аномальные значения в ряду. Вопрос как? На примере простого 1,3,7,9,3,7,5,9,300,8.
Спасибо
Цитировать
 
 
+1 #37 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 07.02.2013 20:33
Цитирую yv.bondarenko@gmai l:
Добрый день.
Уважаемые знатоки, помогите разобраться.
У меня есть времена (в часах) выполнения какого-то заданий (в моем случае заявки ITSD в ИТ компании):
1,3,7,9,3,7,5,9,300,8

Как из этого набора исключить аномальный показатель 300?
Спасибо за помощь.

А что мешает просто удалить это значение?
Цитировать
 
 
+1 #36 Вопросyv.bondarenko@gmail 07.02.2013 19:00
Добрый день.
Уважаемые знатоки, помогите разобраться.
У меня есть времена (в часах) выполнения какого-то заданий (в моем случае заявки ITSD в ИТ компании):
1,3,7,9,3,7,5,9,300,8

Как из этого набора исключить аномальный показатель 300?
Спасибо за помощь.
Цитировать
 
 
+1 #35 RE: Дисперсия, стандартное отклонение, коэффициент вариацииИван 29.01.2013 18:38
Цитирую Administrator:
Отрицательный результат - это тоже результат. Так что не за что. Приходите еще и проводите друзей )))

Кстати очень понравились Ваши статьи, практически все перечитал. Читать легко, хорошо воспринимается. Особенно статьи о АВС принципе. Проучился 4 курса в университете, а об этом ничего не знал.
Цитировать
 
 
0 #34 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 29.01.2013 16:59
Цитирую Иван:
Цитирую Administrator:
Иван, я все пытаюсь врубиться в суть задачи. Мы пытаемся настроить некоторый процесс, где B1 и B2 влияют на А? И нам нужно добиться некоторой нужной нам вариации А?
«Тоисть В1 имеет коэф вар 10% а B2 коэф 23%. Видно что В1 показывает на большую надежность P, поэтому можно припустить что влияние В1 будет больше чем в В2 и соответственно будет уже не по 0,5 на 0,5, а например 0,6 на 0,4.» -
вообще не понял. Вариация одного события отнюдь не означает влияние на другое событие. Для определения тесноты связи используются совсем другие методы.
«Можно ли в даном случае так изменять сотношение влеяния двух событий на одно»
Здесь тоже нужно определиться. Мы измеряем существующие влияние факторов или пытаемся с помощью изменения тесноты связи повлиять на результат А?


Вобщем забыли, походу что то не то я пытаю рассчитать :-x , хотел изюминку попробовать найти в алгоритме с помощью отклонений. Спасибо за уделенное время!

Отрицательный результат - это тоже результат. Так что не за что. Приходите еще и проводите друзей )))
Цитировать
 
 
0 #33 RE: Дисперсия, стандартное отклонение, коэффициент вариацииИван 29.01.2013 14:53
Цитирую Administrator:
Иван, я все пытаюсь врубиться в суть задачи. Мы пытаемся настроить некоторый процесс, где B1 и B2 влияют на А? И нам нужно добиться некоторой нужной нам вариации А?
«Тоисть В1 имеет коэф вар 10% а B2 коэф 23%. Видно что В1 показывает на большую надежность P, поэтому можно припустить что влияние В1 будет больше чем в В2 и соответственно будет уже не по 0,5 на 0,5, а например 0,6 на 0,4.» -
вообще не понял. Вариация одного события отнюдь не означает влияние на другое событие. Для определения тесноты связи используются совсем другие методы.
«Можно ли в даном случае так изменять сотношение влеяния двух событий на одно»
Здесь тоже нужно определиться. Мы измеряем существующие влияние факторов или пытаемся с помощью изменения тесноты связи повлиять на результат А?


Вобщем забыли, походу что то не то я пытаю рассчитать :-x , хотел изюминку попробовать найти в алгоритме с помощью отклонений. Спасибо за уделенное время!
Цитировать
 
 
0 #32 RE: Дисперсия, стандартное отклонение, коэффициент вариацииИван 29.01.2013 14:36
Цитирую Administrator:

Примерно так, да. Не пересчитывал. Только стандартное отклонение обычно сигмой называют, а не омегой.
Это еще привычка с второго курса, называть отклонение омегой :sigh:
Цитировать
 
 
0 #31 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 29.01.2013 07:13
Цитирую Иван:
Цитирую Екатерина:
Добрый день, помогите с решением задачи :-) Для изучения качества электроламп проведено выборочное обследование. Из партии в 100 ламп отобрано 10. Получено следующее распределение по времени горения этих ламп:
Время горения(тыс.час.) от 2.5 до 3.5 - 1шт.; от 3.5 до 4.5 - 2шт.; от 4.5 до 5.5 - 4шт.; от 5.5 до 6.5 - 3шт.. Вычислить коэффициент вариации. :oops:

Сначало делаешь так: Вычисляешь среднее промижутков. Тоисть (2.5+3.5)/2 получаем 3. Для 3-ки 1 лампа, для 4-ки 2 лампы и так далее
Обьем выборки у тебя n=10.
Дальше нужно найти выборочное среднее, выборочное квадратическое

Выборочное среднее ищется:

x=1/n(x1*n1+x2*n2+...)
тоисть в Твоем случае
x=1/10(3*1+4*2+5*4+6*3)=4.9

Дисперсия

D=1/n(x1^2*n1+x2^2*n2+...)-x^2

Получаем
D=1/10(9*1+16*2+25*4+36*3)-4.9^2=24.9-24.01=0.89
Стандартное отклонение

Омега=sqrt(D)=0.94

Коэф вариации соотношение стандартного отклонения к среднему

v=омега*100/x=0.94*100/4.9=19.25%

8)

Примерно так, да. Не пересчитывал. Только стандартное отклонение обычно сигмой называют, а не омегой.
Цитировать
 
 
0 #30 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 29.01.2013 07:07
Цитирую Иван:
Приведу вот такой пример. Есть событие "А" на которое влияет два других события В1 и В2
В1. P=0.7 Стандартное отклонение=0.07 соответственно коэф вариации=10%
В2. СА=0.35 Стандартное отклонение=0.08% соответственно коэф вариации=23%

Каждое из этих событий влияют по 0,5 на событие "А".
Ну а что если взять не по 0,5 каждое событие, а использовать перевес того события "В" которое имеет меньший коэфициент вариации ( или стандартное отклонение).
Тоисть В1 имеет коэф вар 10% а B2 коэф 23%. Видно что В1 показывает на большую надежность P, поэтому можно припустить что влияние В1 будет больше чем в В2 и соответственно будет уже не по 0,5 на 0,5, а например 0,6 на 0,4.
Можно ли в даном случае так изменять сотношение влеяния двух событий на одно?


Иван, я все пытаюсь врубиться в суть задачи. Мы пытаемся настроить некоторый процесс, где B1 и B2 влияют на А? И нам нужно добиться некоторой нужной нам вариации А?
«Тоисть В1 имеет коэф вар 10% а B2 коэф 23%. Видно что В1 показывает на большую надежность P, поэтому можно припустить что влияние В1 будет больше чем в В2 и соответственно будет уже не по 0,5 на 0,5, а например 0,6 на 0,4.» -
вообще не понял. Вариация одного события отнюдь не означает влияние на другое событие. Для определения тесноты связи используются совсем другие методы.
«Можно ли в даном случае так изменять сотношение влеяния двух событий на одно»
Здесь тоже нужно определиться. Мы измеряем существующие влияние факторов или пытаемся с помощью изменения тесноты связи повлиять на результат А?
Цитировать
 
 
0 #29 RE: Дисперсия, стандартное отклонение, коэффициент вариацииИван 28.01.2013 16:09
Цитирую Екатерина:
Добрый день, помогите с решением задачи :-) Для изучения качества электроламп проведено выборочное обследование. Из партии в 100 ламп отобрано 10. Получено следующее распределение по времени горения этих ламп:
Время горения(тыс.час.) от 2.5 до 3.5 - 1шт.; от 3.5 до 4.5 - 2шт.; от 4.5 до 5.5 - 4шт.; от 5.5 до 6.5 - 3шт.. Вычислить коэффициент вариации. :oops:

Сначало делаешь так: Вычисляешь среднее промижутков. Тоисть (2.5+3.5)/2 получаем 3. Для 3-ки 1 лампа, для 4-ки 2 лампы и так далее
Обьем выборки у тебя n=10.
Дальше нужно найти выборочное среднее, выборочное квадратическое

Выборочное среднее ищется:

x=1/n(x1*n1+x2*n2+...)
тоисть в Твоем случае
x=1/10(3*1+4*2+5*4+6*3)=4.9

Дисперсия

D=1/n(x1^2*n1+x2^2*n2+...)-x^2

Получаем
D=1/10(9*1+16*2+25*4+36*3)-4.9^2=24.9-24.01=0.89
Стандартное отклонение

Омега=sqrt(D)=0.94

Коэф вариации соотношение стандартного отклонения к среднему

v=омега*100/x=0.94*100/4.9=19.25%

8)
Цитировать
 
 
0 #28 Коэффициент вариацииЕкатерина 28.01.2013 15:07
Добрый день, помогите с решением задачи :-) Для изучения качества электроламп проведено выборочное обследование. Из партии в 100 ламп отобрано 10. Получено следующее распределение по времени горения этих ламп:
Время горения(тыс.час.) от 2.5 до 3.5 - 1шт.; от 3.5 до 4.5 - 2шт.; от 4.5 до 5.5 - 4шт.; от 5.5 до 6.5 - 3шт.. Вычислить коэффициент вариации. :oops:
Цитировать
 
 
0 #27 RE: Дисперсия, стандартное отклонение, коэффициент вариацииИван 28.01.2013 11:50
Приведу вот такой пример. Есть событие "А" на которое влияет два других события В1 и В2
В1. P=0.7 Стандартное отклонение=0.07 соответственно коэф вариации=10%
В2. СА=0.35 Стандартное отклонение=0.08% соответственно коэф вариации=23%

Каждое из этих событий влияют по 0,5 на событие "А".
Ну а что если взять не по 0,5 каждое событие, а использовать перевес того события "В" которое имеет меньший коэфициент вариации ( или стандартное отклонение).
Тоисть В1 имеет коэф вар 10% а B2 коэф 23%. Видно что В1 показывает на большую надежность P, поэтому можно припустить что влияние В1 будет больше чем в В2 и соответственно будет уже не по 0,5 на 0,5, а например 0,6 на 0,4.
Можно ли в даном случае так изменять сотношение влеяния двух событий на одно?
Цитировать
 
 
+1 #26 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 28.01.2013 06:37
Цитирую Иван:
Как по мне, если разброс примерно одинаков, тоисть стандартные отклонения примерно одинаковы то, то что одно событие что другое примерно соответствуют один одному, тоисть одинаковы отклонения от среднего что в одного события что в другово. Поэтому, если я не ошибаюсь в даном случае нужно сравнивать по величине стандартного отклонения, а не по вариацие. Мне просто нужно сравнять эти два события, насколько они соответствуют среднему, тоисть где легчеспрогнозир овать. Какипосоветуете ?

Здравствуйте. Здесь нужно четко понимать задачу. Коэффициент вариации используется для относительной оценки возможности прогнозирования . То есть оценивается степень колеблемости данных вокруг среднего независимо от масштаба самих данных. Если же вас интересует абсолютное отклонение, то, конечно, следует использовать абсолютные показатели вариации, например стандартное отклонение. Поэтому правильный ответ зависит от решаемой задачи.
Еще хотел обратить внимание на фразу «и утвержать что вероятность отклонения от среднего в первом меньша чем во втором». На самом деле вероятность отклонения случайной величины от средней всегда равна 100%. Коэффициент вариации отражает усредненную степень отклонения, а не вероятность.
Цитировать
 
 
0 #25 Сравнение коэфициентов вариацииИван 25.01.2013 23:04
Как по мне, если разброс примерно одинаков, тоисть стандартные отклонения примерно одинаковы то, то что одно событие что другое примерно соответствуют один одному, тоисть одинаковы отклонения от среднего что в одного события что в другово. Поэтому, если я не ошибаюсь в даном случае нужно сравнивать по величине стандартного отклонения, а не по вариацие. Мне просто нужно сравнять эти два события, насколько они соответствуют среднему, тоисть где легчеспрогнозир овать. Какипосоветуете ?
Цитировать
 
 
0 #24 Сравнение коэфициентов вариацииИван 25.01.2013 22:38
Здраствуйте! Возник вопрос о сравнении коэфициентов вариации.
Вот например есть два результата
1. СА=58,33% Сигма отклонение=6,99% соответственно коэф вариации=11,99%
2. СА=33,77% Сигма отклонение=7,84% соответственно коэф вариации=23,22%

Если сравнивать коэф вариации то первый в два раза эфективнее. Но ведь что первое что второе практически одинакого колебается навколо среднего, на что указывает стандартное отклонение. Разве в даном случае можно сравнивать коэфициенты вариации и утвержать что вероятность отклонения от среднего в первом меньша чем во втором. Первое и Второе это два разных события.
Цитировать
 
 
0 #23 RE: Дисперсия, стандартное отклонение, коэффициент вариацииPavel 23.01.2013 19:12
Да,благодарю за объяснение,тепе рь действительно понятно!
Цитировать
 
 
0 #22 ответ на вопрос о дисперсиииAdministrator 22.01.2013 06:19
Вчера были проблемы с сайтом. Чей-то комментарий канул в Лету. Вопрос был о том, как образно представить себе среднюю и дисперсию. Однако мой ответ сохранился.
Добрый день.
Если среднее значение говорит само за себя, то дисперсию или стандартное отклонение (сигму) действительно трудно осознать. В этом случае легче всего рассчитать коэффициент вариации – отношение стандартного отклонения к средней. В Вашем примере средняя – 20, сигма – 5. Тогда коэффициент вариации – 5/20=25%. Если значение менее 33%, то данные принято считать однородными. Вот и получается, что при средней 20 и стандартном отклонении 5, вариация данных считается не значительной.
Если бы при той же сигме 5 среднее значение было бы, например, 10, то коэф. вариации был бы уже 5/10=50%. А это уже неоднородная совокупность.
Теперь понятней?
Цитировать
 
 
0 #21 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 19.10.2012 08:54
Цитирую Вероника:
Что эффективнее: простая случайная выборка с возвращением или без возвращения? я считаю, что без возвращения, так ли это((

Это же чистая математика. Такое, наверное, даже в книжках по статистике не пишут. Сходу помочь не могу, извиняйте. Могу только порекомендовать посмотреть учебники по математической статистике и эконометрике.
Цитировать
 
 
0 #20 RE: Дисперсия, стандартное отклонение, коэффициент вариацииВероника 19.10.2012 08:33
Что эффективнее: простая случайная выборка с возвращением или без возвращения? я считаю, что без возвращения, так ли это((
Цитировать
 
 
0 #19 RE: Дисперсия, стандартное отклонение, коэффициент вариацииВероника 19.10.2012 07:22
Цитирую Administrator:
Цитирую Вероника:
Может ли быть вычислена по систематической выборке дисперсия оценки?


Какой именно оценки? Дисперсия средней, например, - это дисперсия переменной делить на n. Вообще, таким вопросом не задавался. А что гугл говорит?

в том то и дело, что нигде не могу найти ответ... предмет как таковой не проходили, к зачету нужно ответить на эти вопросы...Тема 7. Систематическая выборка. Выборка Пуассона.
18. Какой из выборок (систематическо й или Пуассона) присущ случайный итоговый объем?
19. Может ли систематическая выборка быть более (менее) эффективной в смысле точности, чем простая случайная?
20. Может ли быть вычислена по систематической выборке дисперсия оценки?
21. Выборка Пуассона более точная, чем простая случайная?
Цитировать
 
 
0 #18 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 02.10.2012 14:29
Цитирую Юлия:
Здравствуйте! хотела бы попросить помочь с решением задачи.
дано: века, в которых жили правители, так же рост каждого правителя.
по формуле Стеджерса я вычислила, что групп будет 6 с интервалом почти 180 лет(до н.э., 11-13, 13-15,15-17 и т.д до 21 века).
я расчитала среднее значение в каждой подгруппе, дисперсию, стандартное отклонение, осталось расчитать коэффициент вариации. по каждой из подгрупп я расчитала. ВОПРОС: как расчитать коэф вариации по всей совокупности???
зараннее спасибо:)


Здравствуйте. Очень просто. Считаете общую среднюю (по всем векам). Потом общую дисперсию. Общий коэффициент вариации находим путем деления общего стандартного отклонения на общую среднюю.
Цитировать
 
 
0 #17 коэффициент вариацииЮлия 02.10.2012 14:05
Здравствуйте! хотела бы попросить помочь с решением задачи.
дано: века, в которых жили правители, так же рост каждого правителя.
по формуле Стеджерса я вычислила, что групп будет 6 с интервалом почти 180 лет(до н.э., 11-13, 13-15,15-17 и т.д до 21 века).
я расчитала среднее значение в каждой подгруппе, дисперсию, стандартное отклонение, осталось расчитать коэффициент вариации. по каждой из подгрупп я расчитала. ВОПРОС: как расчитать коэф вариации по всей совокупности???
зараннее спасибо:)
Цитировать
 
 
+1 #16 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 01.10.2012 11:44
Цитирую Вероника:
Может ли быть вычислена по систематической выборке дисперсия оценки?


Какой именно оценки? Дисперсия средней, например, - это дисперсия переменной делить на n. Вообще, таким вопросом не задавался. А что гугл говорит?
Цитировать
 
 
0 #15 RE: Дисперсия, стандартное отклонение, коэффициент вариацииВероника 29.09.2012 11:07
Может ли быть вычислена по систематической выборке дисперсия оценки?
Цитировать
 
 
0 #14 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 12.08.2012 19:11
Цитирую Вероника:
Спасибо большое. Все понятно :roll:

Всегда пожалуйста
Цитировать
 
 
0 #13 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 12.08.2012 19:08
Цитирую Валерия:
Добрый день! Пытаюсь самостоятельно разобраться в матстатистике...благодаря вашему блогу у меня это получается! Очень доходчиво, наглядно и просто! Спасибо большое!!!

Рад помочь. Приходите еще )))
Цитировать
 
 
0 #12 RE: Дисперсия, стандартное отклонение, коэффициент вариацииВероника 06.08.2012 20:05
Спасибо большое. Все понятно :roll:
Цитировать
 
 
+1 #11 RE: Дисперсия, стандартное отклонение, коэффициент вариацииВалерия 28.07.2012 09:13
Добрый день! Пытаюсь самостоятельно разобраться в матстатистике...благодаря вашему блогу у меня это получается! Очень доходчиво, наглядно и просто! Спасибо большое!!!
Цитировать
 
 
+3 #10 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 26.03.2012 13:48
Айвазяна внимательно не изучал. Насколько я помню, там чистая математика - понимается с трудом. А вот есть хорошие учебники. Рекомендую по статистике учебник Елисеевой, ее же и по эконометрике. Также по эконометрике есть автор Доугерти ("введение в эконометрику"). Очень наглядно пишут.
Цитировать
 
 
0 #9 RE: Дисперсия, стандартное отклонение, коэффициент вариацииnub 26.03.2012 12:52
Цитирую Administrator:
А где вы учитесь, что вам препод не смог ответить на вопросы? По какому учебнику?

Наверное, правильнее будет сказать - не захотел (я пропустил семестр). Учусь в стредненьком российском вузе. :)
Предметом начал заниматься в январе, использовал Айвазяна, по сути, самостоятельно (от того наверное все и перемешалось).
Спасибо за потраченное время!
Цитировать
 
 
+3 #8 RE: Дисперсия, стандартное отклонение, коэффициент вариацииAdministrator 26.03.2012 08:16
Как-то у вас все перемешалось в кучу.
Несмещенность оценок, степени свободы используются для коррекции расчетов с учетом ошибок выборочного наблюдения. Если мы определили, что при расчете коэффициента корреляции нет разницы в выборе дисперсии (смещенной или несмещенной), это не значит, что для всего эконометрическо го анализа тоже нет разницы при выборе показателя. Полно других видов статанализа, где есть разница.
Особенность использования несмещенных оценок и степеней свободы такова, что с ростом объема выборки их значение падает. При выборке в 11 значений разница между выборочной и генеральной дисперсией составляет 10%, при выборке в 21 значений – уже 5%, при 30 значениях – 3%. Это все теория.
Теперь практика. Как вы заметили, все подобные методы основываются на предположении о нормальности распределения данных. Так вот в практике экономического анализа это почти никогда не выполняется. Одно это условие ставит крест на многих методах. Есть и другие условия, которые тоже не выполняются. Поэтому на практике чаще находят применение более простые статистические методы.
А где вы учитесь, что вам препод не смог ответить на вопросы? По какому учебнику?
Цитировать
 
 
+1 #7 RE: Дисперсия, стандартное отклонение, коэффициент вариацииnub 25.03.2012 12:54
Цитирую Автор блога:
Освежил память полезной книгой. В общем, такой расклад. Если мы используем несмещенные оценки дисперсии, то корреляция не получается заниженной, так как при расчете коэф. коррел. мы также используем несмещенную оценку ковариации. Короче, в числителе и в знаменателе (расчета r) мы имеем n/n-1, которые сокращаются и корреляция получается нормальной, а не заниженной. В этом и была ошибка в рассуждении. Надеюсь, понятно написал.

В таком случае, какова необходимость введения понятия "числа степеней свободы", понятия "общей" и "выборочной" дисперсий (и ковариаций), если для эконометрическо го анализа, а именно, этапа проведения Корреляционного анализа, матрица коэффициентов корреляции будет одной и той же - независимо от того, какой именно дисперсией и ковариацией мы пользовались, мы всегда получаем одни и те же оценки. Следовательно, все наши дальнейшие выводы относительно СТСС (степени тесноты статистической связи), точечные и интервальные оценки никак не будут зависеть от выбора числа степеней свободы. Иными словами, вопрос такой: доводилось ли вам на практике иметь дело с числом степеней свободы? Для чего вообще тогда они нужны? Имеют ли значение введенные понятия "общая" и "выборочная" дисперсия (ковариация) практическое значение? (Я лично пытался найти этот ответ самостоятельно в интернете, спрашивал преподавателя, но пока больше вопросов, чем ответов)
Цитировать
 
 
+1 #6 Автор блога 23.03.2012 20:34
Цитирую nub:
Второй вопрос следует из первого. Допустим мы нашли "несмещенные" дисперсии двух величин. В результате, получаем коэффициент линейной корреляции, который уже будет несколько занижен

Освежил память полезной книгой. В общем, такой расклад. Если мы используем несмещенные оценки дисперсии, то корреляция не получается заниженной, так как при расчете коэф. коррел. мы также используем несмещенную оценку ковариации. Короче, в числителе и в знаменателе (расчета r) мы имеем n/n-1, которые сокращаются и корреляция получается нормальной, а не заниженной. В этом и была ошибка в рассуждении. Надеюсь, понятно написал.
Цитировать
 
 
+1 #5 Автор блога 23.03.2012 14:22
Цитирую nub:
Вопрос: правомерно ли в данном случае, при расчете t-статистики в формуле использовать те же n-2 (стандартная формула коэффициента Стьюдента содержит n-2 под корнем) свободы?
Спасибо.

Над этим вопросом сам никогда не задумывался. Чтобы не вводить в заблуждение, подумаю и отпишусь позже
Цитировать
 
 
+1 #4 Автор блога 23.03.2012 13:34
Цитирую nub:
Правильно ли я понимаю, что "завышение" дисперсии дает нам некий "запас", когда при переходе от одной совокупности к следующей, мы гарантированно статистически значимый (с т.з. оценки несмещенности) показатель дисперсии?

Здравствуйте. Понимаете правильно, да. Выборка всегда дает ошибочный результат относительно генеральной совокупности, в том числе и по дисперсии. Поэтому в качестве перестраховки ее увеличивают.
Цитировать
 
 
+1 #3 nub 23.03.2012 11:21
Цитирую nub:
...использовать те же n-2 (стандартная формула коэффициента Стьюдента содержит n-2 под корнем) свободы?
Спасибо.
степеней свободны
Цитировать
 
 
+1 #2 nub 23.03.2012 11:19
Второй вопрос следует из первого. Допустим мы нашли "несмещенные" дисперсии двух величин. В результате, получаем коэффициент линейной корреляции, который уже будет несколько занижен (что гарантирует нам, что степень тесноты связи между величинами не будет "завышена"). Мы хотим оценить полученный коэффициент с помощью t-статистики. Вопрос: правомерно ли в данном случае, при расчете t-статистики в формуле использовать те же n-2 (стандартная формула коэффициента Стьюдента содержит n-2 под корнем) свободы?
Спасибо.
Цитировать
 
 
+1 #1 nub 23.03.2012 11:12
Здраствуйте! Возможно, ошибся темой, но поскольку дошел до дисперсии миновав тему о качестве средней величины, задам вопрос здесь (судя по недавним ответам, сайт вы наполняете, поэтому незамеченым вопрос не останется).
Вопрос о "степенях свободы". Собственно, приведенная формула для расчета дисперсии характерна для расчета т.н. "общей дисперсии". Но на глаза очень часто попадается понятие "выборочной" дисперсии, для которой числитель (размер выборки) уменьшен на единицу (и в этом случае, в западных источниках любят говорить, о несмещенной оценке дисперсии). Правильно ли я понимаю, что "завышение" дисперсии дает нам некий "запас", когда при переходе от одной совокупности к следующей, мы гарантированно статистически значимый (с т.з. оценки несмещенности) показатель дисперсии?
Цитировать
 

Добавить комментарий


Защитный код
Обновить

Подписка на обновления

 

Книги по статистике и анализу данных

biblioteka free 1

 

 

Ознакомиться с фондом и получить бесплатный доступ

 

Авторизация

Для добавления комментария авторизация НЕобязательна.



Поиск по сайту

Яндекс.Метрика Счетчик тИЦ и PR