Статистические критерии для оценки энтропии
Получение случайной последовательности. Критерии, используемые для проверки последовательности на случайность. Проверка по критерию "хи-квадрат". Квадраты разностей между полученным количеством чисел n и "эталонным". Установление доверительного интервала.
Рубрика | Экономико-математическое моделирование |
Вид | статья |
Язык | русский |
Дата добавления | 03.03.2018 |
Размер файла | 138,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Научно-образовательный центр «Современные системы обучения»
Статистические критерии для оценки энтропии
Ставер Елена Владимировна
магистрант физико-математических наук
Моя основная цель - получить случайную последовательность. Можно сделать период последовательности длинным и при практических применениях он не будет повторяться [1]. Это важный критерий, но нет гарантии того, что последовательность будет использоваться в реальных приложениях.
Теоретическая статистика предоставляет количественные меры случайности. Существует теоретически бесконечное число критериев, которые можно использовать для проверки последовательности на случайность.
Если критерии T1, T2,…Tn подтверждают, что последовательность ведет себя случайным образом, это еще не означает, что проверка Tn+1-го критерия будет успешной [1]. Но каждая успешная проверка дает все больше уверенности в случайности последовательности. Обычно к последовательности применяется множество статистических критериев, и если она удовлетворяет этим критериям, то последовательность считается случайной.
Критерий на равномерное распределение
Этот критерий является важным методом проверки качества линейных конгруэнтных ГСЧ [1]. Испытанием для проверки случайности будет последовательность, связанная со свойствами распределений t последовательных элементов последовательности. Если задана последовательность Un с периодом m, то для построения критерия необходимо изучить множество всех m точек
{(Un,Un+1, … Un+t-1) | 0 ?n?m} (1)
в t-мерном пространстве. Задана линейная конгруэнтная последовательность {Хо, а, с, m) с максимальным периодом длиной. В последнем случае прибавляется точка (0, 0, ...,0) к множеству (1), чтобы всегда было ровно m точек. При таком предположении (1) переписываем выражение:
(2)
Представляет собой элемент, следующий за x. Здесь рассматривается лишь множество всех таких точек в t-мерном пространстве, а не порядок, в котором они генерируются.
Критерий перестановок
Выборка является равномерно распределенной, после перемешивания она должна удовлетворять начальным критериям. Ожидается, что первоначальная оценка результатов будет основываться на «перемешанных» выборках, так как результаты, полученные на оригинальной выборке, либо необычайно высоки, либо низки, т.е. являются неточными [1]. Если выборка не является равномерно распределенной, то некоторые оценочные результаты могут сильно отличаться на оригинальной и «перемешанной» выборке.
Проверка по критерию «хи-квадрат»
Критерий «хи-квадрат» -- является важным методом, который используется наряду с другими критериями. Для моего случая проверка по данному критерию позволяет узнать, насколько созданный мной реальный ГСЧ будет удовлетворять требованию равномерного распределения [1].
Частотная диаграмма реального ГСЧ представлена на рисунке 1. Закон распределения эталонного ГСЧ равномерный, то вероятность pi попадания чисел в i-ый интервал равна pi = 1/k. В каждый из k интервалов попадет ровно по pi · N чисел.
Рис. 1. Частотная диаграмма реального ГСЧ
Реальный ГСЧ будет генерировать числа, распределенные по k интервалам, и в интервал попадет по ni чисел [1]. Нужно рассмотреть квадраты разностей между полученным количеством чисел ni и «эталонным» pi · N. Слаживая их, в результате получим:
ч2эксп. = (n1 - p1 · N)2 + (n2 - p2 · N)2 + … + (nk - pk · N)2.
Чем меньше разность в каждом из слагаемых, тем сильнее закон распределения случайных чисел, генерируемых реальным ГСЧ, тяготеет к равномерному [1]. В предыдущем выражении каждому из слагаемых приписывается одинаковый вес; для статистики «хи-квадрат» необходимо провести нормировку каждого i-го слагаемого, поделив его на pi · N:
Наконец, полученное выражение более компактное уравнение:
Так можно получить значение критерия «хи-квадрат» для экспериментальных данных.
Приемлемым считают p от 10% до 90%.
Если ч2эксп. больше ч2теор., то генератор не удовлетворяет требованию равномерного распределения, так как полученные значения ni очень отличаются от теоретически допустимых pi · N и не могут рассматриваться как случайные [1]. Устанавливается большой доверительный интервал, в котором ограничения на числа становятся очень нежесткими, требования к числам -- слабыми. При этом будет наблюдаться очень большая абсолютная погрешность.
Литература
случайный последовательность квадрат интервал
1. http://csrc.nist.gov/publications/PubsSPs.html «DRAFT - SP800-90b».
Размещено на Allbest.ru
...Подобные документы
Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.
лабораторная работа [234,7 K], добавлен 28.02.2010Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Анализ упорядоченных данных, полученных последовательно (во времени). Модели компонентов детерминированной составляющей временного ряда. Свободные от закона распределения критерии проверки ряда на случайность. Теоретический анализ системы линейного вида.
учебное пособие [459,3 K], добавлен 19.03.2011Понятие доверительного интервала и доверительной вероятности. Доверительный интервал для математического ожидания (пример задачи). Распределение Стьюдента. Принятие решения о параметрах генеральной совокупности, проверка статистической гипотезы.
реферат [64,9 K], добавлен 15.02.2011Понятия доверительного интервала и доверительной вероятности и их применение в эконометрических задачах. Доверительный интервал для математического ожидания нормальной случайной величины при известной и при неизвестной дисперсии, генеральная совокупность.
реферат [2,0 M], добавлен 12.12.2009Построение корреляционной матрицы. Проведение теста на наличие мультиколлинеарности. Расчет частного коэффициента эластичности для прогноза экономических процессов. Расчет доверительного интервала. F-статистика Фишера проверки модели на адекватность.
контрольная работа [1,7 M], добавлен 09.07.2014Определение формы связи между связи между факторным признаком (производственными затратами) и результативным (окупаемостью затрат). Расчет коэффициентов регрессии, корреляции, детерминации, эластичности, доверительного интервала прогноза окупаемости.
курсовая работа [67,0 K], добавлен 10.12.2013Статистические методы анализа одномерных временных рядов, решение задач по анализу и прогнозированию, построение графика исследуемого показателя. Критерии выявления компонент рядов, проверка гипотезы о случайности ряда и значения стандартных ошибок.
контрольная работа [325,2 K], добавлен 13.08.2010Оценка связанностей между экономическими показателями на основе специальных статистических подходов. Составление графиков корреляционных полей на основе точечной диаграммы. Построение доверительного интервала для линейного коэффициента парной корреляции.
лабораторная работа [88,8 K], добавлен 28.02.2014Основы математического моделирования детерминированных и стохастических объектов. Идентификация объектов управления по переходной характеристике. Получение модели методом множественной линейной регрессии и проверка ее адекватности по критерию Фишера.
курсовая работа [1,1 M], добавлен 14.10.2014Сбор данных и их первичная обработка. Построение корреляционной матрицы. Связь между факторными и результативными признаками. Оценка статистической значимости параметров регрессии. Определение доверительного интервала параметров доверительной регрессии.
курсовая работа [739,0 K], добавлен 06.04.2016Нахождение последовательности многочленов, нахождение их суммы и произведения. Вычисление суммы и среднего арифметического данного ряда чисел, нахождение минимального и максимального числа. Определение цены реализации товара в точке безубыточности.
контрольная работа [178,7 K], добавлен 06.11.2009Определение количественной зависимости массы пушного зверька от его возраста. Построение уравнения парной регрессии, расчет его параметров и проверка адекватности. Оценка статистической значимости параметров регрессии, расчет их доверительного интервала.
лабораторная работа [100,5 K], добавлен 02.06.2014Общие понятия статистической проверки гипотез. Проверка гипотез на основе выборочной информации, понятие нулевая и альтернативная гипотезы. Формулировка общего алгоритма проверки. Проведение проверки статистической гипотезы в системе "Minitab" и MS Excel.
методичка [741,9 K], добавлен 28.12.2008Машинное представление очереди и реализация операций. Исходный код программы, демонстрирующей процесс функционирования очереди FIFO. Работа данной очереди на примере последовательности натуральных чисел, которые сначала добавлялись, а затем удалялись.
лабораторная работа [382,1 K], добавлен 19.01.2015Статистический анализ экспериментальных данных. Использование критериев согласия для средних и для дисперсий, согласия относительно долей. Критерии для сравнения распределений численностей, проверки случайности и оценки резко выделяющихся наблюдений.
контрольная работа [256,0 K], добавлен 20.08.2015Построение анализа случайной компоненты для проверки адекватности выбранных моделей реальному процессу (в частности, адекватности полученной кривой роста). Оценка параметров модели в условиях автокорреляции и определение критерия автокорреляции.
контрольная работа [44,0 K], добавлен 13.08.2010Построение уравнения множественной регрессии в линейной форме с полным набором факторов, отбор информативных факторов. Проверка значимости уравнения регрессии по критерию Фишера и статистической значимости параметров регрессии по критерию Стьюдента.
лабораторная работа [217,9 K], добавлен 17.10.2009Построение доверительного интервала для коэффициента регрессии. Определение ошибки аппроксимации, индекса корреляции и F-критерия Фишера. Оценка эластичности изменения материалоемкости продукции. Построение линейного уравнения множественной регрессии.
контрольная работа [250,5 K], добавлен 11.04.2015Зависимости, выявленные в результате анализа двумерных распределений. Статистические критерии для таблиц сопряженности. Коэффициенты Спирмена и Кендела. Коэффициент парной корреляции по Пирсону. Порядок расчета двумерного распределения в пакете ОСА.
презентация [232,3 K], добавлен 09.10.2013