Построение математических диаграмм (Исикавы, Парето)
Причинно-следственная диаграмма (диаграмма Исикавы). Методика построения гистограммы. Диаграмма Парето и ее характеристика. Сигнальные признаки на контрольной карте, при которых следует производить коррекцию процесса. Нижний, средний и верхний квартили.
Рубрика | Математика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 13.11.2017 |
Размер файла | 963,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
1. Теоретические сведения
1.1 Причинно-следственная диаграмма (диаграмма Исикавы)
1.2 Гистограмма
1.2.1 Методика построения диаграммы
1.3 Диаграмма Парето
1.3.1 Методика построения
1.4 Контрольные карты
1.4.1 Методика построения контрольных карт
1.4.2 Сигнальные признаки на контрольной карте, при которых следует производить коррекцию процесса
1.5 Дисперсионный и корреляционный анализ
1.5.1 Однофакторный дисперсионный анализ
1.5.2 Корреляционный анализ
1.6 Перцентиль. Нижний, средний и верхний квартили
2. Практическая часть
2.1 Задание 1
2.2 Задание 2
2.3 Задание 3
2.4 Задание 4
2.5 Задание 5
2.6 Задание 6
1. Теоретические сведения
исикава гистограмма контрольный квартиль
1.1 Причинно-следственная диаграмма (диаграмма Исикавы)
Диаграмма служит для графического изображения взаимосвязи показателя качества продукции со всеми возможными причинами. Основная цель диаграммы - выявить влияние причин на всех уровнях технологического процесса. Главным достоинством ее, является то, что она дает наглядное представление не только о тех факторах, которые влияют на изучаемый объект, но и о причинно-следственных связях этих факторов (что особенно важно). Эту диаграмму из-за ее формы часто называют «рыбьей костью» или «рыбьим скелетом».
При вычерчивании схемы Исикавы следует выбрать один показатель качества или одно из следствий, которые необходимо проконтролировать, и поместить его справа в конце горизонтальной линии. Основные группы причин распределяются тогда как рыбий скелет, отдельные причины стрелками указывают на основную причину (подводят большие первичные стрелки, обозначающие главные факторы, влияющие на объект анализа).
Далее к каждой первичной стрелке необходимо подвести стрелки второго порядка, к которым, в свою очередь подводят стрелки третьего порядка и т. д. до тех пор, пока на диаграмму не будут нанесены все стрелки, обозначающие факторы, оказывающие заметное влияние на объект анализа в конкретной ситуации. Каждая из стрелок, нанесенная на схему, должна представлять собой в зависимости от ее положения либо причину, либо следствие: предыдущая стрелка по отношению к последующей всегда выступает как причина, а последующая как следствие. В каждую границу факторов включаются конкретные причины, которые можно проконтролировать и принять мероприятия по их устранению. Принцип построения схемы Исикавы показан на рисунке 1.
Рисунок 1
При рассмотрении схемы на уровне первичных стрелок факторов во многих реальных ситуациях можно воспользоваться предложенным самим Исикавой правилом «шести М» (правило расширено). Оно состоит в том, что в общем случае существуют следующие шесть возможных причин тех или иных результатов: материал (material), оборудование (machine), измерение (measurement), метод (method), люди (man), менеджмент (management). Все эти слова по-английски начинаются с буквы «М», откуда и пошло название данного правила. Разумеется, могут быть и другие факторы, более точно характеризующие объект анализа. Главное - необходимо обеспечить правильную соподчиненность и взаимозависимость факторов, а также четкое оформление схемы, чтобы она хорошо смотрелась и легко читалась. Поэтому, независимо от наклона каждого фактора, его наименование всегда располагают в горизонтальном положении, параллельно центральной оси.
При построении диаграммы причин и результатов причины лучше объединять, рассматривая их в последовательности: от «мелких костей» к «средним» и от «средних» к «большим». С помощью схемы Исикавы можно не только определить состав и взаимозависимость факторов, влияющих на объект анализа, но и выявить относительную значимость этих факторов. После завершения построения диаграммы следующий шаг - распределение факторов по степени их важности. Не обязательно все факторы, включенные в диаграмму, будут оказывать сильное влияние на показатель качества.
Диаграмма Исикавы составляется группой или по методу мозгового штурма. С помощью схемы Исикавы необходимо выявить относительную значимость факторов, влияющих на объект анализа: каждому участнику группы, независимо от других членов, необходимо из полного состава факторов, указанных в схеме отобрать те, которые, по его мнению, оказывают наибольшее влияние на объект анализа в данной конкретной ситуации. Оценку можно производить путем раздачи баллов. В число таких факторов не должны включаться первичные стрелки-факторы и те стрелки-факторы второго порядка, к которым присоединено несколько стрелок-факторов третьего порядка.
Затем следует провести совместное обсуждение мнений участников анализа. В случае расхождения мнений относительно факторов, проводится второй тур определения значимости факторов, в ходе которого каждый член группы качества вновь, независимо от других, устанавливает на личном экземпляре схемы наиболее значимые факторы. Внимание необходимо сконцентрировать на тех стрелках-факторах, которые в конечном итоге получили наибольшее количество отметок.
Для исследования причин явления допустимо использовать и третьих лиц, не имеющих непосредственного отношения к работе, так как у них может оказаться неожиданный подход к выявлению и анализу причин, которого могут не заметить лица, привлеченные к данной рабочей обстановке.
При составлении причинно-следственной диаграммы последней стрелкой среди причин обязательно следует обозначить и «прочие», так как всегда могут остаться неучтенные факторы.
На диаграмму необходимо нанести всю информацию: ее название, наименование изделия, процесса или группы процессов, имена участников процесса и т.д. Необходимо на каждый показатель качества строить свою диаграмму причин и результатов. Попытка включить все в одну диаграмму приведет к тому, что она окажется большой и сложной, практически бесполезной, что только затрудняет процесс принятия решений.
Формулировка показателя качества должна быть краткой и четкой, иначе если показатель будет сформулирован не конкретно, то будет построена диаграмма, основанная на общих соображениях. Такая диаграмма не даст результатов при решении конкретных проблем.
При анализе причин часто приходится пользоваться другими статистическими методами и, прежде всего - методом расслоения. Полезно использовать для решения проблем диаграмму Парето в сочетании с причинно-следственной диаграммой. Диаграмма Исикавы должна служить основой для составления плана взаимоувязанных мероприятий, обеспечивающих комплексное решение задачи.
1.2 Гистограмма
Гистограмма - инструмент, который позволяет наглядно изобразить и легко выявить структуру и характер изменения полученных данных (оценить распределение), которые трудно заметить при их табличном представлении.
Проведя анализ формы полученной гистограммы и ее местоположения относительно интервала допуска можно сделать заключение о качестве рассматриваемой продукции или состоянии изучаемого процесса. На основе заключения вырабатываются меры по устранению отклонений качества продукции или состояния процесса от нормы.
1.2.1 Методика построения диаграммы
1) Полученные данные сведите в один документ в удобном для дальнейшей обработки виде (например, в виде таблицы).
2) Вычислите диапазон значений показателя (выборочный размах) по формуле:
(1)
где xmax - наибольшее полученное значение,
xmin - наименьшее полученное значении.
3) Определите количество интервалов гистограммы.
Для этого можно воспользоваться таблицей (рисунок 2), рассчитанной на основе формулы Стерджесса:
(2)
Рисунок 2
Можно также воспользоваться таблицей(рисунок 3), рассчитанной на основе формулы:
(3)
Рисунок 3
4) Определите ширину (размер) интервалов по формуле:
(4)
Округлите полученный результат в большую сторону до удобного значения.Обратите внимание, что вся выборка должна быть разделена на интервалы одинакового размера.
5) Определите границы интервалов. Сначала определите нижнюю границу первого интервала таким образом, чтобы она была меньше xmin. К ней прибавьте ширину интервала, чтобы получить границу между первым и вторым интервалами. Далее продолжайте прибавлять ширину интервала (Н) к предыдущему значению для получения второй границы, затем третьей и т. д. После произведенных действий следует удостовериться, что верхняя граница последнего интервала больше xmax.
6) Для выбранных интервалов подсчитайте частоты попадания значений исследуемого показателя в каждый интервал. Если значение показателя точно соответствует границе интервала, то добавьте по половинке обоим интервалам, на границу которых попало значение показателя.
7) Вычислите среднее значение исследуемого показателя по формуле:
(5)
8) На горизонтальную ось нанесите границы выбранных интервалов. Для удобства восприятия рекомендуется перед первым и после последнего интервалов оставить место размером не менее одного интервала. Также необходимо предусмотреть место для нанесения границ допуска, если он есть. Если в дальнейшем планируется сравнивать гистограммы, описывающие похожие факторы или характеристики, то стоит при нанесении шкалы на ось абсцисс руководствоваться не интервалами, а единицами измерения данных.
9) На вертикальную ось нанесите шкалу значений в соответствии с выбранным масштабом и диапазоном.
10) Для каждого выбранного интервала постройте столбик (прямоугольник), ширина которого равна интервалу, а высота равна частоте попадания результатов наблюдений в соответствующий интервал (частота уже подсчитана ранее).
11) Нанесите на график линию, соответствующую среднему арифметическому значению исследуемого показателя. При наличии поля допуска постройте линии, соответствующие границам и центру интервала допуска.
12) Проведите анализ графика.
Анализ гистограммы также разбивается на 2 варианта, в зависимости от наличия технологического допуска.
I вариант. Допуски для показателя не заданы. В этом случае производим анализ формы гистограммы:
1) Обычная (симметричная, колоколообразная) форма. Среднее значение гистограммы соответствует середине размаха данных. Максимальная частота также приходится на середину и постепенно уменьшается к обоим концам. Форма симметричная.
Рисунок 4
Такая форма гистограммы встречается наиболее часто. Она свидетельствует о стабильности процесса.
2) Отрицательно скошенное распределение (положительно скошенное распределение). Среднее значение гистограммы располагается правее (левее) середины размаха данных. Частоты резко уменьшаются при движении от центра гистограммы вправо (влево) и медленно влево (вправо). Форма ассиметричная.
Рисунок 5
Такая форма образуется либо, если верхняя (нижняя) граница регулируется теоретически или по значению допуска либо, если правое (левое) значение невозможно достигнуть.
3) Распределение с обрывом справа (распределение с обрывом слева). Среднее значение гистограммы располагается далеко правее (левее) середины размаха данных. Частоты очень резко уменьшаются при движении от центра гистограммы вправо (влево) и медленно влево (вправо). Форма ассиметричная.
Рисунок 6
Такая форма часто встречается в ситуации 100 %-го контроля изделий по причине плохой воспроизводимости процесса.
4) Гребенка (мультимодальный тип). Интервалы через один или два обладают более низкими (высокими) частотами.
Рисунок 7
Такая форма образуется либо, если количество единичных наблюдений, входящих в интервал, колеблется от интервала к интервалу либо, если применяется определенное правило округления данных.
5) Гистограмма, не имеющая высокой центральной части (плато). Частоты в середине гистограммы примерно одинаковые (для плато все частоты примерно равны).
Рисунок 8
Такая форма встречается, если объединяется несколько распределений со средними значениями близко расположенными друг к другу. Для дальнейшего анализа рекомендуется применить метод стратификации.
6) Двухпиковый тип (бимодальный тип). В окрестностях середины гистограммы частота низкая, но с каждой стороны есть по пику частот.
Рисунок 9
Данная форма встречается, если объединяется два распределения со средними значениями, далеко отстоящими друг от друга. Для дальнейшего анализа рекомендуется применить метод стратификации.
7) Гистограмма с провалом (с «вырванным зубом»). Форма гистограммы близка к распределению обычного типа, но есть интервал с частотой ниже, чем в обоих соседних интервалах.
Рисунок 10
Данная форма встречается, если ширина интервала не кратна единице измерения, если неправильно считаны показания шкалы и др.
8) Распределение с изолированным пиком. Совместно с обычной формой гистограммы появляется небольшой изолированный пик.
Рисунок 11
Такая форма образуется при включении небольшого количества данных из
другого распределения, например, если нарушена управляемость процесса, произошли ошибки при измерении или произошло включение данных из другого процесса.
II вариант. Для исследуемого показателя существует технологический допуск. В этом случае производится анализ, как формы гистограммы, так и ее расположение по отношению к полю допуска. Возможны варианты:
1) Гистограмма имеет вид обычного распределения. Среднее значение гистограммы совпадает с центром поля допуска. Ширина гистограммы меньше ширины поля допуска с запасом.
Рисунок 12
2) Гистограмма имеет вид обычного распределения. Среднее значение гистограммы совпадает с центром поля допуска. Ширина гистограммы равна ширине интервала допуска, в связи с чем возникают опасения появления некондиционных деталей как со стороны верхнего, так и со стороны нижнего полей допуска.
Рисунок 13
В этом случае необходимо либо рассмотреть возможность изменения технологического процесса с целью уменьшения ширины гистограммы (например, увеличение точности оборудования, использование более качественных материалов, изменение условий обработки изделий и т.д.) либо расширить поле допуска, т.к. требования к качеству деталей в данном случае трудновыполнимы.
3) Гистограмма имеет вид обычного распределения. Среднее значение гистограммы совпадает с центром поля допуска. Ширина гистограммы больше ширины интервала допуска, в связи с чем обнаруживаются некондиционные детали как со стороны верхнего, так и со стороны нижнего полей допуска.
Рисунок 14
В этом случае необходимо реализовать меры, описанные в пункте 2.
4) Гистограмма имеет вид обычного распределения. Ширина гистограммы меньше ширины поля допуска с запасом. Среднее значение гистограммы сдвинуто влево (вправо) относительно центра интервала допуска, в связи с чем имеются опасения, что могут находится некондиционные детали со стороны нижней (верхней) границы поля допуска.
Рисунок 15
В данной ситуации необходимо проверить, не вносят ли систематическую ошибку применяемые средства измерения. Если средства измерения исправны, следует отрегулировать процесс таким образом, чтобы центр гистограммы совпал с центром поля допуска.
5) Гистограмма имеет вид обычного распределения. Ширина гистограммы примерно равна ширине поля допуска. Среднее значение гистограммы сдвинуто влево (вправо) относительно центра интервала допуска, причем один или несколько интервалов выходят за границу поля допуска, что свидетельствует о наличии дефектных деталей.
Рисунок 16
В этом случае первоначально необходимо отрегулировать технологические операции таким образом, чтобы центр гистограммы совпадал с центром поля допуска. После этого нужно принять меры для уменьшения размаха гистограммы или увеличения размера интервала допуска.
6) Центр гистограммы смещен к верхнему (нижнему) пределу допуска, причем правая (левая) сторона гистограммы рядом с верхней (нижней) границей допуска имеет резкий обрыв.
Рисунок 17
В этом случае можно сделать вывод, что изделия со значением показателя, выходящим за пределы поля допуска, исключили из партии или умышленно распределили как годные, для включения в пределы допуска. Следовательно, необходимо выявить причину, которая привела к появлению данного явления.
7) Центр гистограммы смещен к верхнему (нижнему) пределу допуска, причем правая (левая) сторона гистограммы рядом с верхней (нижней) границей допуска имеет резкий обрыв. Кроме того один или несколько интервалов выходят за границы поля допуска.
Рисунок 18
Случай аналогичен 6, но интервалы гистограммы, выходящие за границы поля допуска указывают на то, что измерительное средство было неисправно. В связи с эти необходимо провести поверку средств измерения, а также провести повторный инструктаж работникам по правилам выполнения измерений.
8) Гистограмма имеет два пика, хотя измерение значений показателя проводилось у изделий из одной партии.
Рисунок 19
В этом случае можно сделать вывод, что изделия были получены в разных условиях (например, использовались материалы разных сортов, изменялась настройка оборудования, изделия производились на разных станках и т.д.). В связи с этим для дальнейшего анализа рекомендуется применить метод стратификации.
9) Основные характеристики гистограммы в порядке (соответствуют случаю 1.), при этом имеются дефектные изделия со значениями показателя, выходящими за пределы поля допуска, которые образуют обособленный «островок» (изолированный пик).
Рисунок 20
Данная ситуация могла возникнуть в результате небрежности, при которой дефектные детали были перемешаны с доброкачественными. В этом случае необходимо выявить причины и обстоятельства, приводящие к возникновению данной ситуации, а также принять меры к их устранению.
1.3 Диаграмма Парето
Диаграмма Парето - инструмент, позволяющий разделить факторы, влияющие на возникшую проблему, на важные и несущественные для распределения усилий по ее решению.
Сама диаграмма является разновидностью столбчатого графика с кумулятивной кривой, в которой факторы распределены в порядке уменьшения значимости (силы влияния на объект анализа).
В основе диаграммы Парето лежит принцип 80/20, согласно которому 20% причин приводят к 80% проблем, поэтому целью построения диаграммы является выявление этих причин для концентрации усилий по их устранению.
На самом деле принцип 80/20 основан на утверждении, что диспропорция является неотъемлемым свойством соотношения между причинами и следствием, вкладываемым усилиям и получаемым результатом. Сам дисбаланс не обязательно равен 80/20, он может составлять 70/30, 75/25, 95/5 и даже близок к 50/50 (хоть и очень редко), но диспропорция 80/20 встречается намного чаще других соотношений, поэтому она и положена в основу диаграммы Парето.
1.3.1 Методика построения
1) Определите проблему для исследования, выполните сбор данных (влияющих факторов) для анализа. В случае использования диаграммы Исикавы определите и проставьте коэффициенты значимости (степень влияния на проблему) для каждого фактора. Для сбора данных могут использоваться контрольные листки, журналы регистрации данных, диаграмма Исикавы.
2) Распределите факторы в порядке убывания коэффициента значимости. Вычислите итоговую сумму значимости факторов путем арифметического сложения коэффициентов значимости всех рассматриваемых факторов. Коэффициенты значимости для каждой группы путем арифметического суммирования коэффициентов значимости факторов, входящих в группу.
3) Начертите горизонтальную ось. Проведите две вертикальные оси: на левой и правой границе горизонтальной оси.
4) Горизонтальную ось разделите на интервалы в соответствии с количеством контролируемых факторов (групп факторов).
5) Левую вертикальную ось разбейте на интервалы от 0 до числа, соответствующего итоговой сумме значимости факторов.
6) Правую вертикальную ось разбейте на интервалы от 0 до 100%. При этом отметка 100% должна лежать на такой же высоте, что и итоговая сумма значимости факторов.
7) Для каждого фактора (группы факторов) постройте столбик, высота которого равна коэффициенту значимости для этого фактора. При этом факторы
8) (группы факторов) располагаются в порядке уменьшения их значимости, а группа «прочие» помещается последней, независимо от ее коэффициента значимости.
9) Постройте кумулятивную кривую. Для этого нанесите на диаграмму точки накопленных сумм для каждого интервала. Положение точки соответствует: по горизонтали - правой границе интервала, по вертикали - величине суммы коэффициентов значений факторов (групп факторов), лежащих левее рассматриваемой границы интервала. Соедините полученные точки отрезками прямых.
10) На уровне 80% итоговой суммы проведите горизонтальную линию от правой оси диаграммы до кумулятивной кривой. Из точки пересечения опустите перпендикуляр на горизонтальную ось. Этот перпендикуляр разделяет факторы (группы факторов) на значимые (располагаются слева) и незначительные (располагаются справа).
Рекомендуется использовать различные методы классификации факторов и составлять для них множество диаграмм Парето для выявления как можно меньшего количества первоочередных факторов.
10)Выпишите значимые факторы для принятия первоочередных мер. Факторы, которые легко скорректировать рекомендуется устранять незамедлительно, даже, если они не вошли в список первоочередных для принятия мер.
1.4 Контрольные карты
Контрольные карты (контрольные карты Шухарта) - инструмент, позволяющий отслеживать изменение показателя качества во времени для определения стабильности технологического процесса, а также корректировки процесса для предотвращения выхода показателя качества за допустимые пределы.
Контрольные карты делятся на два вида:
1) для контроля непрерывных величин:
· x - карта контроля измеряемых значений;
· карта контроля средних значений и среднеквадратичных отклонений;
· - карта контроля средних значений и размахов;
· - карта контроля медиан и среднеквадратичных отклонений;
· - карта контроля медиан и размахов;
2) для контроля дискретных величин:
· p - карта контроля доли неисправных изделий в выборке (применяются как при постоянном, так и при переменном объеме выборки);
· np - карта контроля числа неисправных изделий в выборке (применяются только при постоянном объеме выборки);
· с - карта контроля числа несоответствий в выборке (применяются только при постоянном объеме выборки);
· u - карта контроля числа несоответствий на одно изделие в выборке (применяются как при постоянном, так и при переменном объеме выборки).
1.4.1 Методика построения контрольных карт
Рассмотрим этапы построения контрольной карты на примере карты.
1) Сбор данных.
2) Вычисление средних арифметических значений xk для каждой k-й подгруппы наблюдаемых значений по следующей формуле
(6)
3) Вычисление общего среднего значения по всем имеющимся подгруппам данных по формуле:
(7)
4) Вычисление размаха R в каждой подгруппе путем вычитания минимального значения в подгруппе из максимального
(8)
5) Вычисление среднего арифметического значения размахов для всех подгрупп данных
(9)
6) Вычисление контрольных линий.
Вычислите значения, характеризующие положение каждой контрольной линии для X-карты и для R-карты по следующим формулам:
· X-карта -- Центральная линия (Central Line) CL = .
· Верхний контрольный предел (Upper Control Limit) UCL = + A2*R.
· Нижний контрольный предел (Lower Control Limit) LCL = -A2*R.
· R-карта -- Центральная линия CL = .
· Верхний контрольный предел (уровень) UCL = D4* .
· Нижний контрольный предел (уровень) LCL = D3* .
· Нижний предел не рассматривается, когда п < 7.
· Константы А2, D4, D3 -- коэффициенты, определяемые объемом подгрупп n,
7) Нанесение контрольных линий.
Нанесите слева вертикальные оси со значениями и R и горизонтальные оси с номерами подгрупп. Затем обозначить верхную USL и нижную LSL границы допуска и центральную линию CL.
8) Нанесение точек.
Выбрать и разметить масштабы по осям и R, а по каждой горизонтальной оси нанести номера подгрупп.
Теперь необходимо проанализировать полученную контрольную карту. Если процесс стабилен, т.е находится в контролируемом состоянии, то вносить какие-либо изменения в процесс не требуется. Контролируемое состояние объекта -- это такое состояние, когда процесс стабилен, а его среднее значение и разброс данных (размах R) не меняются (остаются близкими к и R , т. е. не выходят за пределы верхнего UCL и нижнего LCL контрольных уровней). Дестабилизация процесса определяется по специальным сигнальным признакам.
1.4.2 Сигнальные признаки на контрольной карте, при которых следует производить коррекцию процесса
Предварительно необходимо разделить интервалы между центральной линией и нижним контрольным пределом, а также центральной линией и верхним контрольным пределом на 3 равные части (Рисунок 21)
Рисунок 21
1) Одна или более точек вышли за контрольные пределы.
Рисунок 22
2) Серия из семи или более точек лежат с одной стороны от центральной линии.
Рисунок 23
Рисунок 24
Сюда же относят случаи, если не менее 10 из 11 точек или не менее 12 из 14 точек или не менее 16 из 20 точек лежат с одной стороны от центральной линии.
3) Серия из шести или более точек образуют непрерывно повышающуюся (понижающуюся) кривую.
Рисунок 25
4) Серия из четырнадцати или более, попеременно возрастающих и убывающих точек.
Рисунок 26
5) Точки образуют кривую с повторяющейся формой и примерно одинаковыми интервалами.
Рисунок 27
6) Две из трех последовательных точек лежат в крайней трети диапазона контрольных пределов.
Рисунок 28
7) Четыре из пяти точек подряд лежат с одной стороны от центральной линии и не попадают в центральную треть диапазона контрольных пределов.
Рисунок 29
8) Серия из восьми точек расположена с двух сторон от центральной линии, при этом ни одна точка не попадает в центральную треть диапазона контрольных пределов.
Рисунок 30
1.5 Дисперсионный и корреляционный анализ
1.5.1 Однофакторный дисперсионный анализ
Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак.
Дисперсионный анализ используется в тех случаях, когда есть в распоряжении три или более независимые выборки, полученные из одной генеральной совокупности путем изменения какого-либо независимого фактора.
Для этих выборок предполагают, что они имеют разные выборочные средние и одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли этот фактор существенное влияние на разброс выборочных средних или разброс является следствием случайностей, вызванных небольшими объемами выборок. Другими словами если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).
Пусть - - элемент () -выборки (), где - число выборок, - число данных в - выборке. Тогда - выборочное среднее - выборки определяется по формуле:
(10)
Общее среднее определяется по формуле:
, (11)
где .
Общее тождество дисперсионного анализа имеет вид:
, (12)
где - сумма квадратов отклонений выборочных средних от общего среднего (сумма квадратов отклонений между группами); - сумма квадратов отклонений наблюдаемых значений от выборочной средней (сумма квадратов отклонений внутри групп); - общая сумма квадратов отклонений наблюдаемых значений от общего среднего .
Расчет сумм этих квадратов отклонений осуществляется по следующим формулам:
; (13)
; (14)
. (15)
В качестве критерия необходимо воспользоваться критерием Фишера:
(16)
Если расчетное значение критерия Фишера будет меньше, чем табличное значение - нет оснований считать, что независимый фактор оказывает влияние на разброс средних значений (измерения статистически однородны), в противном случае, независимый фактор оказывает существенное влияние на разброс средних значений (измерения в группах статистически неоднородны) ( - уровень значимости, уровень риска, обычно для экономических задач ).
1.5.2 Корреляционный анализ
Корреляционный анализ - совокупность основанных на математической теории корреляции методов обнаружения корреляционной зависимости между двумя случайными признаками или факторами. Корреляционый анализ экспериментальных данных заключает в себе следующие основные практические приёмы:
1) построение корреляционного поля и составление корреляционной таблицы;
2) вычисление выборочных коэффициентов корреляции или корреляционного отношения;
3) проверка статистической гипотезы значимости связи.
Дальнейшее исследование заключается в установлении конкретного вида зависимости между величинами. Зависимость между тремя и большим числом случайных признаков или факторов изучается методами многомерного корреляционного анализа. (вычисление частных и множественных коэффициентов корреляции и корреляционных отношений).
Корреляционное поле и корреляционная таблица являются вспомогательными средствами при анализе выборочных данных. При нанесении на координатную плоскость выборочных точек получают корреляционное поле. По характеру расположения точек поля можно составить предварительное мнение о форме зависимости случайных величин (например, о том, что одна величина в среднем возрастает или убывает при возрастании другой). Для численной обработки результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке корреляционной таблицы приводятся численности гц; тех пар(х, у), компоненты которых попадают в соответствующие интервалы группировки по каждой переменной.
Предполагая длины интервалов группировки (по каждому из переменных) равными между собой, выбирают центры xi (соответственноyj) этих интервалов и числа nij в качестве основы для расчётов.
Коэффициент корреляции дает более точную информацию о характере и силе связи, чем картина корреляционного поля.
Коэффициент корреляции -- это величина, которая может варьировать в пределах от +1 до -1. В случае полной положительной корреляции этот коэффициент равен плюс 1, а при полной отрицательной -- минус 1. Корреляция считается сильной, если ее коэффициент выше 0,60; если же он превышает 0,90, то корреляция считается очень сильной.
Коэффициент корреляции Браве-Пирсона (r) -- это параметрический показатель, для вычисления которого сравнивают средние и стандартные отклонения результатов двух измерений. При этом используют формулу (у разных авторов она может выглядеть по-разному)
(17)
где УX*Y -- сумма произведений данных из каждой пары;
n-число пар;
-- средняя для данных переменной X;
-- средняя для данных переменной Y
Sx -- стандартное отклонение для распределения х;
Sy -- стандартное отклонение для распределения у
Коэффициент корреляции рангов Спирмена (rs) -- это непараметрический показатель, с помощью которого пытаются выявить связь между рангами соответственных величин в двух рядах измерений.
Этот коэффициент рассчитывать проще, однако результаты получаются менее точными, чем при использовании r. Это связано с тем, что при вычислении коэффициента Спирмена используют порядок следования данных, а не их количественные характеристики и интервалы между классами. Дело в том, что при использовании коэффициента корреляции рангов Спирмена (rs) проверяют только, будет ли ранжирование данных для какой-либо выборки таким же, как и в ряду других данных для этой выборки, попарно связанных с первыми. Если коэффициент близок к +1, то это означает, что оба ряда практически совпадают, а если этот коэффициент близок к -1, можно говорить о полной обратной зависимости.
Коэффициент rs вычисляют по формуле
(18)
где d -- разность между рангами сопряженных значений признаков (независимо от ее знака), а -- число пар.
Обычно этот непараметрический тест используется в тех случаях, когда нужно сделать какие-то выводы не столько об интервалах между данными, сколько об их рангах, а также тогда, когда кривые распределения слишком асимметричны и не позволяют использовать такие параметрические критерии, как коэффициент r (в этих случаях бывает необходимо превратить количественные данные в порядковые).
1.6 Перцентиль. Нижний, средний и верхний квартили
Перцентиль - одна из числовых характеристик распределения вероятностей; частный случай квантили. Перцентиль определяется как квантиль К р, соответствующая значениям р, равным j/100 для j=0, 1, 2, . . ., 99. Например, для нормального распределения . Для непрерывной строго монотонной функции распределения F(х) j -я Перцентиль представляет собой решение уравнения
(19)
j=0,1,2, . . ., 99. В математической. статистике перцентили дают хорошее представление о виде функции распределения. Перцентиль также называют процентилями, или центилями.
Квартиль - значение, ниже которого лежит часть распределения вероятностей случайной величины, кратная одной четвёртой (четверть, половина или три четверти) Центральное значение это медиана (второй или средний квартиль), другие называются нижним, или первым квартилем и верхним, или третьим квартилем т. е. Q1 соответствует тому значению, которое стоит в конце первой четверти упорядоченного по величине ряда, а Q3 соответствует концу третьей четверти этого ряда.
2. Практическая часть
2.1 Задание 1
Построить диаграмму Исикавы для показателей качества эффективности обучения
Причинно-следственная диаграмма представлена на рисунке 31.
Рисунок 31
2.2 Задание 2
Представить ряд данных в виде гистограммы, рассчитать статистические показатели распределения случайной величины и проанализировать результаты.
Измеренные данные емкости конденсаторов приведены на рисунке 32.
Рисунок 32
По этим данным построим гистограмму (рисунок 33).
Рисунок 33
Результаты группировки данных представлены на рисунке 34.
Рисунок 34
Вычисленные значения статистических показателей распределения представлены на рисунке 35.
Рисунок 35
Теперь проанализируем гистограмму. По форме она наиболее близка к мультимодальному типу (так называемая «гребенка»). Такая форма образуется либо, если количество единичных наблюдений, входящих в интервал, колеблется от интервала к интервалу либо, если применяется определенное правило округления данных. Исходя из этого, можно предположить, что исходные данные подчиняются равномерному закону распределения.
2.3 Задание 3
Построить диаграмму Парето и дать рекомендации на примере выявленных дефектов при изготовлении детали из стали 15ХСНД.
Данные для построения диаграммы Парето представлены в таблице 1.
Таблица 1
Тип дефекта |
Количество дефектов |
|
Дендритная ликвация |
251 |
|
Межкристаллические трещины |
213 |
|
Пористость |
164 |
|
Раковины |
119 |
|
Заусенцы |
82 |
|
Флокены |
59 |
|
Прочие |
35 |
По этим данным построим диаграмму Парето (рисунок 36).
Рисунок 36
Из этой диаграммы видно, что наиболее частый дефект при изготовлении деталей из этой марки стали дендритная лииквация. Её появление обусловлено неравновесной кристаллизацией сплавов.
После прокатки или ковки получаются волокна, вытянутые вдоль направления деформации.
Для уменьшения дендритной ликвации прибегают к диффузионному отжигу слитков перед прокаткой, который состоит в длительном нагреве стали при весьма высоких температурах (1000-1200°С).
2.4 Задание 4
Построить контрольную карту средних-размахов ( X-R ) и проанализировать результаты по измеренным данным емкости конденсаторов.
Измеренные данные емкости конденсаторов представлены в таблице 2.
Таблица 2
98,76 |
91,25 |
96,04 |
91,04 |
90,63 |
93,34 |
99,15 |
92,74 |
91,96 |
90,75 |
|
93,15 |
94,64 |
95,6 |
97,79 |
99,99 |
98,31 |
92,71 |
98,27 |
90,26 |
94,44 |
|
97,47 |
92,12 |
99,42 |
98,53 |
97,79 |
95,06 |
95,97 |
98,87 |
90,6 |
93,17 |
|
91,82 |
90,41 |
92,19 |
97,04 |
93,73 |
96,07 |
93,7 |
91,55 |
94,84 |
93,79 |
|
96,31 |
90,99 |
97,29 |
98,93 |
93,31 |
97,95 |
94 |
98,72 |
95,52 |
98,91 |
|
97,52 |
93,3 |
92,58 |
95,76 |
99,57 |
90,18 |
94,91 |
94,56 |
96,94 |
94,01 |
|
95,78 |
97,71 |
99,6 |
92,29 |
93,27 |
91,79 |
92,31 |
97,17 |
96,66 |
96,78 |
|
96,05 |
97,54 |
96,25 |
98,97 |
92,77 |
97,98 |
99,6 |
93,1 |
99,91 |
99,04 |
|
91,59 |
90,5 |
96,99 |
91,41 |
96,1 |
93,69 |
99,63 |
98,05 |
96,76 |
95,77 |
|
98,76 |
91,25 |
96,04 |
91,04 |
90,63 |
93,34 |
99,15 |
92,74 |
91,96 |
90,75 |
По этим данным построим X-R карту. Она представлена на рисунке 37.
Рисунок 37
В результате анализа построенной контрольной карты можно сказать, что значения емкости конденсатора находятся в пределах верхней и нижней границы поля допуска, т.е. процесс стабилен. Анализ зон контрольной карты также не выявил отклонений (рисунок 38).
Рисунок 38
2.5 Задание 5
Привести пример однофакторного дисперсионного анализа
Имеется 3 типа сверлильных станков, настроенных на один и тот же номинальный диаметр отверстий равный 150мм. Результаты измерений диаметров отверстий приведены в таблице 3. Необходимо выяснить оказывает ли влияние тип станка на диаметр отверстия.
Таблица 3
Станок 1 |
Станок 2 |
Станок 3 |
|
147 |
152 |
144 |
|
153 |
159 |
156 |
|
152 |
153 |
141 |
|
156 |
155 |
157 |
|
143 |
159 |
156 |
|
150 |
157 |
155 |
|
151 |
148 |
142 |
|
148 |
154 |
157 |
|
149 |
151 |
154 |
|
146 |
146 |
150 |
|
155 |
154 |
149 |
|
150 |
147 |
150 |
|
156 |
149 |
143 |
|
154 |
159 |
144 |
|
158 |
157 |
158 |
|
144 |
158 |
158 |
|
151 |
148 |
148 |
|
147 |
150 |
152 |
|
157 |
154 |
145 |
|
149 |
149 |
143 |
Воспользуемся программным пакетом Statistica и проведем однофакторный дисперсионный анализ. В результате получим таблицу влияния всех эффектов на исследуемый признак (рисунок 39).
Рисунок 39
В этой таблице:
1) SS - сумма квадратов отклонений (значение в строке «Станки» соответствует , а в строке «Error» соответствует );
2) Degr. of Freedom - число степеней свободы (значение в строке «Станки» соответствует , а в строке «Error» соответствует );
3) MS - сумма квадратов отклонений деленная на число степеней свободы.
При вычислении критерия Фишера число находящееся в строке «Станки» является числителем, а число в строке «Error» является знаменателем.
4) F - значение критерия Фишера;
5) - уровень значимости.
Табличное значение критерия Фишера . Так как расчетное значение критерия Фишера равное 1,80 меньше табличного на уровне значимости 0,05 то можно сделать вывод, что тип станка не влияет на качество изготавливаемых деталей. Другими словами, мы принимаем гипотезу об отсутствии влияния типа станка на качество производимых деталей.
Для наглядности представим результаты анализа графически (рисунок 40).
Рисунок 40
На рисунке представлен график зависимости среднего диаметра отверстия от типа станка. Вертикальными линиями отображены 95% доверительные интервалы. В верхней части графика указано расчетное значение критерия Фишера и его уровень значимости.
2.6 Задание 6
Примеры перцентиля, нахождение нижнего, среднего и верхнего квартиля.
Пусть дан вариационный ряд 35; 40; 40; 40; 40; 45; 45; 45; 45; 45; 45; 50; 50; 50; 50; 50; 50; 50; 50; 50; 50; 55; 60; 60; 60; 60; 60; 60; 60; 60; 60; 61; 70; 80; 80; 80; 85; 100; 100. Необходимо найти 10-й перцентиль, нижний, средний и верхний квартили.
Определение позиций перцентилей в массиве:
· 10-й перцентиль: 10•(n+1)/100= 4, т.е. значение перцентиля соответствует 4-ому элементу массива;
· Нижний квартиль (25-й перцентиль): 25•(n+1)/100= 25•(39+1)/100= 10, т.е. значение квартиля соответствует 10-ому элементу массива;
· Средний квартиль (50-й перцентиль, медиана): 50•(n+1)/100=50Ч Ч(39+1)/100= 20, т.е. значение квартиля соответствует 20-ому элементу массива;
· Верхний квартиль (75-й перцентиль): 75•(n+1)/100=75•(39+1)/100=30, т.е. значение квартиля соответствует 30-ому элементу массива.
Наглядно результаты вычислений представлены на рисунке 41
Рисунок 41
Размещено на Allbest.ru
...Подобные документы
Формирование массивов данных результатов контроля, представленных в форме матрицы. Основные статистические характеристики. Построение диаграмм. Определение коэффициентов точности технологического процесса и параметров контрольных карт, их построение.
курсовая работа [539,6 K], добавлен 14.10.2011Алгоритм построения многочлена Жегалкина по совершенной дизъюнктивной нормальной форме. Диаграмма Эйлера-Венна, изображение универсального множества и подмножества. Проверка самодвойственности, монотонности и линейности логической функции двух переменных.
контрольная работа [227,5 K], добавлен 20.04.2015Диаграмма рассеивания как точки на плоскости, координаты которых соответствуют значениям случайных величин X и Y, порядок ее построения и назначение. Нахождение коэффициентов и построение графика линейного приближения, графика квадратичного приближения.
курсовая работа [1,1 M], добавлен 03.05.2011Понятие о статистическом графике, его элементы. Незаменимость графических изображений благодаря их выразительности, доходчивости, лаконичности и универсальности. Классификация видов графиков. Виды диаграмм – структурные, динамичные. Статистические карты.
учебное пособие [4,0 M], добавлен 09.02.2009Общие аксиомы конструктивной геометрии. Аксиомы математических инструментов. Постановка задачи на построение, методика решения задач. Особенности методик построения: одним циркулем, одной линейкой, двусторонней линейкой, построения с помощью прямого угла.
курс лекций [4,0 M], добавлен 18.12.2009Принятие решения по многим критериям (многокритериальная оптимизация). Эффект несравнимости исходов. Отношение доминирования по Парето при сравнении векторных оценок. Нижние границы критериев. Учет неопределенных пассивных условий, выбор стратегии.
курсовая работа [71,6 K], добавлен 17.12.2009Построение диаграммы псевдографа, матрицы инцидентности и матрицы соседства вершин. Восстановление дерева по вектору с помощью алгоритма Прюфера. Построение таблицы истинности для функции и совершенной конъюнктивной и дизъюнктивной нормальной форм.
контрольная работа [181,9 K], добавлен 25.09.2013Множеством именуется некоторая совокупность элементов, объединенных по какому-либо признаку. Над множествами определяют операции, во многом сходные с арифметическими. Операции над множествами интерпретируют геометрически с помощью диаграмм Эйлера-Венна.
реферат [15,8 K], добавлен 03.02.2009Построение диаграммы рассеивания, полигонов, гистограмм нормированных относительных частот, эмпирических функций распределения по X и по Y. Параметры для уравнения параболической регрессии. Проверка гипотезы о нормальном распределении признака Х.
курсовая работа [511,8 K], добавлен 08.12.2013Характеристика булевой алгебры и способы представления булевых функций. Понятие и сущность бинарных диаграммах решений. Упорядоченные бинарные диаграммы решений, их построение и особенности применения для обработки запросов в реляционных базах данных.
дипломная работа [391,7 K], добавлен 21.01.2010Порядок и принципы построения вариационного ряда. Расчет числовых характеристик статистического ряда. Построение полигона и гистограммы относительных частот, функции распределения. Вычисление асимметрии и эксцесса. Построение доверительных интервалов.
контрольная работа [108,5 K], добавлен 03.10.2010Приемы построения математических моделей вычислительных систем, отображающих структуру и процессы их функционирования. Число обращений к файлам в процессе решения средней задачи. Определение возможности размещения файлов в накопителях внешней памяти.
лабораторная работа [32,1 K], добавлен 21.06.2013Определение понятия множеств Г. Кантора, их примеры и обозначения. Способы задания, включение и равенство множеств, операции над ними: объединение, пересечения, разность, дополнение, их определение и наглядное представление на диаграмме Эйлера-Венна.
реферат [70,9 K], добавлен 11.03.2009Случайная выборка значений двух случайных величин для исследования их совместного распределения. Диаграмма рассеяния опытных данных для четырех видов распределения. Вычисление коэффициента корреляции при большом объеме выборок; проверка его значимости.
реферат [811,7 K], добавлен 27.01.2013Статистическая обработка данных контроля времени (в часах) работы компьютерного класса в день. Полигон абсолютных частот. Построение графика эмпирической функции распределения и огибающей гистограммы. Теоретическое распределение генеральной совокупности.
контрольная работа [379,3 K], добавлен 23.08.2015Оценки неизвестных параметров закона распределения случайной величины Х по данным выборки. Интервальное оценивание. Случайный интервал. Граничные точки доверительного интервала. Нижний и верхний доверительные пределы.
реферат [30,0 K], добавлен 31.03.2003Определение понятия модели, необходимость их применения в науке и повседневной жизни. Характеристика методов материального и идеального моделирования. Классификация математических моделей (детерминированные, стохастические), этапы процесса их построения.
реферат [28,1 K], добавлен 20.08.2015Изучение понятия интегральной суммы. Верхний и нижний пределы интегрирования. Анализ свойств определенного интеграла. Доказательство теоремы о среднем. Замена переменной в определенном интеграле. Производная от интеграла по переменной верхней границе.
презентация [487,1 K], добавлен 11.04.2013Изучение общих сведений о матричных и антагонистических играх. Понятие позиционной игры, дерева, информационного множества. Рассмотрение принципа максимина и принципа равновесия. Оптимальность по Парето. Позиционная неантагонистическая игра, ее свойства.
курсовая работа [1,4 M], добавлен 17.10.2014Оптимальність по конусу в багатокрітеріальній задачі. Оптимальне рішення по Парето. Властивості послідовності стохастичних матриць, які гарантують існування граничного конуса. Умови, при яких уточнене по послідовності конусів оптимальне рішення є єдиним.
реферат [121,5 K], добавлен 16.01.2011