Лабораторная работа № 3
Качественный признак показывает, является единица продукции годной или дефектной. Качественный признак может отражать также число дефектов в единице продукции, например, на определённой площади стального листа.
При выборочном контроле по качественному признаку в выборку из партии попадает некоторое случайное число дефектных единиц продукции. Вероятности попадания в выборку того или иного количества дефектных единиц продукции составляют дифференциальную функцию распределения.
Пусть партия состоит из N изделий, D из которых бракованные. Если взять из партии случайную бесповторную выборку (какую обычно и берут в производстве) объёмом n, то вероятность того, что в выборке ровно m бракованных изделий, равна
, где, например,
Совокупность этих вероятностей для m=0,1,2,3,…,n при заданных N, D, n описывается дифференциальной функцией гипергеометрического распределения.
Величина P(m) может быть рассчитана в программе Excel при помощи статистической функции ГИПЕРГЕОМЕТ. Диалоговое окно, открывающееся при выборе этой функции, имеет четыре строки для ввода данных:
Пример_S. Подсказка к этой строке указывает, что необходимо ввести количество успешных испытаний в выборке. При этом под количеством успешных испытаний понимается количество элементов выборки, обладающих определённым признаком, в нашем случае – количество дефектных изделий в выборке.
Размер_выборки. Вводится размер выборки.
Ген_совокупность_s. Подсказка к этой строке указывает, что надо ввести количество успешных испытаний в генеральной совокупности. В нашем случае это количество дефектных изделий в партии.
Размер_ген_совокупности. Вводится объём партии.
При очень больших значениях параметров расчёт гипергеометрического распределения может оказаться затруднительным даже при использовании компьютера. Однако, если n £ 0,1N, то гипергеометрическое распределение можно приближённо заменить биномиальным (которое имеет место при повторной случайной выборке), расчёты которого более просты. При биномиальном распределении
,
где q=D/N – доля дефектных изделий в партии.
При биномиальном распределении величина P(m) может быть рассчитана в программе Excel при помощи статистической функции БИНОМРАСП. Диалоговое окно, открывающееся при выборе функции, имеет четыре строки для ввода данных:
Число_s. Подсказка к этой строке указывает, что необходимо ввести количество успешных испытаний. При этом под количеством успешных испытаний понимается количество элементов выборки, обладающих определённым признаком, в нашем случае – количество дефектных изделий в выборке.
Испытания. Предлагается ввести число независимых испытаний, т.е. объём выборки.
Вероятность_s. Предлагается ввести вероятность успеха каждого испытания. В нашем случае это вероятность того, что случайно выбранное изделие будет бракованным, т.е. доля дефектных изделий в партии, иными словами – уровень дефектности.
Интегральный. Вводится истина, если рассчитывается значение интегральной функции распределения, и ложь, если рассчитывается значение дифференциальной функции распределения, т.е. в нашем случае – значение P(m).
Если q £ 0,1 и n £ 0,1N, что обычно и имеет место в практике статистического контроля, то биномиальное распределение, как и гипергеометрическое, можно приближённо заменить ещё более простым для расчётов распределением Пуассона, в котором
, где l = nq – математическое ожидание числа дефектных изделий в выборке.
При распределении Пуассона величина P(m) может быть рассчитана в программе Excel при помощи статистической функции ПУАССОН. Диалоговое окно, открывающееся при выборе функции, имеет три строки для ввода данных:
X. Количество событий, в нашем случае - количество дефектных изделий в выборке.
Среднее. Среднее ожидаемое численное значение, в нашем случае – параметр l, т.е. математическое ожидание числа дефектных изделий в выборке.
Интегральный. Вводится истина, если рассчитывается значение интегральной функции распределения, и ложь, если рассчитывается значение дифференциальной функции распределения, т.е. в нашем случае – значение P(m).
Пример 2.1. Из партии, состоящей из 1000 изделий, 30 из которых дефектные, взята выборка объёмом 50 изделий. Построить график дифференциальной функции распределения вероятностей, используя гипергеометрическое распределение.
Открываем новую книгу Excel. В ячейку А1 вводим заголовок работы «Лаб. работа 2. Распределение показателей качества по качественному признаку». Далее вводим исходные данные (Рис. 2.1).
Рис.2.1. Исходные данные для расчёта распределения в примере 2.1.
Поскольку график представляет собой зависимость P(m), то для его построения понадобятся диапазоны данных m и P(m)гипер. Соответствующие заголовки вводим в ячейки А7 и В7. В диапазон А8:А38 вводим количество дефектных изделий в выборке от 0 до 30 с шагом 1.
В ячейке В8 рассчитываем вероятность для m=0 при помощи статистической функции ГИПЕРГЕОМЕТ. В первую строку диалогового окна вводим ссылку на ячейку А8. Во вторую строку вводим ссылку на ячейку В5. В третьей строке делаем ссылку на ячейку В4. В четвёртой строке делаем ссылку на ячейку В3.
В результате в ячейке В8 получаем значение 0,209681. Формулу из ячейки В8 копируем в диапазон В9:В38. Перед копированием вводим в формуле абсолютную адресацию тех ячеек, ссылки на которые не должны меняться при копировании – ячеек В3, В4, В5.
При построении графика выбираем диаграмму Точеная вида Позволяет сравнить пары значений, т.е. график будет представлять отдельные точки, не соединённые линией. Это связано с тем, что количество дефектных изделий в выборке – дискретная случайная величина, принимающая только целые значения.
На втором шаге создания диаграммы в качестве диапазона данных вводим диапазон А8:В15. Остальные значения P(m) можно на графике не использовать, поскольку они практически равны нулю, начиная с P(7), находящегося в ячейке В15.
После редактирования диаграммы получаем график, показанный вместе с расчётными данными на рис. 2.2.
Рис.2.2. Результаты расчётов и график дифференциальной функции
гипергеометрического распределения в примере 2.1.
Задание
1. Выполнить расчёты и построения в соответствии с примером.
2. На том же листе рабочей книги продолжить расчёты и построить графики дифференциальных функций биномиального распределения и распределения Пуассона с теми же параметрами, что и в примере. Сравнить значения вероятностей, рассчитанных по различным распределениям.
3. Как изменится наиболее вероятное число дефектных изделий в выборке при увеличении объёма выборки до 50?
4. Измените исходные данные следующим образом: объём партии 20000 изделий, из них 1000 дефектных, объём выборки 500 изделий. Какие из распределений при этом не будут поддаваться расчёту?
5. Сохранить файл рабочей книги на жёстком диске в своей папке.