Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Тема 1: Эвристические алгоритмы индивидуального прогнозирования, классификация по одному признаку

План

1.Основная идея классификации по одному признаку с использованием эвристического алгоритма. Обучающий эксперимент.

2.Вероятности принятия ошибочных и верных решений при классификации по одному признаку. (эвристический алгоритм прогнозирования)

3.Нахождение порогового значения признака при классификации по одному признаку (эвристический алгоритм прогнозирования)

1.Основная идея классификации по одному признаку с использованием эвристического алгоритма. Обучающий эксперимент.
При оптимальной классификации по одному признаку для решения задачи индивидуального прогнозирования нужно знать двумерную плотность распределения признака и прогнозируемого параметра . В оптимальном методе аналитически находится такое пороговое значение признака x – классификации при котором величина средних потерь минимальна. Однако, необходимые при этом аналитические преобразования даже при одном признаке и нормальном совместном законе достаточно сложны. Если же плотность заранее неизвестна то необходим так же статистический эксперимент для нахождения оценки . Решение задачи классификации по одному признаку можно осуществить по данным обучающего эксперимента не прибегая к сложным аналитическим преобразованиям и статистическому эксперименту по определению оценки .Если она неизвестна, в этом случае непосредственно по данным обучающего эксперимента подбирается такое пороговое значение признака x – классификации при котором минимальна в соответствии с выбранным критерием требуемая вероятность ошибочных решений. Обычно в качестве такого критерия для подбора x – классификации берется минимум риска потребителя .
– вероятность
– изделие класса К1 – годное
– изделие класса К2 – дефектное
Рассмотрим такой подход на примере прогнозирования стабильности резисторов. Зависимость величины сопротивления резистора от времени представляется в виде линейной модели:

Где – сопротивление резистора в начальным момент времени . и неодинаковы у всех резисторов данного типа, то есть и случайные величины с некоторыми плотностями распределения. Отклонение во времени величины сопротивления резистора, то есть нестабильность является следствием неустойчивости его структуры. О степени неустойчивости структуры резистора в значительной мере можно судить по величине фликкерного шума. По – этому в качестве признака характеризующего стабильность резистора можно взять напряжения шума .
Прогнозируемым параметром есть величина коэффициента старения . Пусть для обучающего эксперимента отобрано случайным образом n резисторов. У каждого резистора перед испытанием измерены величины и , затем резисторы ставятся на испытания в одинаковом для всех режиме на заданное время прогнозирования, например,
По окончанию испытаний для каждого резистора находится величина коэффициента старения:

Для того что бы определить номер класса к которому фактически принадлежит каждый из n экземпляров необходимо указать граничное значение прогнозируемого параметра . Оно задается исходя из допустимого отклонения сопротивления резистора за время , тогда резисторы с будут отнесены к годным (классу К1), а резисторы с – дефектным (классу К2).
Массив исходных для прогнозирования данных полученных в результате обучающего эксперимента будет иметь вид:

S - № класса = 1,2 …
Случайные величины напряжения шума и коэффициент старения коррелированы и по данным обучающего эксперимента можно построить поле корреляции в виде показанном на рис. 1.Представленное поле корреляции отображает естественный обусловленный физическими закономерностями характер зависимости коэффициента старения от уровня фликкерного шума.

Рисунок 1

Существенная неоднородность структуры резистивного материала приводит к интенсификации процессов старения и значит к увеличению коэффициента старения. На Рис. 1 одно из возможных значений величины порога. Измеряя длину для нового резистора и сравнивая его с . будем принимать решение об отнесении этого резистора к
классу К1 если
классу К2 если


2.Вероятности принятия ошибочных и верных решений при классификации по одному признаку. (эвристический алгоритм прогнозирования)

– число верных решений об отнесении экземпляра принадлежащего фактически к классу К1 к этому ж классу, оно равно числу экземпляров у которых по данным обучающего эксперимента и . Это годные экземпляры и по прогнозу они также будут отнесены к годным (классу К1).
– это число решений у которых и . Это дефектные экземпляры и по прогнозу они будут отнесены к дефектным.
– это число ошибочных решений заключающихся в отнесении экземпляров класса К2 в К1.Это количество экземпляров и
Это фактически дефектные экземпляры класс К2 которые по прогнозу будут отнесены к годным (класс К1)
– число ошибочных решений … при и .
– число экземпляров фактически принадлежащих к классу К1 и К2 соответственно, при этом их сумма равна числу экземпляров используемых в обучающем эксперименте .
и – общее число решений принимаемых об отнесении экземпляров соответственно к классу К1 или К2 по прогнозу при этом .
Для введенных характеристик справедливы соотношения:




 

Справедливость приведенных выше соотношений следует из Рис. 1.Теперь можно определить оценки вероятности ошибочных и верных решений и априорных вероятностей.
Риск потребителя
(1)
Риск изготовителя
(2)


Условные вероятности принятия ошибочных решений
(3)
(4)

Априорные вероятности принадлежности экземпляра к классу К1 (вероятность оказаться годным любого взятого наугад экземпляра):

(5)

и к классу К2 (вероятность оказаться дефектным любого взятого наугад экземпляра):
(6)
Априорные вероятности принятия решения об отнесении экземпляра к классу К1:

(7)
и к классу К2:
(8)

Если качество прогнозирования необходимо оценить каким – либо одним показателем учитывающим одновременно ошибки того и другого вида можно использовать вероятность ошибки: (9)
вероятность принятия правильных решений (эффективность распознавания)
(10)


и нужно использовать для оценки качества прогнозирования когда потери от переименования К1 в К2 и К2 в К1 одинаковы.
и – цена переименования


3.Нахождение порогового значения признака при классификации по одному признаку (эвристический алгоритм прогнозирования)
Значение должно быть выбрано таким образом чтобы вероятности ошибочных решений не превышали допустимого уровня.
Если то наилучшим значением будет такое при котором общее количество ошибочных решений того и другого вида минимальна. Однако на практике чаще всего стремятся к минимальному или допустимому риску потребителя (1) так как цены переименования как правило неодинаковы, обычно – тогда наилучшим значением будет такое при котором достигается это значение риска потребителя. Величина порога может быть определенна путем расчета нескольких вариантов и выбором такого при котором требования заданные относительно величин или выполняются. Если этим требованиям не удается удовлетворить не при каком значении следует попытаться использовать большее число признаков либо найти более информативные признаки. Представляет интерес рассмотреть на примере как изменяются риски и другие вероятности в зависимости от величины порога . Пусть для обучающего эксперимента случайным образом отобрано 20 резисторов () В реальных задачах рекомендуется брать .Приемлемая величина объема выборки определяется степенью разброса признаков и прогнозированного параметра и требованиями к точности оценки ошибки прогнозирования. Результат обучающего эксперимента отображены на поле корреляции признака и прогнозируемого параметра (см. Рис 2)

Рисунок 2А
Значения и какого – либо резистора задают координаты соответствующей точки на поле корреляции, для простоты по оси абсцисс отложены условные единицы 0 – 12, по оси ординат указано некоторое граничное значения коэффициента старения которое устанавливается исходя из конкретных условий применения резистора. Как следует из расположения точек на поле корреляции относительно оценки априорных вероятностей принадлежность резистора к классу К1 и К2, (5) и (6) равны соответственно:


Изменяя величину порога мы будем изменять общее число решений об отнесении резистора к тому или иному классу , и вместе с тем число ошибочных решений и и число верных решений и соответственно будут изменяться и все рассмотренные ранее вероятности. На рисунке 2Б представлены сглаженные кривые зависимости этих вероятностей от величины порога и расчетные точки по данным из таблицы 1.

Рисунок 2Б
Расхождение между кривыми и расчетными точками в этом примере обусловлено ограниченностью объема выборки. Рассмотрение этих зависимостей приводит к выводам:
риск изготовителя с увеличением порога уменьшается от 0.7 до 0. Его максимальное значение равно априорной вероятности . То есть . Риск потребителя с увеличением порога возрастает от 0 до 0.3. Его максимальное значение равно априорной вероятности , те есть . Чем меньше тем больше риск изготовителя и меньше риск потребителя, но и тем дороже резисторы так как при этом большее их число будет, по результатам прогнозирования, отнесено к классу К2 то есть к дефектным.
Вероятность принятия правильных решений с увеличением порога возрастает от значения априорной вероятности до некоторого значения определяемого наибольшим количеством верных решений в нашем случае до 0.85, а затем снижается до величины априорной вероятности Вероятность ошибочных решений с ростом порога уменьшается от 1 до 0 так как при этом уменьшается до 0 число ошибочных решений . Аналогичная вероятность увеличивается от 0 до 1 так как при этом число ошибочных решений возрастает от 0 то своего максимального значения в нашем случае до 6. Вероятность отнесения к годным по прогнозу с увеличением возрастает от 0 до 1 так как при этом число решений об отнесении экземпляра к классу К1 возрастает от 0 до своего максимального значения, в нашем случае до 20. Своих предельных значений рассматриваемой вероятности достигают как правило при таком минимальном и максимальном значениях порога которое находится вне интервала значений полученных по данным обучающего эксперимента (см. Рис. 2)


Кривые вероятности и на рисунке на 2А не преведены так как эти вероятности равны соответственно:

;

Таким образом меняя можно влиять на результат прогнозирования, но при этом нужно учитывать, что все вероятности взаимосвязанные. Если необходимо уменьшить риск потребителя не повышая при этом число резисторов ошибочно отнесенных по прогнозу к дефектным следует совершенствовать процедуру прогнозирования причём наиболее перспективным направлением является отыскание новых и возможно более информативных признаков, либо повысить качество изготовляемых резисторов совершенствуя технологию и качество материалов.
Следует иметь в виду что уменьшение риска потребителя должно сочетаться с экономически приемлемым риском изготовителя и вероятностью отнесения к годному прогнозу .


Тема 2: Индивидуальное прогнозирование по признакам с оценкой значения прогнозируемого параметра с использованием теории статистических оценок.

ПЛАН


1.
Оптимальная оценка значения прогнозируемого параметра с использованием теории статистических оценок.

2.
Условия необходимые для реализации индивидуального прогнозирования по признакам с использованием теории статистических оценок.

3.
Оптимальное оценивание прогнозируемого параметра по одному признаку

1) Расмотрим решение задачи индивидуального прогнозирования по признаку с оценкой значения прогнозируемого параметра методами теории статистических оценок, полагая, что многомерная совместная плотность распределения значений признака и прогнозируемого параметра известна, то есть известно ее аналитическое выражение.Пусть начальное состояние изделия оценивается k – признакими каждый из которых случайная величина. Обозначим эту совокупность k -случайных величин:
.
По конкретным значениям признаков: - того экземпляра необходимо найти оценку значения прогнозируемого параметра , – номер экземпляра, * - оценка, к моменту времени , который для простоты будем обозначать Задачу прогнозирования значения параметра по признакам имеет смысл ставить только в том случае когда каждый из признаков и прогнозируемый параметр являются зависимыми случайными величинами. Степень их зависимости определяется видом многомерной совместной плотности распределения значений признаков и прогнозируемом параметром :

Который для простоты будем обозначать далее как:
(1)
Если прогнозируемый параметр с каждым из признаков независим, то прогнозирование теряет смысл и эта многомерная плотность распределения вырождается в произведении (2)
одномерной плотности значений прогнозируемого параметра и совместной плотности распределения признаков.

Прогнозирование должно быть точным. В качестве количестве количественной меры точности естественновзять дисперсию ошибки в оценке прогнозируемого параметра.
Где
- оценка параметра
Тогда критерий оптимальности имеет вид:

(3)
где
- оптимальная оценка параметра .
Интегрируя выражение (1) по переменной y в пределах -∞ до +∞ получим:
(4)
k – мерную плотность совместного распределения признаков.

Тогда условная плотность распределения прогнозируемого параметра при условии, что признаки случайные величины примет некоторое значения равна:
(5)
Если у какого – либо – го экземпляра измерить значение признаков и подставить это в выражение (5) получим условную плотность распределения прогнозируемого параметра для этого – го экземпляра, при условии что признаки приняли именно эти значения, соответственно получаем такую условную плотность:
(6);

Эта плотность есть функция одной переменной (у). Отметим, что дисперсия, вычисленная по плотности (6), будет меньше дисперсии, вычисляемой по плотности и различие между ними будет тем существеннее, чем сильнее зависимость между каждой из случайных величин и прогнозируемым параметром, а так же чем менее при этом зависимы между собой.
В качестве оценки прогнозируемого параметра берется наиболее вероятное значение случайной величины - её мода, то есть такое, при котором плотность распределения (6) максимальна. Предположим, что эта плотность имеет одну единственную моду. Такая оценка имеет наименьшую дисперсию ошибки по сравнению со всеми другими возможными оценками (медиана, математическое ожидание). Эта оценка следовательно удовлетворяет критерий оптимальности (3) то есть является оптимальной оценкой прогнозируемого параметра – го экземпляра, обозначим её .Таким образом прогнозирование оптимально, когда оценка находится из выражения:
(7)
Оценка полученная из выражения (7) будет иметь в действительности некоторое рассеивание относительно фактического значения прогнозируемого параметра , но это рассеивание будет наименьшим из возможных и следовательно ошибки в прогнозировании при использовании этого метода будут средне минимальными. На рис 1 иллюстрируется эффективность прогнозирования с помощью условной плотности (6) по сравнению с оценкой параметров которое представляет безусловную плотность распределения прогнозируемого параметра к моменту времени .

 

Рисунок 1

 

Как следует из рис 1 независящая от конкретных значений признаков имеет большую дисперсию, чем , а значит и ошибка полученная при использовании оценки параметра по безусловной плотности имеет большую дисперсию.

 

Индивидуальное прогнозирование по признакам будет тем эффективней, если существенно уменьшить дисперсию ошибки индивидуального прогнозирования по сравнению с дисперсией безусловной плотности ,а это в первую очередь определяется степенью зависимости между прогнозируемым параметром и признаками (Рис 1). Расположения условной плотности (6) относительной безусловной плотности зависит от конкретного набора значений признаков , -го экземпляра и степени коррелированности признаков с прогнозируемым параметром (см. Рис 1) и в общем случае может иметь вид кривой при условии ), где i – номер признака, j – экземпляра. Если же измеренные значения оказались равными соответствующим модальным значениям случайных величин то условная плотность будет располагаться как кривая (см. Рис 2)

Дисперсия условной плотности будет тем меньше чем более коррелированы признаки с параметром. Таким образом рассмотренный теоретически строгий подход дает оптимальную оценку прогнозируемому параметру.



2. Условия необходимые для реализации индивидуального прогнозирования по признакам с использованием теории статистических оценок.

Практическое применение рассмотренного метода возможны если проведен специальный эксперимент по сбору и обработке статистических данных о прогнозируемом параметре и признаках в результате которой найдены подходящие аналитические модели условных многомерных плотностей распределения прогнозируемого параметра и признаков, однако на практике специалист сталкивается здесь с массой проблем, по - этому реализовать этот метод можно далеко не всегда. Во первых: для реальных комплектующих элементов устройств и изделий даже при известной совокупности информативных признаков (выявление которых так же представляет весьма трудоемкую задачу) Не всегда известны многомерные условные плотности распределения признаков и прогнозируемого параметра. Во-вторых: получение аналитических моделей этих условных плотностей распределения признаков представляет трудоемкий процесс и может быть поставлена только отдельной самостоятельной задачей для каждого типа изделий и его условий эксплуатации. В – третьих: даже если такие аналитические модели получены, необходимые в этом методе прогнозирования аналитические преобразования достаточно сложны. Задача относительно легко решается, если многомерные условные плотности подчиняются нормальному закону.

3. Оптимальное оценивание прогнозируемого параметра по одному признаку
Рассмотрим пример оптимального оценивания прогнозируемого параметра, когда начальное состояние изделия оценивается всего одним признаком и совместная плотность распределения этого признака и прогнозируемого параметра подчиняется нормальному закону. Вариант оптимального оценивания рассмотрим применив к задаче прогнозирования долговечности мощных транзисторов по величине теплового соединения между кристаллом и корпусом.
Известно, что увеличение теплового сопротивления основной причиной которого есть некачественная пайка или приклейка кристаллов к корпусу что приводит к повышенному нагреву кристалла и снижению срока службы транзисторов. В качестве признака характеризующего величину теплового сопротивления и следовательно долговечность транзистора принять температуру перегрева транзистора под определенной нагрузкой в течении заданного времени (обычно в течении нескольких секунд) А в качестве прогнозируемого параметра выбирается долговечность транзистора.
Коэффициент корреляции между долговечностью и температурой перегрева отрицательный, так как чем больше казалось перегрева, тем более вероятна что его долговечность будет ниже.
Сохраняя принятые ранее обозначения считаем признаком случайную величину температуру перегрева транзистора. а прогнозируемым параметром случайную величину – долговечность транзистора.
Оценка начального состояния каждого экземпляра заключается здесь в измерении температуры перегрева транзистора. Задача индивидуального прогнозирования состоит в оценке по температуре перегрева каждого экземпляра его долговечности.
Как показывает опыт совместная плотность распределения значения признака и прогнозируемого параметра может быть описана двумерным нормальным законом распределения случайных величин и .
Выражение этой плотности имеет вид:
(8)
где:
– математическое ожидание признака и прогнозируемого параметра соответственно.
– дисперсии признака и прогнозируемого параметра соответственно.
r – коэффициент корреляции между признаком и прогнозируемым параметром.

Одномерные плотности распределения признака и прогнозируемого параметра определяется выражениями:
(9)
(10)
Разделив выражение 8 на 9 получим:
условную плотность распределения прогнозируемого параметра , при условии, что признак принял некоторое значение x.

(11)
---- условная мат. ожидания

---------- условная дисперсия

Из выражения (11) следует, что полученная условная плотность распередения случайной величины – есть нормальный закон с математическим ожиданием и дисперсией равным соответственно:

(12)
если (см. рис. 1)

(13)
Если – нет корреляции между признаками и параметрами, то:
Как следует из выражения 12, 13 условное математическое ожидание прогнозируемого параметра зависит от того какое значения приняла случайная величина – то есть признак,а условная дисперсия не зависит от значений признака и определяется степенью значения корреляции между и
Если в выражении (12) подставить измеренное значения признака (t перегрева – го экземпляра) получим условную плотность распределения долговечности этого – го транзистора, при условии, что его t перегрева, оказалась равной именно этому значению . Эта плотность распределения имеет вид:
(14)
Эта плотность – функция одной переменной – y. Оптимальной оценкой прогнозируемого параметра – долговечности является мода плотности распределения (14) то есть такое значение при котором эта плотность максимальна. Так как выражение (14) представляет нормальное распределение у которого мода совпадает с математическим ожиданием оптимальная оценка долговечности какого – либо конкретного – го транзистора равна:
(15)
Измерив величину температуры перегрева – го транзистора и подставив в это значение выражение (15) определим оптимальную оценку долговечности этого транзистора , однако, есть только оценка и поскольку признак b прогнозированный параметр связаны вероятностью действительное значение прогнозируемого параметра в момент будет отличаться от , где определение точности прогнозирования необходимо выявить степень рассеивания оценки относительно фактических .
Можно показать, что отклонение имеет математическое ожидание

(16)

и дисперсию (17)
На рисунке 2 показана зависимость дисперсии ошибки от величины коэффициента корреляции r между случайными величинами и из которой следует, что чем сильнее коррелируемый признак и прогнозируемый параметр тем меньше дисперсия ошибки прогнозирования. С увеличением дисперсии прогнозируемого параметра при том же коэффициенте корреляции r дисперсия ошибки возрастает.

 

 

Рисунок 2 Рисунок 3

Если случайные величины и не коррелированы r = 0 то дисперсия ошибки прогнозирования равна дисперсии прогнозируемого параметра. Если же между случайными величинами и жесткая функциональная связь те есть , то дисперсия ошибки прогнозирования равна нулю при любой дисперсии прогнозированного параметра .
Если прогнозируемый параметр является линейной функцией признака. то независимо от рассеивания прогнозируемого параметра его значение определяется значением признака и видом этой линейной функции.

На рис 3 показано как меняется расположения условной плотности относительно одномерной плотности в зависимости от коэффициента корреляции r и конкретного значения признака – го экземпляра . При оценивании прогнозированного параметра по в качестве оценки естественно брать моду этого распределения . При оптимальном прогнозировании оценка берется равно моде условного распределения полученного из условия, что признак принял некоторое конкретное значение . Для рассматриваемого примера индивидуального прогнозирования долговечности мощных транзисторов, по величине температуры перегрева рассчитаны кривые плотности условного распределения для двух значений коэффициента корреляции между долговечностью и температурой перегрева и четырех значений признака (, а так же рассчитаны кривые безусловной плотности распределения на рисунке 3 обозначены:
кривая 1 – безусловная плотность распределения прогнозируемого параметра
кривая 2 – условная плотность .
кривая 3 – условная плотность при при
кривая 4 – условная плотность при при
кривая 5 - *||*||*||* при
В данном случае признак равен моде и математическому ожиданию
кривая 6 - *||*||*||* при .
Сравнивая кривую 1 со всеми остальными, видим что последние характерны меньшим рассеиванием и оно тем меньше чем больше коэффициент корреляции между признаками и прогнозируемым параметром. Так как кривые 2,4,5 соответствуют . Чем более зависимы признаки прогнозируемого параметра, тем меньше дисперсия условного распределения параметра и следовательно меньше ошибки прогнозирования. Положение моды условного распределения зависит от r и от конкретного значения признака . Это следует из выражения 16 и отображено на рис 3. Исключением является случай когда признак принял значение (кривая 5) при этом не зависимо от величины коэффициента корреляции мода условной плотности равна . Сравнение кривых 3 и 4 показывает, что при одном и том же значение признака , чем больше модуль коэффициента корреляции, тем сильнее проявляется влияние этого на значение (назначение моды условного распределения) Сравнивая кривые 2 и 4 видим что чем больше тем (при том же модуле r) дальше от находится мода условного распределения , то есть тем значительней оценка отличается от . Изменение знака коэффициента корреляции не меняет форму кривой, а лишь изменяет ее положение относительно , в зависимости от значений признаков .
по – этому кривая 4 есть так же условная плотность при а симметричная ей относительно кривая 6 имеет такой вид так же при . Рассмотрение кривых рисунков 3 убеждает в том, что индивидуальное прогнозирование по признакам с использованием условной плотности существенно сужает дисперсию ошибки по сравнению с оцениванием параметра по и тем более чем сильнее коррелируемы признаки с прогнозируемым параметром. Рассмотренный пример оптимального прогнозирования для случая когда признаки прогнозирующие параметр имеют совместное нормальное распределения позволяют детально исследовать свойства оптимальной оценки прогнозированного параметра , а так же влияние на нее различных параметров распределения таких как и конкретного значения признака . Для других практически встречающихся законов совместного распределения признаков прогнозирования параметра качественный характер приведенных примеров сохраняется. Их исследование связано с определенными математическими трудностями.

 


Тема 3: Алгоритм оптимальной классификации

План
1.Теория статистической классификации.

2.Вероятности принятия ошибочных решений при оптимальной классификации.

3.Критерий Байеса. Отношение правдоподобия

4.Вероятностиные характеристики при оптимальной классификации по оптимальному признаку.

5.Нахождение порогового значения признака при оптимальной классификации.

6.Влияние параметров совместного распределения на вероятность принятия ошибочных решений при оптимальной классификации.

7.Взаимное расположение безусловных и условных плотностей распределения для индивидуального прогнозирования метод оптимальной классификации по одному признаку.

1.Теория статистической классификации.
При индивидуальном прогнозировании по признакам с классификацией задача состоит в разделении исследуемой совокупности объектов и изделий на классы и нет необходимости в оценке конкретного значения прогнозируемого параметра. В большинстве практических случаев в том числе и при прогнозировании качества изделий число классов равно 2, так бывает, например, когда исследуемую совокупность необходимо по заданному правилу разделить на класс годных и дефектных изделий. Рассмотрим решение задачи индивидуального прогнозирования методами теории статистической классификации для чего нужно располагать условными многомерными плотностями распределения признаков для каждого класса. Задача заключается в отыскании способа принятия оптимального решения о принадлежности проверяемого экземпляра к тому или иному классу в условиях неопределенности то есть в условиях действия случайных факторов которые маскирует связь между признаками и классом экземпляра.
Условимся, что проверяемый экземпляр принадлежит классу K1. Если значение прогнозируемого параметра y к моменту времени ,будет больше некоторого граничного значения, . Будем считать такие изделия годными.Если экземпляр принадлежит к классу K2 – дефектным. Зная плотность прогнозируемого параметра на момент времени можно определить априорные вероятности принадлежности какого – либо экземпляра к классу К1.

(1)

и к классу К2
(2)

Определение вероятностей принадлежности какого – либо экземпляра к классу К1 и К2 по выражениям (1) и (2) дает представления лишь о свойствах всего ансамбля изделий. Это не индивидуальное прогнозирование так как здесь не используется информация об индивидуальных особенностях – го экземпляра (то есть о значениях его признаков).
Пусть начальное состояние изделия характеризуется К – признаками каждый из которых является случайной величиной. Совокупность К случайных величин обозначим . По конкретным значениям признаков – го экземпляра необходимо принимать решения об отнесении этого экземпляра к классу К1 или К2. В таком виде задачу целесообразно ставить лишь в том случае когда между классом которому принадлежит – ый экземпляр и значений его признаков существует какая – либо связь. Если эта связь выражается в виде жесткой функциональной зависимости то для определения принадлежности экземпляра к тому или иному экземпляру класса необходимо провести расчет по определенной формуле. Задача прогнозирования представляет наличие вероятностных связей между классом и признаками – го экземпляра. Степень тесноты этой связи полностью определяется видом условных совместных плотностей распределения признаков при условии что экземпляр принадлежит классу К1:

и к классу К2:

Для простоты записи будем их обозначать как:
и эти плотности могут быть получены с соответствующей обработкой результатов эксперимента. Совместной плотностью они связаны соотношениями:
(3)
(4)
Где:
и нормирующие коэффициенты:


2.Вероятность принятия ошибочных решений при оптимальной классификации.
Принятие решения об отнесению экземпляра к классу К1 или К2 основано на вероятностных моделях, по – этому существует вероятность принятия ошибочных решений. Она заключается в переименование класса какого – либо экземпляра. Например, годный экземпляр (К1) в соответствии с решением могут отнести к дефектным (К2) или наоборот.
Следует оценить вероятность ошибки решений.

– условная вероятность принятия решения об отнесения экземпляра к классу К2 при условии что он фактически принадлежит классу К1.

– условная вероятность принятия решения об отнесении экземпляра к классу К1 при условии что он фактически принадлежит классу К2

– условная вероятность того что экземпляр является годным (К1) при условии что принято решение считать его дефектным (К2).
Это вероятность определяет на сколько рискует изготовитель когда верит прогнозировании, ее называют риском изготовителя.

– условная вероятность того что экземпляр в действительности принадлежит классу К2 (дефектным) при условии что принято решение считать его годным (К1).
Эта вероятность определяет на сколько рискует потребитель, ее называют риском потребителя.

– априорная вероятность принятия решения об отнесении его к классу К1, вероятность принятия решения об отнесения к годным любого наугад взятого экземпляра.

– априорная вероятность принятия решения об отнесении его к классу К2, вероятность принятия решения об отнесения к дефектним любого наугад взятого экземпляра.

Вероятность ошибки в переименование классов экземпляра из К1 в К2, то есть вероятность того что годный экземпляр (К1) и относительно него принято решение об отнесении к К2 равна:

(5)

Аналогично вероятность ошибки в переименовании класса экземпляра из К2 в К1, то есть вероятность отнесения дефектного экземпляра к годным равна:

(6)

 

3.Критерий Байеса. Отношение правдоподобия

Ошибочное решения всегда приводят к некоторым потерям. Обозначим потери связанные с переименование класса экземпляра из К1 в К2 то есть цену такого переименования , а цену переименования из К2 в К1 , тогда величина средних потерь при многократном распознавании будет равна с учетом выражений (5) и (6):

(7)

В качества критерия оптимальности естественно взять min среднего риска
(8)
Это наиболее распространенный критерий – критерий Байеса.В выражении (7) вероятности и известны и они не зависят от процедуры прогнозирования так как их величина определяется фактической долей годных и дефектных экземпляров среди изделий данного типа.
--------------------------------------------------------------------------------------------------------------14.10.11
Минимизация среднего риска может быть достигнута путем изменения вероятностей и . Эти вероятности могут быть найдены по известным условным совместным плотностям распределения признаков (3), (4). Действительно:

(9)

(10)

и – область значений признаков при которых принимается решение об отнесении экзе



<== предыдущая лекция | следующая лекция ==>
Пользовательское представление данных с использованием форм | Передвижение населения, общая и транспортная подвижность.
Поделиться с друзьями:


Дата добавления: 2016-11-24; Мы поможем в написании ваших работ!; просмотров: 1189 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Большинство людей упускают появившуюся возможность, потому что она бывает одета в комбинезон и с виду напоминает работу © Томас Эдисон
==> читать все изречения...

2529 - | 2189 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.02 с.