Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


»спользование метода наименьших квадратов




¬ качестве простого примера построени€ модели методом наименьших квадратов рассмотрим задачу восстановлени€ математического описани€ некоторого процесса по результатам эксперимента.

ѕредполагаетс€, что процесс описываетс€ одномерным уравнением 2-го пор€дка

W = a 0 + a 1 x + a 2 x 2, 0 £ x £ 6.

—читаем, что величина х измер€етс€ точно, а W Ц с ошибкой e, имеющей нормальное распределение с нулевым математическим ожиданием и единичной дисперсией
ћ (e) = 0, s2(e) = 1.

¬ыборка дес€ти случайных пар () представлена в табл. 3.1 в графах 2 и 3.

 

“аблица 3.1

є x Wm e
         
  4,8608 4,2396 2,7792 0,5988 3,2136 4,5156 5,9340 1,5852 4,4880 4,0932 9,28 9,40 7,88 1,86 7,77 8,73 8,33 5,16 7,28 9,22 8,848 8,821 7,460 2,039 8,056 8,874 8,118 4,994 8,872 8,767 0,432 0,579 0,420 -0,179 -0,286 -0,144 0,212 0,166 -1,592 0,453

ћетод наименьших квадратов заключаетс€ в том, что неизвестные (искомые) коэффициенты а0 , а1 , а2 должны минимизировать функцию, представл€ющую собой сумму квадратов нев€зок ej:

.

ћинимум некоторой функции, как известно, находитс€ в точке , где все частные производные этой функции по переменным а 0, а 1, а 2равны нулю.

ƒл€ определени€ частных производных, распишем функцию G через ее предполагаемый вид:

.

¬озьмем от функции G производные по а 0, а 1, а 2:

;

;

.

ѕриравн€в эти выражени€ к нулю и произвед€ некоторые преобразовани€, получим систему линейных алгебраических уравнений третьего пор€дка с трем€ неизвестными, коэффициенты которой вычисл€ютс€ по известным данным из табл. 3.1:

–еша€ полученную систему, получим а 0 = Ц0,161; а 1 = 3,929; а 2 = Ц0,427.

“аким образом, математическа€ модель будет иметь вид

Wm = Ц0,161 + 3,929 x Ц0,427 x 2. (3.2)

ѕроверим адекватность модели методом ‘ишера. ƒл€ этого заполним четвертый и п€тый столбцы таблицы 3.1, подставл€€ в математическую модель (3.2) и затем в формулу (3.1) значени€ xj из первого столбца.

ќпределим число степеней свободы системы по формуле

fs = n Ц m Ц 1,

где n = 10 Ц количество экспериментальных точек; m = 3 Ц количество неизвестных коэффициентов. “о есть fs = 6.

¬ыборочна€ дисперси€ вычисл€етс€ по формуле

.

 ритерий ‘ишера вычисл€етс€ по формуле

.

ѕо статистическим таблицам при 5%-м уровне риска (a = 0,05) находим пороговое значение критери€ ‘ишера

.

“ак как полученное значение F меньше критического (порогового), гипотеза об адекватности модели реальному процессу принимаетс€.

 

 онтрольные вопросы к лекции 7

1. „то €вл€етс€ исходным материалом при построении эмпирической модели?

2.  ак используетс€ физическа€ теори€ работы объекта при построении эмпирической модели?

3. „то при этом представл€ет собой объект идентификации?

4. —формулируйте задачу идентификации.

5. „то такое уравнение регрессии?

6. — чего начинаетс€ процесс идентификации?

7. ќт чего зависит конкретна€ форма модели?

8. ѕеречислите причины проведени€ непланируемого эксперимента.

9. ¬ чем заключаетс€ метод наименьших квадратов?

Ћекци€ 8
3.3. —татистические методы проверки адекватности
математических моделей

 

≈сли имеютс€ или могут быть получены необходимые и достоверные экспериментальные данные, дл€ проверки адекватности моделей можно использовать методы математической статистики.

ћатематически задача проверки адекватности модели формулируетс€ как задача проверки предположени€ о том, что значение отклика модели Wm отличаетс€ от реального отклика системы W не более чем на заданную величину e*:

. (3.3)

ќднако, истинное значение отклика системы никогда неизвестно. ѕолученный в результате эксперимента отклик в силу неконтролируемого дрейфа системы, разброса характеристик ее элементов и, наконец, просто ошибок измерени€ представл€ет собой случайную величину, отличающуюс€ от W. ѕоэтому при сравнении результатов математического и физического экспериментов будет получена совокупность случайных величин {e i }: , среди которых могут оказатьс€ как величины, удовлетвор€ющие условию (3.3), так и не удовлетвор€ющие ему.

ћожно ли считать, что полученные отклонени€ (e i > e*) объ€сн€ютс€ случайными причинами или их наличие должно быть признано существенным, что приводит к отказу от провер€емой модели. ƒл€ решени€ этого вопроса на основе выборки случайных величин {e i } стро€т статистические критерии, по которым оценивают адекватность модели.

√ипотеза об адекватности модели действительности (гипотеза Ќ0) может быть сформулирована как предположение о том, что полученна€ совокупность {ei} не дает оснований отказатьс€ от рассматриваемой модели. »ными словами, модель удовлетвор€ет заданной точности e*.

јльтернативна€ гипотеза Ќ 1 состоит в том, что модель не отвечает заданным требовани€м (3.3) и, следовательно, должна быть отвергнута.

“ак как выборка {e i } случайна, решение о выборе одной из гипотез Ќ 0 или Ќ 1 носит веро€тностный характер. ѕри этом может быть допущена ошибка первого рода, состо€ща€ в отказе от правильной модели (принимаетс€ Ќ 1, когда верна Ќ 0), или ошибка второго рода, состо€ща€ в прин€тии ошибочной модели (принимаетс€ Ќ 0, когда верна Ќ 1). ¬еро€тность ошибки первого рода обозначают через a, второго рода Ц b. ѕрин€то называть a риском разработчика, b Ц риском потребител€. –азумеетс€, желательно минимизировать как a, так и b. ќднако, при заданном объеме экспериментальной выборки уменьшение a влечет за собой увеличение b.

Ќа практике a задаетс€ на определенном уровне (a = 0,05; 0,01; 0,005; 0,001), при этом в 100a% случаев правильна€ модель отвергаетс€.

¬еличина 1Ц b характеризует веро€тность отказа от ошибочной модели, называетс€ мощностью критери€ и €вл€етс€ мерой его эффективности.

¬ыбор веро€тностей ошибок a и b при проверке конкретной модели зависит от ответственности решений, принимаемых на основе моделировани€.

Ќапример, если модель предназначена дл€ управлени€ двигателем летательного аппарата, необходимо в первую очередь минимизировать b, так как в данном случае прин€тие неверной модели, а значит, возможность ошибочных решений при управлении представл€ет больший вред, чем отказ от правильной модели.

ƒл€ оценки гипотезы об адекватности модели существует несколько критериев:

1)  ритерий согласи€ c2 ѕирсона.

2)  ритерий —мирнова- олмогорова.

3)  ритерий ‘ишера и др.

ѕри использовании критери€ c2 проверке подлежит гипотеза о том, что рассматриваема€ модель адекватна исследуемой системе с веро€тностью р (например, р = 0,95). Ёто значит, что при n независимых испытани€х np значений e i должно удовлетвор€ть условию (3.3) и лишь в (1Ц р) п случа€х это условие может быть нарушено.

¬ результате случайного эксперимента дл€ этих событий будут получены частоты n1 и n2: n1ї рп; n2 ї (1Ц р) п; (n1 + n2 = п).

„астоты n1 и n2 отличаютс€ от точных веро€тностных оценок или из-за несоответстви€ модели действительности (заданна€ веро€тность р не соблюдаетс€), или из-за случайных отклонений.

ƒл€ оценки предположени€ о том, что отклонени€ n1 и n2 от соответствующих веро€тностей случайны, строитс€ функци€

,

представл€юща€ собой сумму квадратов отклонений, нормированных на соответствующие веро€тности.

ѕолученное значение U * сравниваетс€ с табличным значением при заданном уровне риска a. ≈сли U * превышает пороговое значение , модель должна быть отвергнута, и принимаетс€ гипотеза Ќ 1. ≈сли U *£ , экспериментальные данные не противоречат гипотезе об адекватности модели, и принимаетс€ гипотеза Ќ 0.

Ќеобходимым условием использовани€ критери€ c2 €вл€етс€ многочисленность экспериментальных данных (не меньше 20).

 ритерий —мирнова- олмогорова основан на максимальном значении отклонений

.

ƒл€ заданной экспериментальной выборки строитс€ вспомогательна€ функци€

,

котора€ сравниваетс€ с пороговым значением l n ,a, определенным по таблицам распределени€ функции —мирнова- олмогорова.

ѕри модель должна быть отвергнута, а при экспериментальные данные не противоречат гипотезе об адекватности модели.

 ритерий —мирнова- олмогорова целесообразно использовать при относительно малых выборках, когда критерий c2 оказываетс€ неэффективным.

 ритерий ‘ишера осуществл€етс€ путем анализа дисперсий. ≈сли дисперси€, характеризующа€ ошибку эксперимента s2(W), известна, вычисл€етс€ выборочна€ дисперси€ S 2(e) и составл€етс€ F -отношение:

.

ѕолученную величину F -отношени€ сравнивают с пороговым значением критери€ ‘ишера Ff s ,¥, a при заданном уровне риска a.

ѕри Ff s ,¥ £ Ff s ,¥, a полученна€ величина S 2(e) может быть объ€снена случайным разбросом экспериментальных данных и, следовательно, нет оснований дл€ отказа от провер€емой модели.

≈сли Ff s ,¥ > Ff s ,¥, a, полученное расхождение результатов моделировани€ и экспериментальных данных знáчимо и, следовательно, модель должна быть отвергнута как недостаточно точна€.

 онтрольные вопросы к лекции 8

1. —формулируйте задачу проверки адекватности модели.

2. „то означает пон€тие Ђадекватность математической моделиї?

3. ¬ чем заключаетс€ ошибка первого рода?

4. ¬ чем заключаетс€ ошибка второго рода?

5.  акие критерии проверки адекватности математической модели ¬ы знаете?

6. ќхарактеризуйте каждый из этих критериев.


Ћекци€ 9
3.4. »дентификаци€ параметров математической модели
силы резани€ токарной операции

 

ѕостроим математическую модель силы резани€ при обработке круглой детали на токарном станке (–ис. 3.6).

—ила резани€ описываетс€ математической моделью в виде позинома

P = C S a V b t g, (3.4)

где S Ц продольна€ подача; V Ц скорость резани€; t Ц глубина резани€; , a, b, g Ц неизвестные параметры.

‘ормула (3.4) €вл€етс€ справочной. ƒл€ определени€ неизвестных параметров воспользуемс€ методом наименьших квадратов.

ѕусть проведено n экспериментов, результаты которых сведены в таблицу 3.2.

 

“аблица 3.2

є S (мм/об) V (мм/с) t (мм) P ( г)
2   n S 1 S 2   Sn V 1 V 2   Vn t 1 t 2   tn P 1 P 2   Pn

 

ƒл€ упрощени€ решени€ поставленной задачи прологарифмируем выражение (3.4):

.

¬ведем обозначени€

“огда формула (3.4) преобразуетс€ к линейному виду:

. (3.5)

ћетод наименьших квадратов сведетс€ к минимизации функции

,

где Ц логарифмы экспериментальных значений силы резани€, вз€тых из табл. 3.2;
Ц логарифмы силы резани€, предсказанные с помощью математической модели (3.5), Ц логарифмы экспериментальных значений подачи, скорости и глубины резани€, вз€тых из той же табл. (3.2), Ц логарифм неизвестного параметра .

¬озьмем производные от функции G по и приравн€ем их к нулю:

–азделим обе части уравнений на Ц2; вынесем , a, b, g за знак суммы; перенесем члены, не завис€щие от , a, b, g, в правую часть:

(3.6)

ѕолучили систему линейных алгебраических уравнений четвертого пор€дка, коэффициентами которой €вл€ютс€ суммы произведений логарифмов экспериментальных данных. –ешив полученную систему, найдем искомые значени€ коэффициентов , a, b, g линейной модели (3.5).

ƒл€ определени€ параметров исходной модели (3.4) необходимо дл€ коэффициента (только дл€ него) проделать операцию, обратную логарифмированию Ц потенцирование: = .  оэффициенты a, b, g получаютс€ непосредственно из решени€ системы (3.6).

≈сли в распор€жении исследовател€ имеютс€ экспериментальные данные, дл€ проверки адекватности математической модели действительности можно использовать методы математической статистики. –ассматриваемый ниже метод пригоден при изучении любых математических моделей. ќднако конкретный анализ проводитс€ на примере построенной модели силы резани€ при точении с помощью критери€ согласи€ c2, предложенного ѕирсоном.

√ипотеза Ќ 0 формулируетс€ как предположение о том, что отклонение e экспериментальных данных от значений, предсказанных моделью (3.4), с веро€тностью р (доверительна€ веро€тность) укладываютс€ в некоторый толерантный интервал ±e*. ≈сли это предположение правильно, то в толерантный интервал ( ± e*) должно укладыватьс€ np отклонений e i = | i Ц –mi |. ¬не толерантного интервала должно оказатьс€ (1Ц p) n отклонений. ƒл€ ограниченной случайной выборки из n наблюдений эти событи€ будут наблюдатьс€ с частотой n1 и n2 , лишь приближенно совпадающие с соответствующими веро€тност€ми:

n1 ї pn; n2 ї (1Ц p)n; n1 + n2 = n.

Ќеобходимо установить, можно ли объ€снить эти отклонени€ случайными причинами (в этом случае можно прин€ть гипотезу Ќ 0) или же они не случайны Ц статистически значимы (в этом случае нужно прин€ть альтернативную гипотезу Ќ 1).

ƒл€ этого вычисл€етс€ некотора€ величина U, называема€ статистикой:

.

Ёту величину нужно сравнить с пороговым значением c2-критери€ (c21,a) при прин€том уровне риска a. ≈сли U £ c21,a, наблюдаемые отклонени€ частот от соответствующих веро€тностей можно объ€снить случайностью и нет оснований дл€ отказа от нуль-гипотезы Ќ 0. ≈сли U > c21,a, то или произошло маловеро€тное событие (1Ц р), или наблюдаемые отклонени€ не случайны. ¬ этом случае принимаетс€ гипотеза Ќ 1.

¬ывод о правильности гипотезы Ќ 1, вообще говор€, не требует безоговорочного отказа от провер€емой модели:

1) ћожно изменить исходные предположени€ с тем, чтобы увеличить толерантный интервал ±e* или уменьшить доверительную веро€тность р. ѕри этом умéньшатс€ отклонени€ n1 и n2 от соответствующих веро€тностей, и проверка может привести к прин€тию гипотезы Ќ 0. ¬ этом случае моделью можно пользоватьс€, но нужно признать, что ее точность оказалась ниже, чем первоначально предполагалось.

2) ћожно уменьшить уровень риска a (то есть веро€тность отказа от правильной модели в результате неудачного эксперимента). Ёто приводит к увеличению порогового значени€ c21,a. Ёто, в свою очередь, может изменить оценку значени€ U. ќднако нужно помнить, что при этом увеличиваетс€ риск признать правильной ошибочную модель.

3) ћожно потребовать увеличени€ объема выборки, что, разумеетс€, приведет к увеличению точности оценки модели и уменьшению риска ошибок.

ѕри проверке адекватности моделей действительности всегда рассматриваетс€ случай, когда за пределами толерантного интервала оказалось больше точек, чем ожидалось (n1 < pn; n2 > (1Ц pn) n). ¬ противном случае опасений за точность модели не возникает, однако можно предположить, что величина толерантного интервала задана необоснованно большой. ≈сли в результате проверки по критерию c2 в этом случае будет получена величина U > c21,a, то завышение толерантного интервала (или занижение доверительной веро€тности р) статистически значимо, и необходимо уменьшить e* или увеличить р.
¬ обоих случа€х нужно признать, что модель оказалась точнее, чем ожидалось.

 

 онтрольные вопросы к лекции 9

1. ѕриведите общий вид математической модели силы резани€ при точении.

2.  ак привести модель, заданную в виде позинома, к линейному виду?

3.  аким методом найдены параметры линейной модели?

4. ¬ чем заключаетс€ этот метод?

5.  ак перейти от линейной модели к позиному?

6. —формулируйте нуль-гипотезу проверки построенной модели на адекватность.

7. „то такое доверительна€ веро€тность?

8. ѕеречислите меры, которые можно применить в случае неадекватности построенной математической модели.

9. ¬ каком случае можно не провер€ть модель на адекватность?


 

Ћекци€ 10
3.5. ¬ыбор оптимальной эмпирической модели

ѕринцип наименьших квадратов позвол€ет найти наилучшую модель идентификации дл€ исследуемой экспериментальной выборки с заданным уравнением регрессии вида

.

≈сли имеютс€ достаточно веские основани€ дл€ выбора формы этого уравнени€, никаких проблем не возникает. ќднако, в большинстве случаев конкретна€ форма модели заранее неизвестна и может, вообще говор€, быть различной.

Ќа первый взгл€д может показатьс€, что более сложна€ модель (увеличение степени полинома) всегда обеспечивает получение бóльшей точности. Ќа самом деле это не так. ѕри переходе к полиномам более высокой степени можно, конечно, получить лучшее согласие регрессионной кривой с экспериментальными данными. ƒл€ m = n это согласие будет абсолютным, но при этом получитс€ худшее согласие с истинным характером процесса W (x). ƒело в том, что экспериментальные данные представл€ют собой случайные величины и содержат лишь ограниченную информацию о характере W (x). ”величение степени полинома целесообразно лишь до тех пор, пока из экспериментальной выборки извлекаетс€ надежна€ информаци€. “аким образом, возникает проблема выбора формы модели.

ѕодход к решению этой проблемы основан на статистическом исследовании уравнений регрессии.

1) ћетод всех возможных регрессий основан на последовательном изучении всех возможных моделей (m < n), из которых отбираетс€ лучша€ модель.

ћетод представл€етс€ мало пригодным дл€ анализа сложных систем, так как отличаетс€ высокой трудоемкостью.

2) ћетод исключени€ предполагает исследование наиболее полной (в пределах разумного) модели и последовательную проверку на значимость всех ее членов. ѕри этом дл€ каждого из членов модели вычисл€етс€ величина критери€ ‘ишера F. Ќа основе полученного множества { Fi } выбираетс€ член уравнени€ регрессии, соответствующий минимальному значению критери€ Fi. ≈сли это минимальное значение меньше критического при выбранном уровне риска (Fi < F кр a), то соответствующий член исключаетс€ из регрессионного уравнени€ как несущественный, после чего все коэффициенты регрессии пересчитываютс€ заново и вновь осуществл€етс€ проверка их значимости.

≈сли Fi > F кр a, то все члены модели существенны и уравнение регрессии остаетс€ в первоначальном виде. ќднако, если это произошло уже на первом шаге исследовани€, стóит рассмотреть целесообразность усложнени€ первоначальной модели.

“рудоемкость этого метода меньше, чем метода всех возможных регрессий.

3) ћетод включений по существу противоположен методу исключений и предусматривает последовательное включение в модель новых членов с проверкой их статистической значимости.

“рудоемкость этого метода существенно меньше трудоемкости рассмотренных выше методов.

—уществуют и некоторые другие методы подбора оптимального уравнени€ регрессии.

ќбщим недостатком всех рассмотренных ранее методов €вл€етс€ использование дл€ оценки модели того же экспериментального материала, на основе которого эта модель построена.

4) »ной подход основан на использовании регул€ризации. ѕри этом подходе все экспериментальные данные разбиваютс€ на две части: обучающую (n 1) и проверочную (n 2). ѕерва€ из них используетс€ дл€ определени€ коэффициентов регрессии модели, втора€ Ц дл€ оценки модели в целом.

ќптимальные по этому подходу модели мало чувствительны к небольшим изменени€м исходных данных.

„исло точек обучающей последовательности должно быть, по крайней мере, на единицу больше числа коэффициентов регрессии (n 1 > m +1). ƒл€ повышени€ достоверности результатов этот запас должен быть существенно увеличен (n 1 ³ (2Е3) m). ѕроверочна€ последовательность должна включать в себ€ хот€ бы одну точку.

¬ р€де случаев в качестве критери€ регул€ризации удобно использовать критерий несмещенности, обеспечивающий наименьшее изменение модели при изменении состава обучающей последовательности. ѕри этом весь экспериментальный массив разбиваетс€ на две одинаковые по величине последовательности (n 1 = n 2), кажда€ из которых поочередно используетс€ в качестве обучающей. ¬ результате их использовани€ определ€ютс€ две независимые, одинаковые по форме модели и . ќптимальна€ модель ищетс€ по всем точкам выборки:

 ритерий регул€ризации всегда имеет четко выраженный минимум, что обеспечивает объективное выделение модели оптимальной сложности.





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2016-11-18; ћы поможем в написании ваших работ!; просмотров: 691 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ќаглость Ц это ругатьс€ с преподавателем по поводу четверки, хот€ перед экзаменом уверен, что не знаешь даже на два. © Ќеизвестно
==> читать все изречени€...

829 - | 613 -


© 2015-2023 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.067 с.