Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности




НазваниеКонспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности
страница2/5
Дата публикации19.11.2013
Размер0.74 Mb.
ТипКонспект
uchebilka.ru > Математика > Конспект
1   2   3   4   5

^ 2. ЛИНЕЙНЫЕ РЕГРЕССИОННЫЕ МОДЕЛИ
В целях исследований часто бывает удобно представить исследуемый объект в виде ящика, имеющего входы и выходы, не рассматривая детально его внутренней структуры. Конечно, преобразования в ящике (на объекте) происходят (сигналы проходят по связям и элементам, меняют свою форму и т. п.), но при таком представлении они происходят скрыто от наблюдателя.

По степени информированности исследователя об объекте существует деление объектов на три типа «ящиков»:

  • «белый ящик»: об объекте известно все;

  • «серый ящик»: известна структура объекта, неизвестны количественные значения параметров;

  • «черный ящик»: об объекте неизвестно ничего.

Черный ящик условно изображают так:



Значения на входах и выходах черного ящика можно наблюдать и измерять. Содержимое ящика неизвестно.

Задача состоит в том, чтобы, зная множество значений на входах и выходах, построить модель, то есть определить функцию ящика, по которой вход преобразуется в выход. Такая задача называется задачей регрессионного анализа.

В зависимости от того, доступны входы исследователю для управления или только для наблюдения, можно говорить про активный или пассивный эксперимент с ящиком.

Для начала предположим, что мы имеем дело с черным ящиком, имеющим один вход и один выход. Допустим для простоты, что зависимость между входом и выходом линейная или почти линейная. Тогда данная модель будет называться линейной одномерной регрессионной моделью.



Рассматривая экспериментально полученные данные, предположим, что они подчиняются линейной гипотезе, то есть выход Y зависит от входа X линейно, то есть гипотеза имеет вид: Y = A1X + A0.

Для каждой из n снятых экспериментально точек вычислим ошибку (Ei) между экспериментальным значением (YiЭксп.) и теоретическим значением (YiТеор.), лежащим на гипотетической прямой A1X + A0:

Ei = (YiЭксп.YiТеор.), i = 1, …, n;

Ei = YiA0A1 · Xi, i = 1, …, n.

Ошибки Ei для всех n точек следует сложить. Чтобы положительные ошибки не компенсировали в сумме отрицательные, каждую из ошибок возводят в квадрат и складывают их значения в суммарную ошибку F уже одного знака:

Ei2 = (YiA0A1 · Xi)2, i = 1, …, n.



Цель метода — минимизация суммарной ошибки ^ F за счет подбора коэффициентов A0, A1. Другими словами, это означает, что необходимо найти такие коэффициенты A0, A1 линейной функции Y = A1X + A0, чтобы ее график проходил как можно ближе одновременно ко всем экспериментальным точкам. Поэтому данный метод называется методом наименьших квадратов.



Суммарная ошибка ^ F является функцией двух переменных A0 и A1, то есть F(A0, A1), меняя которые, можно влиять на величину суммарной ошибки



^ Примерный вид функции ошибки
Чтобы суммарную ошибку минимизировать, найдем частные производные от функции F по каждой переменной и приравняем их к нулю (условие экстремума):





После раскрытия скобок получим систему из двух линейных уравнений:





Для нахождения коэффициентов A0 и A1 методом Крамера представим систему в матричной форме:



Решение имеет вид:





Вычисляем значения A0 и A1.

Чтобы определить, принимается гипотеза или нет, нужно, во-первых, рассчитать ошибку между точками заданной экспериментальной и полученной теоретической зависимости и суммарную ошибку:

Ei = (YiЭксп.YiТеор.), i = 1, …, n



И, во-вторых, необходимо найти значение σ по формуле , где ^ F — суммарная ошибка, n — общее число экспериментальных точек.

Если в полосу, ограниченную линиями YТеор.S и YТеор. + S, попадает 68,27% и более экспериментальных точек YiЭксп., то выдвинутая нами гипотеза принимается. В противном случае выбирают более сложную гипотезу или проверяют исходные данные. Если требуется большая уверенность в результате, то используют дополнительное условие: в полосу, ограниченную линиями YТеор. – 2S и YТеор. + 2S, должны попасть 95,45% и более экспериментальных точек YiЭксп.. Если требуется еще большая уверенность в результате, то используют дополнительное условие: в полосу, ограниченную линиями YТеор. – 3S и YТеор. + 3S, должны попасть 99, 73% и более экспериментальных точек YiЭксп.. Условие принятия гипотезы выведено из нормального закона распределения случайных ошибок.



^ Линейная множественная модель

Предположим, что функциональная структура ящика снова имеет линейную зависимость, но количество входных сигналов, действующих одновременно на объект, равно m:

Y = A0 + A1 · X1 + … + Am · Xm.



Так как подразумевается, что мы имеем экспериментальные данные о всех входах и выходах черного ящика, то можно вычислить ошибку между экспериментальным (YiЭксп.) и теоретическим (YiТеор.) значением Y для каждой i-ой точки (пусть, как и прежде, число экспериментальных точек равно n):

Ei = (YiЭксп.YiТеор.), i = 1, …, n;

Ei = YiA0A1 · X1i – … – Am · Xmi, i = 1, …, n.

Минимизируем суммарную ошибку F:



Ошибка ^ F зависит от выбора параметров A0, A1, …, Am. Для нахождения экстремума приравняем все частные производные F по неизвестным A0, A1, …, Am к нулю:



Получим систему из m + 1 уравнения с m + 1 неизвестными, которую следует решить, чтобы определить коэффициенты линейной множественной модели A0, A1, …, Am. Для нахождения коэффициентов представим систему в матричном виде:



Вычисляем коэффициенты A0, A1, …, Am.

Далее, по аналогии с одномерной моделью, для каждой точки вычисляется ошибка Ei; затем находится суммарная ошибка F и значения σ и S с целью определить, принимается ли выдвинутая гипотеза о линейности многомерного черного ящика или нет.
^ 3. ФИКСАЦИЯ И ОБРАБОТКА СТАТИСТИЧЕСКИХ РЕЗУЛЬТАТОВ

Рассмотрим, как следует фиксировать статистические величины в результате эксперимента, чтобы получить надежную информацию о свойствах моделируемого объекта. Напомним, что обобщенными характеристиками случайного процесса или явления являются средние величины.

^ Вычисление средних

Вычисление средних величин во время эксперимента, который многократно повторяется, а результат его усредняется, может быть организовано несколькими способами:

  • вся статистика вычисляется в конце;

  • вся статистика вычисляется в процессе вычисления (по рекурсивным соотношениям);

  • вся статистика вычисляется в классовых интервалах (этот метод совмещает универсальность первого метода и экономичность второго).

^ Способ 1. Вычисление всей статистики в конце. Для этого в процессе эксперимента значения Xi выходной (изучаемой) случайной величины X накапливается в массиве данных. После окончания эксперимента подсчитывается математическое ожидание (среднее) X и дисперсия D (характерный разброс величин относительно этого математического ожидания).





Часто используют среднеквадратичное отклонение σ = sqrt(D).

Заметим, что недостатком метода является неэффективное использование памяти, так как приходится накапливать и сохранять большое количество значений выходной величины в течение всего эксперимента, который может быть весьма продолжительным.

Второй минус заключается в том, что приходится дважды считывать массив Xi, так как воспользоваться формулой (2) в том виде, как она здесь записана, мы можем, только просчитав формулу (1) (от 1 до n), а потом еще раз прогнав для формулы (2) массив Xi.

Положительным моментом является сохранение всего массива данных, что дает возможность более подробного его изучения в дальнейшем при необходимости расследования тех или иных эффектов и результатов.

^ Способ 2. Вычисление всей статистики в процессе вычисления (по рекурсивным соотношениям). Этот способ предусматривает возможность хранить только текущее значение математического ожидания Xi и дисперсии Di, подправляемое на каждой итерации. Это избавляет нас от необходимости постоянного хранения всего массива экспериментальных данных. Каждое новое данное Xi учитывается в сумме с весовым коэффициентом — чем более слагаемых i накоплено в сумме Xi, тем более ее значение важно по отношению к очередной поправке Xi, поэтому соотношение весовых коэффициентов i/(i+1) : 1/(i+1).





где Xi — очередное значение экспериментальной выходной величины.

^ Способ 3. Вычисление всей статистики в классовых интервалах. Этот способ предполагает, что в массив будут накапливать не все значения Xi, а только по значимым интервалам, в которых распределена случайная выходная величина Xi. Общий интервал изменения Xi разбивается на m подинтервалов, в каждом из которых фиксируется количество ni, которое показывает, сколько раз Xi приняло значение из i-го интервала. При небольшом количестве интервалов (m≈1) мы получаем способ 1, при количестве интервалов m=n мы получаем способ 2. В случае 1<m < n получаем среднее решение — компромисс между занимаемой памятью и информативностью массива выходных данных.





^ Вычисление геометрии распределения

Еще более информативным является вычисление геометрии распределения случайной величины. Оно необходимо для того, чтобы представить себе более точно характер распределения. Известно, что по значению статистического момента можно приблизительно судить о геометрическом виде распределения.

^ Первый момент (или среднее арифметическое) вычисляется так:



Если A принимает значение 0, то первый момент называется начальным моментом, если A принимает значение X, то первый момент называется центральным. (В принципе A может быть любым числом, задаваемым исследователем.) Первый начальный момент = 0.

На практике принято использовать не сам первый момент, а нормированную его величину R1 = m1/σ1.

Первый момент указывает на центр тяжести в геометрии распределения, см. рис. 3.1.



Рис. 3.1. Характерное положение первого момента
на графике распределения статистической величины

1   2   3   4   5

Похожие:

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций по дисциплине Физико-механические методы обработки...
Конспект лекций предназначен для самостоятельного изучения студентами теоретической части курса “Физико-механические методы обработки”...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций по дисциплине «Автоматизированный электропривод»
Конспект лекций по дисциплине «Автоматизированный электропривод» (для студентов 4 курса всех форм обучения специальности 090603 –...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций по дисциплине “Статистика в машиностроении ” для студентов специальности
Конспект лекций предназначен для самостоятельного изучения студентами теоретической части курса “ Статистика в машиностроении ” (для...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций по дисциплине «Деньги и кредит»
Опорный конспект лекций по дисциплине «Деньги и кредит» для студентов специальности 03050801. “Финансы и кредит” и специальности...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций по дисциплине информационные и телекоммуникационные...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconМетодические указания к лабораторным работам по курсу «Системы моделирования и обработки данных»
Методические указания к лабораторным работам по курсу «Системы моделирования и обработки данных» (для студентов всех форм обучения...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций в схемах по дисциплине «управление персоналом»
Конспект лекций в схемах по дисциплине «Управление персоналом» (для студентов 5 курса направления подготовки 0502 “Менеджмент” специальности...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций и вопросов для самостоятельного изучения по дисциплине «Экономика предприятия»
Опорный конспект лекций и вопросов для самостоятельного изучения по дисциплине «Экономика предприятия» для студентов специальности...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций по дисциплине «Организация производства и маркетинг»
Конспект лекций по дисциплине «Организация производства и маркетинг» для студентов 3 курса специальностей 090600 – «Электротехнические...

Конспект лекций по дисциплине “Системы моделирования и обработки данных” для студентов специальности iconКонспект лекций по дисциплине “ основы защиты информации” для направления...
Министерство образования и науки украины восточноукраинский государственный университеТ

Вы можете разместить ссылку на наш сайт:
Школьные материалы


При копировании материала укажите ссылку © 2013
контакты
uchebilka.ru
Главная страница


<