Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Линия тренда в эксель. Решение задач аппроксимации средствами Excel

Как поступить в случае, если для определенных объемов/размеров продукции хронометражные замеры отсутствуют? Или число замеров недостаточно, а дополнительные наблюдения в ближайшее время осуществить невозможно? Наилучший способ решения данной проблемы – построение расчетных зависимостей (уравнений регрессии) с помощью линий тренда в MS Excel.

Рассмотрим реальную ситуацию: на складе с целью установления величины трудовых затрат по коробочной отборке заказа были проведены хронометражные наблюдения. Результаты этих наблюдений представлены в таблице 1 ниже.

Впоследствии возникла необходимость определения затрат времени на отборку 0,6 и 0,9 м3 товара/заказа. В связи с невозможностью проведения дополнительных хронометражных исследований затраты времени на отборку данных объемов заказа были рассчитаны с помощью уравнений регрессии в MS Excel. Для этого таблица 1 была преобразована в таблицу 2.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Следующий шаг: курсор мыши был установлен на одной из точек графика и с помощью правой кнопки мыши было вызвано контекстное меню, в котором был выбран пункт: «добавить линию тренда» (рис.2).

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

В появившемся окне настройки формата линии тренда (рис. 3) были последовательно выбраны: тип линии линейная/степенная и установлены флажки на следующие пункты: «показать уравнение на диаграмме» и «поместить на диаграмме величину достоверности аппроксимации (R^2)» (коэффициент детерминации).

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

В результате были получены графики, представленные на рис. 4 и 5.

Примем за основную — линейную расчетную зависимость. Тогда значения затрат времени в зависимости от количества товара будут определяться по формуле: y = 54,511x + 0,1489. Результаты этих расчетов для количества товара, по которому ранее были проведены хронометражные наблюдения, представлены в таблице 3 ниже.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Определим среднее отклонение затрат времени, рассчитанных по уравнению регрессии от затрат времени, рассчитанных по данным хронометражных наблюдений: (-0,05+0,10-0,05+0,01)/4=0,0019. Таким образом, затраты времени, рассчитанные по уравнению регрессии отличаются от затрат времени, рассчитанных по данным хронометражных наблюдений всего на 0,19%. Расхождение данных ничтожно мало.

По формуле: y = 54,511x + 0,1489 установим затраты времени для количества товара, по которому ранее не были проведены хронометражные наблюдения (таблица 4).

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Таким образом, построение расчетных зависимостей с помощью линий тренда в MS Excel – это отличный способ установления затрат времени по операциям, которые в силу различных причин не были охвачены хронометражными наблюдениями.

В меню «Диаграмма» выберите пункт «Добавить линию тренда». В открывшемся окне на вкладке «Тип» выберите необходимый тип линии тренда, что в математическом эквиваленте также означает и способ аппроксимации данных. При использовании описываемого метода вам придется делать это «на глаз», т.к. никаких математических вычислений для построения графика вы не проводили.

Сравнивая значения R^2 для разных линий, вы сможете выбрать тот тип графика, который характеризует ваши данные наиболее точно, а, следовательно, строит наиболее достоверный прогноз. Чем ближе значение R^2 к единице, тем точнее вы выбрали тип линии. Здесь же, на вкладке «Параметры», вам необходимо указать период, на который делается прогноз.

Такой способ построения тренда является весьма приблизительным, поэтому лучше все-таки произвести хотя бы самую примитивную статистическую обработку имеющихся данных. Это позволит построить прогноз более точно.

Если вы предполагаете, что имеющиеся данные описываются линейным уравнением, просто выделите их курсором и произведите автозаполнение на необходимое число периодов, или количество ячеек. В данном случае нет необходимости находить значение R^2, т.к. вы заранее подогнали прогноз к уравнению прямой.

Если же вы считаете, что известные значения переменной лучше всего могут быть описаны с помощью экспоненциального уравнения, также выделите исходный диапазон и произведите автозаполнение необходимого количества ячеек, удерживая правую клавишу мыши. При помощи автозаполнения вы не сможете построить других типов линий, кроме двух указанных.

Средняя ошибка аппроксимации в excel. Оценка качества уравнения регрессии
Интерполяция – это замена исходной функции f(x) функцией φ(x) так, чтобы φ(x) точно проходила через точки исходной функции f(x). Интерполяция еще называется точечной аппроксимацией. Точки исходной функции f(x) называются узлами интерполяции.
Знайка, самый умный эксперт в Цветочном городе
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
Необходимо подобрать формулу для вычисления эмпирических теоретических значений y и вычислить прогнозное значение y с данными х1 42, х2 11, х3 5. Если же вы хотите что-то уточнить, я с радостью помогу!
Статистические гипотезы
В предыдущих параграфах рассматривалась методика моделирования взаимосвязей экономических показателей и процессов. С помощью полученных уравнений регрессии моделировалась эта связь.
Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Линейная фильтрация в excel. Решение задач аппроксимации средствами Excel

Ошибка аппроксимации
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации — среднее отклонение расчетных значений от фактических:

Средняя ошибка аппроксимации в excel. Оценка качества уравнения регрессии

Значение средней ошибки аппроксимации до 15% свидетельствует о хорошо подобранной модели уравнения.

По семи территориям Уральского района за 199Х г. известны значения двух признаков.

Требуется:
1. Для характеристики зависимости у от х рассчитать параметры следующих функций:
а) линейной;
б) степенной;
в) показательной;
г) равносторонней гиперболы (так же нужно придумать как предварительно линеаризовать данную модель).
2. Оценить каждую модель через среднюю ошибку аппроксимации А ср и F-критерий Фишера.

Получаем b = -0.35, a = 76.88
Уравнение регрессии:
y = -0.35 x + 76.88

Примечание: значения y(x) находятся из полученного уравнения регрессии:
y(45.1) = -0.35*45.1 + 76.88 = 61.28
y(59) = -0.35*59 + 76.88 = 56.47
. . .

Ошибка аппроксимации
Оценим качество уравнения регрессии с помощью ошибки абсолютной аппроксимации. Средняя ошибка аппроксимации — среднее отклонение расчетных значений от фактических:

Поскольку ошибка меньше 15%, то данное уравнение можно использовать в качестве регрессии.

Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Делаем вывод: С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.

Означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х — среднедушевого прожиточного минимума, а 48% — действием других факторов, не включённых в модель.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

По вычисленному коэффициенту детерминации можно рассчитать коэффициент корреляции: .

4. С помощью среднего (общего) коэффициента эластичности определим силу влияния фактора на результат.

Для уравнения прямой средний (общий) коэффициент эластичности определим по формуле:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Средние значения найдём, выделив область ячеек со значениями х, и выберем Формулы / Автосумма / Среднее , и то же самое произведём со значениями у.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Рисунок 5 Расчёт средних значений функции и аргумент

Таким образом, при изменении среднедушевого прожиточного минимума на 1% от своего среднего значения среднедневная заработная плата изменится в среднем на 0,51%.

С помощью инструмента анализа данных Регрессия можно получить:
— результаты регрессионной статистики,
— результаты дисперсионного анализа,
— результаты доверительных интервалов,
— остатки и графики подбора линии регрессии,
— остатки и нормальную вероятность.

1) проверьте доступ к Пакету анализа . В главном меню последовательно выберите: Файл/Параметры/Надстройки .

2) В раскрывающемся списке Управление выберите пункт Надстройки Excel и нажмите кнопку Перейти.

3) В окне Надстройки установите флажок Пакет анализа , а затем нажмите кнопку ОК .

Если Пакет анализа отсутствует в списке поля Доступные надстройки , нажмите кнопку Обзор , чтобы выполнить поиск.

Если выводится сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да , чтобы установить его.

4) В главном меню последовательно выберите: Данные / Анализ данных / Инструменты анализа / Регрессия , а затем нажмите кнопку ОК .

5) Заполните диалоговое окно ввода данных и параметров вывода:

Входной интервал Y — диапазон, содержащий данные результативного признака;

Входной интервал X — диапазон, содержащий данные факторного признака;

Метки — флажок, который указывает, содержит ли первая строка названия столбцов или нет;

Константа — ноль — флажок, указывающий на наличие или отсутствие свободного члена в уравнении;

Выходной интервал — достаточно указать левую верхнюю ячейку будущего диапазона;

6) Новый рабочий лист — можно задать произвольное имя нового листа.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Рисунок 6 Диалоговое окно ввода параметров инструмента Регрессия

Результаты регрессионного анализа для данных задачи представлены на рисунке 7.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Рисунок 7 Результат применения инструмента регрессия

5. Оценим с помощью средней ошибки аппроксимации качество уравнений. Воспользуемся результатами регрессионного анализа представленного на Рисунке 8.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Рисунок 8 Результат применения инструмента регрессия «Вывод остатка»

Составим новую таблицу как показано на рисунке 9. В графе С рассчитаем относительную ошибку аппроксимации по формуле:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Средняя ошибка аппроксимации рассчитывается по формуле:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Качество построенной модели оценивается как хорошее, так как не превышает 8 — 10%.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

6. Из таблицы с регрессионной статистикой (Рисунок 4) выпишем фактическое значение F-критерия Фишера:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Поскольку при 5%-ном уровне значимости, то можно сделать вывод о значимости уравнения регрессии (связь доказана).

8. Оценку статистической значимости параметров регрессии проведём с помощью t-статистики Стьюдента и путём расчёта доверительного интервала каждого из показателей.

Выдвигаем гипотезу Н 0 о статистически незначимом отличии показателей от нуля:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

для числа степеней свободы

t-критерий для коэффициента корреляции можно рассчитать двумя способами:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

где — случайная ошибка коэффициента корреляции.

Данные для расчёта возьмём из таблицы на Рисунке 7.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Фактические значения t-статистики превосходят табличные значения:

Поэтому гипотеза Н 0 отклоняется, то есть параметры регрессии и коэффициент корреляции не случайно отличаются от нуля, а статистически значимы.

Доверительный интервал для параметра a определяется как

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Для параметра a 95%-ные границы как показано на рисунке 7 составили:

Доверительный интервал для коэффициента регрессии определяется как

Для коэффициента регрессии b 95%-ные границы как показано на рисунке 7 составили:

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.

7. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:

Тогда прогнозное значение прожиточного минимума составит:

где

Дисперсию посчитаем также с помощью ППП Excel. Для этого:

1) Активизируйте Мастер функций : в главном меню выберете Формулы / Вставить функцию .

3) Заполните диапазон, содержащий числовые данные факторного признака. Нажмите ОК .

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Получили значение дисперсии

Для подсчёта остаточной дисперсии на одну степень свободы воспользуемся результатами дисперсионного анализа как показано на Рисунке 7.

Доверительные интервалы прогноза индивидуальных значений у при с вероятностью 0,95 определяются выражением:

Интервал достаточно широк, прежде всего, за счёт малого объёма наблюдений. В целом выполненный прогноз среднемесячной заработной платы оказался надёжным.

Условие задачи взято из: Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. — М.: Финансы и статистика, 2003. — 192 с.: ил.

показывает, какая доля изменения исследуемого признака учтена в модели. Другими словами коэффициент детерминации показывает, какая часть изменения исследуемой переменной может быть вычислена, исходя из изменений включённых в модель факторных переменных с помощью выбранного типа функции, связывающей факторные переменные и исследуемый признак в уравнении модели.

Коэффициент детерминации R 2 может принимать значения от 0 до 1. Чем ближе коэффициент детерминации R 2 к единице, тем лучше качество модели.

Индекс корреляции можно легко вычислить, зная коэффициент детерминации:

F-критерий Фишера используется для оценки значимости уравнения регрессии. Расчётное значение F-критерия определяется из соотношения:

Определим характеристики качества построенной нами линейной модели для Примера 1 . Воспользуемся данными Таблицы 2. Коэффициент детерминации :

Следовательно, в рамках линейной модели изменение объёма продаж на 90,1% объясняется изменением температуры воздуха.

Критическое значение F кр при α = 0,1; ν 1 =1; ν 2 =7-1-1=5 равно 4,06. Расчётное значение F -критерия больше табличного, следовательно, уравнение модели является значимым.

Построенная линейная модель парной регрессии имеет неудовлетворительную точность (>15%), и её не рекомендуется использовать для анализа и прогнозирования.

В итоге, несмотря на то, что большинство статистических характеристик удовлетворяют предъявляемым к ним критериям, линейная модель парной регрессии непригодна для прогнозирования объёма продаж в зависимости от температуры воздуха. Нелинейный характер зависимости между указанными переменными по данным наблюдений достаточно хорошо виден на Рис.1. Проведённый анализ это подтвердил.

Главный инструмент, с помощью которого проводится сглаживания в Excel – это построение линии тренда. Суть состоит в том, что на основе уже имеющихся показателей достраивается график функции на будущие периоды. Основное предназначение линии тренда, как не трудно догадаться, это составление прогнозов или выявление общей тенденции.

Но она может быть построена с применением одного из пяти видов аппроксимации:

Рассмотрим каждый из вариантов более подробно в отдельности.

Способ 1: линейное сглаживание

Прежде всего, давайте рассмотрим самый простой вариант аппроксимации, а именно с помощью линейной функции. На нем мы остановимся подробнее всего, так как изложим общие моменты характерные и для других способов, а именно построение графика и некоторые другие нюансы, на которых при рассмотрении последующих вариантов уже останавливаться не будем.

Прежде всего, построим график, на основании которого будем проводить процедуру сглаживания. Для построения графика возьмем таблицу, в которой помесячно указана себестоимость единицы продукции, производимой предприятием, и соответствующая прибыль в данном периоде. Графическая функция, которую мы построим, будет отображать зависимость увеличения прибыли от уменьшения себестоимости продукции.

Сглаживание, которое используется в данном случае, описывается следующей формулой:

В конкретно нашем случае формула принимает такой вид:

Величина достоверности аппроксимации у нас равна 0,9418 , что является довольно приемлемым итогом, характеризующим сглаживание, как достоверное.

Способ 2: экспоненциальная аппроксимация

Теперь давайте рассмотрим экспоненциальный тип аппроксимации в Эксель.

В конкретно нашем случае формула приняла следующую форму:

Способ 3: логарифмическое сглаживание

Теперь настала очередь рассмотреть метод логарифмической аппроксимации.

где ln – это величина натурального логарифма. Отсюда и наименование метода.

Способ 4: полиномиальное сглаживание

Настал черед рассмотреть метод полиномиального сглаживания.

Формула, которая описывает данный тип сглаживания, приняла следующий вид:

Способ 5: степенное сглаживание

В завершении рассмотрим метод степенной аппроксимации в Excel.

Данный способ эффективно используется в случаях интенсивного изменения данных функции. Важно учесть, что этот вариант применим только при условии, что функция и аргумент не принимают отрицательных или нулевых значений.

Общая формула, описывающая данный метод имеет такой вид:

Если вы пока не можете сразу определить, основываясь на вышеприведенных рекомендациях, какой вид аппроксимации подойдет конкретно в вашем случае, то есть смысл попробовать все методы. После построения линии тренда и просмотра её уровня достоверности можно будет выбрать оптимальный вариант.

Знайка, самый умный эксперт в Цветочном городе
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
Следом в данном меню нужно нажать на кнопку Линия тренда и выбрать линейное приближение или же экспоненциальное приближение. Если же вы хотите что-то уточнить, я с радостью помогу!
Следующее действие построение самой линии тренда . Итак, для этого необходимо вновь выделить график и выбрать вкладку «Макет» на ленте задач. Следом в данном меню нужно нажать на кнопку «Линия тренда » и выбрать «линейное приближение» или же «экспоненциальное приближение».

Аппроксимация как метод исследования числовых характеристик

Если же вы считаете, что известные значения переменной лучше всего могут быть описаны с помощью экспоненциального уравнения, также выделите исходный диапазон и произведите автозаполнение необходимого количества ячеек, удерживая правую клавишу мыши. При помощи автозаполнения вы не сможете построить других типов линий, кроме двух указанных.

Регрессионные модели. Аппроксимация данных. Подбор формул со многими неизвестными

Задача. Известны данные динамики выпуска продукции предприятия за 10 лет (набор из n=10 экспериментальных точек):

X – порядковый номер года с 2001 по 2010; Y – объем валовой продукции предприятия.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Используя имеющиеся экспериментальные данные, необходимо построить регрессионную модель (т.е. определить функцию черного ящика), по которой вход преобразуется в выход.

Занесите экспериментальные данные в таблицу Excel:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Предположим, что экспериментальные данные подчиняются линейному закону, т.е. выдвигаем гипотезу о линейной модели: Y = aX + b.

Построение модели выполним по методу наименьших квадратов, суть которого в том, что необходимо найти такие значения коэффициентов a и b, при которых сумма квадратов отклонений F экспериментальных данных от расчетных (теоретических) значений Y будет минимальной:

Здесь: Ei – ошибки между экспериментальными данными и расчетными значениями Y; F – суммарная ошибка (сумма квадратов отклонений).

Ei = (Yi Эксп . – Yi Теор . ) = YibaXi, i = 1, …, n.

Для определения значений b и a, которые доставляют экстремум функции F, надо найти частные производные по переменным b и a и приравнять их к нулю (условие экстремума):

После раскрытия скобок получится система линейных уравнений:

Для решения данной системы составьте в Excel таблицу промежуточных вычислений, используя соответствующие формулы и функцию СУММ:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Полученная система линейных уравнений в матричной форме имеет вид:

Подстановка из таблицы соответствующих значений сумм при решении системы «вручную» дает:

Существуют следующие способы решения системы линейных уравнений (определения коэффициентов b и a):

При решении системы методом Крамера получаются следующие выражения для b и a:

Введите данное решение в таблицу Excel:

Здесь для вычисления общего числа точек n использована функция СЧЁТ.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Удостоверьтесь, что полученные с помощью Excel и «вручную» значения b и a совпадают.

Существует также способ определения коэффициентов b и a с использованием расчетных формул, представленных в развернутом (скалярном) виде:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

где – средние значения Y и X (в Excel реализуется функцией СРЗНАЧ).

Решение задачи данным способом выполните на самостоятельной подготовке. Таблица Excel с расчетами этим способом имеет вид:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Итак, найденные значения b = 11.8 и a = 0.89 обеспечивают прохождение графика Y = aX + b как можно ближе одновременно ко всем экспериментальным точкам. Таким образом, получено линейное уравнение: Y = 0.89X + 11.8.

Произведите расчеты теоретических (эмпирических) значений Yi теор. по данной линейной функции. Для расчетов используйте абсолютные ссылки (знак $) на ячейки с полученными значениями b и a.

Для ожидаемого значения Xож=11 (на 11-й год) определите прогнозное значение Y(Xож=11).

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Теперь необходимо проверить правомерность принятой гипотезы о полученной линейной зависимости Y = 0.89X + 11.8.

Для этого необходимо рассчитать ошибку Ei между экспериментальными точками Y и точками полученной теоретической зависимости Y теор. , суммарную ошибку F, значение стандартного отклонения σ и вероятного отклонения S по формулам:

Ei = YibaXi, i = 1, …, n

S = σ/sinβ = σ/sin(90°–arctga) = σ/cos(arctga).

Такая зависимость между S и σ получена из рисунка:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Для проверки правильности принятия гипотезы используется нормальный закон распределения случайных ошибок. На рисунке P – вероятность распределения ошибки.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Рис. Иллюстрация закона нормального распределения ошибок

Если в полосу, ограниченную линиями Y теор —S = aX+bS и Y теор +S = aX+b+S попадет 68.26% или более из всех экспериментальных точек, то можно сделать вывод о том, что принятая гипотеза о линейной зависимости Y = aX + b верна.

Создайте таблицу для расчетов ошибок между точками экспериментальной и теоретической зависимости:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Примечание: формулы последнего столбца L реализованы с использованием функций ЕСЛИ и И.

Значение .

Таблица результатов создания регрессионной линейной модели:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Расчеты показывают, что 7 точек из 10 (то есть 70%) попадают в полосу, ограниченную линиями Yнижняя = 0.89X + 11.8 – 1.38 и Yверхняя = 0.89X + 11.8 + 1.38, из чего заключаем: зависимость между входом и выходом модели линейная, то есть выдвинутая гипотеза о линейной зависимости верна.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Рис. Найденная линейная зависимость с обозначенным интервалом [–S; +S]

2. Прогнозирование с помощью линий тренда

Линии тренда графиков Excel используются для установления зависимости и исследования связи между двумя переменными.

Задача. Условия задачи остаются прежними (как в пункте 1).

1. Введите значения X и Y по столбцам,скопировав лист с данными из п.1.

2. Постройте график зависимости Y(X), используя тип диаграммы «Точечная, с гладкими кривыми и маркерами».

3. Поставьте указатель мыши на линию графика функции, правая кнопка мыши – контекстное меню «Добавить линию тренда».

4. Установите параметры: тип тренда «линейная», «прогноз вперед на 1 период», «показывать уравнение на диаграмме», «поместить величину достоверности аппроксимации R^2».

5. Введите заголовок диаграммы «Прогноз объема производства на 11-й год».

6. Повторите пункты 2, 3, 4 для получения прогноза по следующим функциям: логарифмическая, полиномиальная второй степени, степенная, экспоненциальная.

7. Выберите лучшую модель по критерию R^2, которая лучше остальных описывает зависимость Y от X. Коэффициент детерминации R^2 равен доле исходных данных, которые подчиняются выбранной тенденции.

8. Произведите расчеты теоретических значений Yi теор. и прогнозного значения Yпрогн для ожидаемого Xож = 11 по наилучшей модели.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

3. Прогнозирование по методу наименьших квадратов с помощью матричных операций

Задача остается прежней: вычислить коэффициенты линейной модели b и a по методу наименьших квадратов, но только с помощью матричных операций.

Матричный способ решения построения модели имеет преимущества и недостатки.

Преимущества: компактность записи формул; исследование многофакторных моделей.

Недостатки: необходимость знания матричной алгебры; необходимость наличия программных средств выполнения матричных операций (Excel выполняет все матричные вычисления, кроме вычисления собственных значений и собственных векторов).

— транспонирование – функция ТРАНПС категории «Ссылки и массивы»;

— вычисление обратной матрицы – функция МОБР категории «Математические»;

— умножение матриц – функция МУМНОЖ категории «Математические».

1. после выбора функции установить нужные аргументы и выполнить расчеты для первой ячейки результирующего массива;

2. выделить первую ячейку с расчетами и все ячейки, на которые будет распространено действие функции;

4. последовательно нажать, не отпуская, клавиши Ctrl + Shift + Enter.

1. Введите данные Xi и Yi по столбцам. Для этого достаточно скопировать лист, в котором решалась задача в п.1, и удалить на новом листе всю лишнюю информацию, кроме таблицы с данными Xi и Yi.

2. Выполните расчет коэффициентов модели a и b в матричном виде по формуле:

X – матрица исходных данных, которая включает вектор-столбец переменной для свободного коэффициента b (его значения в нашем случае равны 1) и векторы-столбцы объясняемых факторов (в нашем случае – один столбец со значениями Xi);

(X Т X) -1 – обратная матрица от произведения двух матриц;

3. Вычислите коэффициенты модели a и b в матричном виде в последовательности, как показано на рисунке.

4. Вычислите расчетные (теоретические) значения Yi теор , прогнозное значение Yпрогн для Xожид=11.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Разобранный пример – учебный. Поэтому мы ограничились очень небольшим числом экспериментальных точек. В реальных условиях для обеспечения достоверности результатов исследования нужно брать гораздо большее число экспериментальных точек.

4. Построение многофакторных регрессионных моделей с помощью матричных операций

Для зависимостей со многими неизвестными подбор формул можно выполнить несколькими способами:

— с помощью функций из группы Статистические — ЛИНЕЙН и ЛГРФПРИБЛ.

— функции ТЕНДЕНЦИЯ и РОСТ – для вычисления значений аппроксимирующей функции в диапазоне наблюдения;

— инструмент для подбора формул со многими неизвестными Регрессия, входящий в Пакет анализа (Данные – Анализ данных…);

— матричными вычислениями по методу наименьших квадратов.

Необходимо подобрать формулу для вычисления эмпирических (теоретических) значений y и вычислить прогнозное значение y с данными: х1 = 42, х2 = 11, х3 = 5.

1. Заведите таблицу с данными в ячейки A1:D14. Результаты ввода:

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

2. Выполните расчет коэффициентов модели в матричном виде по формуле:

Здесь А – вектор-столбец неизвестных коэффициентов a0, a1, a2, a3.

Последовательность расчета показана на нижних рисунках.

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Что Такое в Excel Достоверность Аппроксимации • Тренд как модель

Таким образом, аппроксимирующая формула y=a0+a1x1+a2x2+a3x3 имеет вид:

3. С использованием полученной формулы вычислите теоретические значения yтеор и прогнозное значение функции yпрогн при х1=42, х2=11, х3=5, записав самостоятельно в любую ячейку формулу для расчета.Результат расчета: yпрогн=37,9.

5. Прогнозирование с использованием функций ЛИНЕЙН и ТЕНДЕНЦИЯ

Функции ЛИНЕЙН и ТЕНДЕНЦИЯ применяют для аппроксимации экспериментальных данных линейные зависимости вида y = a0+ a1x1 + a2x2 + … + anxn.

Функция ЛИНЕЙН возвращает массив с т.н. регрессионной статистикой, который содержит вычисленные значения параметров (a0, a1, a2, …, an), коэффициент детерминации R 2 и другие характеристики аппроксимирующей функции.

Задача: Исходные данные те же, что и в п. 4. Необходимо также построить линейную регрессионную модель: y=a0+a1x1+a2x2+a3x3, но только с помощью функций ЛИНЕЙН и ТЕНДЕНЦИЯ, а также вычислить прогнозное значение y с данными: х1=37, х2=11, х3=3.

Организация как механизм и форма жизни коллектива: Организация не сможет достичь поставленных целей без соответствующей внутренней.

Как распознать напряжение: Говоря о мышечном напряжении, мы в первую очередь имеем в виду мускулы, прикрепленные к костям .

Почему человек чувствует себя несчастным?: Для начала определим, что такое несчастье. Несчастьем мы будем считать психологическое состояние.

Модели организации как закрытой, открытой, частично открытой системы: Закрытая система имеет жесткие фиксированные границы, ее действия относительно независимы.

©2015-2022 megaobuchalka.ru Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. (1309)

Знайка, самый умный эксперт в Цветочном городе
Мнение эксперта
Знайка, самый умный эксперт в Цветочном городе
Если у вас есть вопросы, задавайте их мне!
Задать вопрос эксперту
выделяем диапазон с известными значениями описываемого показателя Y в нашем случае ВВП, на скриншоте диапазон выделен синим и ставим точку с запятой. Если же вы хотите что-то уточнить, я с радостью помогу!
Добавим к исходным данным еще один столбец, который назовем t и пометим цифрами по возрастающей порядковые номера всех зафиксированных значений ВВП за указанный период с 2004-го по 2012-й гг. – 9 лет или 9 периодов .

Регрессионные модели. Аппроксимация данных. Подбор формул со многими неизвестными — Мегаобучалка

Рассчитать коэффициенты модели можно стандартным Методом наименьших квадратов (МНК). Со всеми этими расчетами Microsoft Excel справляется на ура самостоятельно, при чем, чтобы получить модель линейного тренда либо готовый прогноз существует целых пять способов, которые мы по отдельности разберем ниже.

Оставить отзыв

Публикуя свою персональную информацию в открытом доступе на нашем сайте вы, даете согласие на обработку персональных данных и самостоятельно несете ответственность за содержание высказываний, мнений и предоставляемых данных. Мы никак не используем, не продаем и не передаем ваши данные третьим лицам.