Метод наименьших квадратов

Век живи – век учись.
За 15 лет первый раз потребовалось работать со статистикой :). В проекте для планирования и прогнозирования потребовалось обрабатывать данные за предыдущие годы для формирования прогноза на следующий.
Для реализации выбраны две методики – среднее значение, и значение, полученное методом наименьших квадратов. Вот тут и задумался, как реализовать вторую методику, насколько “зависнет” дальнейшая разработка, пока буду реализовывать само решение метода. Однако, какое облегчение – все давно реализовано в самой СУБД (SQL Language Reference):
REGR_ (Linear Regression) Functions
The linear regression functions are:

  • REGR_SLOPE
  • REGR_INTERCEPT
  • REGR_COUNT
  • REGR_R2
  • REGR_AVGX
  • REGR_AVGY
  • REGR_SXX
  • REGR_SYY
  • REGR_SXY

Первых двух функций как раз достаточно. Единственное, надо обратить внимание на результат, если в выборке одна пара значений – вернется NULL, и это правильно. Тогда, например, можно взять для прогноза то же значение, что и в выборке.

Leave a Reply

Your email address will not be published. Required fields are marked *