Век живи – век учись.
За 15 лет первый раз потребовалось работать со статистикой :). В проекте для планирования и прогнозирования потребовалось обрабатывать данные за предыдущие годы для формирования прогноза на следующий.
Для реализации выбраны две методики – среднее значение, и значение, полученное методом наименьших квадратов. Вот тут и задумался, как реализовать вторую методику, насколько “зависнет” дальнейшая разработка, пока буду реализовывать само решение метода. Однако, какое облегчение – все давно реализовано в самой СУБД (SQL Language Reference):
REGR_ (Linear Regression) Functions
The linear regression functions are:
- REGR_SLOPE
- REGR_INTERCEPT
- REGR_COUNT
- REGR_R2
- REGR_AVGX
- REGR_AVGY
- REGR_SXX
- REGR_SYY
- REGR_SXY
Первых двух функций как раз достаточно. Единственное, надо обратить внимание на результат, если в выборке одна пара значений – вернется NULL, и это правильно. Тогда, например, можно взять для прогноза то же значение, что и в выборке.