quartz/error_function.md at b8846908ed6f7d88a9cf7d5768d6f2161c7af78e

GitHub/quartz

Fork 2

mirror of https://github.com/jackyzha0/quartz.git synced 2025-12-28 07:14:05 -06:00

PinkR1ver 675abf7265 Add note

2024-04-03 10:31:06 +08:00

2.4 KiB

Raw Blame History

title

tags

date

Error function we can choose in curve fitting

basic

data

math

2024-04-01

在曲线拟合中，选择误差函数（error function）是为了衡量模型预测值与实际观测值之间的差异。误差函数通常用于优化过程中，指导算法调整模型参数以最小化误差。以下是一些常用的误差函数：

均方误差（Mean Squared Error, MSE）:
- 误差的平方和的平均值，是最常用的误差函数之一。
- 公式：$MSE = (1/n) * Σ(y_i - f(x_i))^2$，其中$y_i$是实际观测值，$f(x_i)$是模型预测值，$n$是数据点的数量。
均方根误差（Root Mean Squared Error, RMSE）:
- MSE的平方根，与观测值具有相同的单位，因此更容易解释。
- 公式：$RMSE = √(1/n) * Σ(y_i - f(x_i))^2$。
平均绝对误差（Mean Absolute Error, MAE）:
- 误差的绝对值的平均值，对异常值不如MSE敏感。
- 公式：$MAE = (1/n) * Σ|y_i - f(x_i)|$。
平均绝对百分比误差（Mean Absolute Percentage Error, MAPE）:
- 误差与实际观测值的百分比的绝对值的平均值，常用于百分比或比率数据的拟合。
- 公式：$MAPE = (1/n) * Σ|(y_i - f(x_i))/y_i| * 100%$。
对数似然误差（Log-Likelihood Error）:
- 常用于概率模型，如最大似然估计。
- 公式依赖于特定的概率分布。
交叉熵误差（Cross-Entropy Error）:
- 也称为对数损失，常用于分类问题和神经网络的训练。
- 公式：$Cross-Entropy = -Σy_i * log(f(x_i)) + (1 - y_i) * log(1 - f(x_i))$。
Huber损失（Huber Loss）:
- 结合了MSE和MAE的特点，对异常值具有较强的鲁棒性。
- 公式：$Huber(y_i, f(x_i), δ) = |y_i - f(x_i)| if |y_i - f(x_i)| ≤ δ, (1/2) * (|y_i - f(x_i)|^2 - δ^2) otherwise$。
分位数损失（Quantile Loss）:
- 用于分位数回归，关注模型预测的分位数与实际观测值的分位数之间的误差。
- 公式：$Quantile Loss = Σ(τ * (y_i - f(x_i)) if y_i > f(x_i), (1 - τ) * (f(x_i) - y_i) otherwise$，其中τ是分位数。

在选择误差函数时，应考虑数据的特性、模型的目的和误差分布。例如，对于包含许多异常值的数据，使用Huber损失或MAE可能更合适。对于概率预测问题，对数似然误差或交叉熵误差可能更适用。

2.4 KiB Raw Blame History Unescape Escape

2.4 KiB

Raw Blame History