quartz/content/log/2023/9/log_27092023.md
2024-03-01 20:08:41 +08:00

1.6 KiB
Raw Blame History

title tags date
Log 2023.09.27 数学建模比赛结束的第二天
math
log
2023-09-27

What I learn from MCM

之前太小看数据科学家这行的深度了在面对一堆沆赃的数据面前执行一套什么样的标准化流程是我们应该从这次MCM中学到最重要的事情。

在我看来数据预处理即从一大堆数据中提取最后对我们有用的table出来的本领尤为重要因为往往现实的数据存在着缺失、异常、错误等等等如何detect到这些问题是一个不小的难点同时如何在剔除掉异常点后对每个数据做什么变化也值得人思考或许也可以通过gird search来解决

这次的MCM中最深刻的记忆还是加深了fitting任务的全流程最关键的就在于使用$R^2$进行GirdSearchCV。 $R^2$是衡量拟合度的scale量是一个非常好的fitting评价指标越接近1越说明fitting良好。

同时也也了解到了Grid Search和Random Search 的hyperparameter optimizationhyperparameter的重要性也曾经在SVM的一次任务中被教育了hyperparameter因为无法在训练过程中习得因此进行排列组合的尝试效果的gird search简单但是有效

通过什么样的方法去做数据扩增什么样的方法去做特征选择通过什么样的方法取衡量变量之间的关系data science这条路上有太多太多要我去学习的了。注重tatistics的基础一定要在每日的学习中继续sharpen自己的统计思维

比赛内容是复杂繁重的,一个良好的流程就是一套良好的架构,但我却被乱的满地找牙

我被MCM教育了