在进行线性回归时,我们曾采用正则化线性回归来预测房价。然而,在使用新房屋样本进行预测时,发现预测结果存在较大误差,需要改进我们的算法。接下来我们应该怎么做?
有许多途径可以提升该算法的表现:
增加更多训练样本:尽管可以通过上门或电话调查收集更多房屋销售数据,但实际上这样做效果有限。
减少特征数量:去除一些关键特征可能会产生负面影响。相反,增加更多特征,例如进行土地测量等工作,虽然增加了计算量,但可能导致过拟合。引入多项式特征也可能导致过拟合问题。调整正则化参数λ的大小也是一个选项。增大或减小λ值可能会带来不同的效果。
以上方法往往依赖直觉选择,可能耗费大量时间却未必能得到理想的结果。
幸运的是,有一些简便的方法可以帮助我们更高效地选择最佳方案:
通过这些评估手段,我们可以更科学地判断哪些方法更有效,从而快速优化我们的模型。