我正在寻求帮助解决以下问题。
数据集中有两个子样本--一个是真实的(有效的),另一个是近似的(我还不知道它有什么不同,一个是公寓的实际价格,另一个是广告的价格,当然,你需要预测真实的一个)。对此有什么想法吗?我有两个想法-规范目标从广告(带来期望和变化到一个真正的目标),并修改损失,使其惩罚更多的错误在一个真正的目标。没有更多的想法。因此,我寻求帮助。
更新:抱歉对细节太吝啬了。问题是如何预测房价,这是由专业房地产经纪人做的。该数据集具有许多特征(例如在某个半径内的商店数量、距离最近的学校的距离等),我们在该数据集中有两个子集:第一个是包含房地产经纪人开发的价格的数据集,第二个是包含广告价格的子集。我们的目标是像房地产经纪人那样预测价格,但当然,房地产经纪人的预测是昂贵的,所以我们没有足够的数据,我们也使用来自广告的数据。因此,我想问的是,用广告的目标值来处理子集的最佳方法是什么。
https://datascience.stackexchange.com/questions/102410
复制