我有一组变量X1、X2和Y,它们之间的关系图如下所示。X2值用于颜色编码。
X1、X2和X3是整数变量。
观察到的模式是多模态的。
基于X1和X2的预测Y的最佳方法是什么?
我们可以使用非线性或跨栏模型来解决这个问题吗?
此外,在R中实现这一目标的工具有哪些?
发布于 2022-02-15 09:25:02
一般来说,没有必要担心反应的分布。虽然您显示的是双变量图,但多模可能是由X2
(或其他丢失的变量)解释的。
重要的是模型残差的分布(如果有关系的话)。
如果残差是非正常的,那么某些推论可能是无效的,尽管如果使用模型进行预测,这可能根本不是一个问题。
如果你真的有一个曲线关联,那么你可以考虑:
当然,如果根本的问题是缺少解释变量,那么这些方法中的一些可能会导致模型过度拟合。
https://stackoverflow.com/questions/71117821
复制相似问题