我不确定合适的术语是什么,但在尝试运行模拟时,我总是发现创建好的假数据很棘手。
我没有一个特别的应用程序,但是假设我想玩一些愚蠢的股市预测算法-如果我只是使用一个标准的随机数生成器来获得我的测试数据,它将全部在.5附近徘徊,甚至在很短的时间间隔内,这不会真正产生股票市场通常在一天中产生的那种数据(将其与股票图表进行比较)。即使市场收盘时没有涨跌,你可能仍然会发现中间的波动--简单的随机游走不会产生同样的效果。
我猜你可以将rngs堆叠在另一个之上,一个较大的数值表示全天值,一个较小的数值每小时,以及一个数值仍然是每秒,将它们加在一起得到一个更像步长的模式,但这真的太可预测了-作为开发人员,你知道这些步骤将在哪里,或者如果你随机化持续时间,很可能会是这样。
我想,你可以从字面上模拟单个买家和卖家的个性,但这需要大量的工作和计算。(据我所知,真实的股市数据不能以原始形式免费获得)
那么,我们可以去寻找免费的,容易访问的,快速流动的,“有趣的”数据吗?
发布于 2009-09-09 00:23:25
实现股票价格变动的天真方法是使用normal (高斯)分布,但这不会生成真实的数据。高斯分布低估了价格大幅下跌的风险(称为“厚尾”现象)。
早在20世纪60年代,曼德尔布洛特(是的,分形专家)就证明了cotton price movements适合Levy distribution。
看一下:
的方法
另一件需要考虑的事情是,随着时间的推移,调整后的股票价格(针对拆分等因素)往往会上升。在统计学术语中,这称为异方差,从建模的角度来看,这往往是不可取的。这通常通过两种方式进行分解:
希望这能有所帮助。
发布于 2009-09-09 00:16:57
为什么要使用假数据?为什么不从几年前收集一些随机的股票数据,并使用这些数据来测试您的算法?
发布于 2009-09-09 00:20:54
您可以使用Google Finance API从一组100个符号中获取去年某一天的随机符号的实际股票数据。这应该提供真实的数据,希望这些数据足够随机,以满足您的目的。
https://stackoverflow.com/questions/1396978
复制相似问题