刚才瞟见知乎有一个问题“如何用程序识别飞机和飞鸟?”以我粗浅的理解,毋庸置疑,第一步是给出足够量的飞机和飞鸟的样本数据,去训练程序,使得程序的准确率提升到非常高的平台期水平,99%以上;然后呢,譬如剩余的0.032%的误差,任何程序算法恐怕都很难解决,需要飞鸟、飞机这种单一样本维度之外的数据作为前置条件:a、比如现在是夜晚,是飞鸟的概率大大降低;b、如果在外太空,那么几乎肯定是航天飞机;c、在离地几十米的广场上空,那么既可能是飞鸟也可能是鸟形/飞机形的风筝。
这些多维度的前置条件,可能就是“大数据”所以为“大”的原因所在。万物互联在现有技术条件下还是个美好的愿望,在多维度的数据获取方面,短时间内机器恐怕还见不到超过人脑的希望。
在二级市场上,单维度的数据俯拾即是,实时快速的数据获取也不难,对有限几个维度的数据(价量、财务、舆情数据等)反复训练、挖掘仍然很有价值(虽然效果不及以前)。
但不要忘记,真实经济世界运行的维度和复杂度远大于我们可以获取的标准化数据,机器能够更高效地处理数据。但即使手里的长矛弓箭升级成了步枪刺刀,工具依然只能辅助、而非代替人脑面对广袤未知的幽暗森林。
领取专属 10元无门槛券
私享最新 技术干货