首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

算法岗位做数据挖掘大多都是抽特征跑跑现成模型”

这句话,说起来很简单,看起来也很容易,但真的是这样吗? 我列举几点,扩展一下上面这句话: 1、label符合业务场景吗?label准确吗?能够校准吗?放在哪张表里,怎么正确关联特征? 2、特征合理吗?预处理流程正确吗?有效吗?特征会泄露标签信息吗?特征时间维度一致吗? 3、用什么模型?模型出来的结果有什么业务含义?该怎么定义合适的指标来判断模型的性能? 4、根据模型结果,怎么回调特征,参数? 还有很多。造轮子,在工业界的数据挖据流程当中真的不重要。 假设你很牛逼,造了个GBDT,但是你比xgboost在同一数据集下好上多少?一个点?两个点?快上几秒?在牛比的特征工程面前都没有太大意义。

03

Facebook推出Spiral:通过实时机器学习自动调节服务

对于使用Facebook的数十亿人来说,我们的服务可能看起来像是一个统一的移动应用程序或网站。公司内部的视角是不同的。Facebook使用数千种服务构建,功能从平衡互联网流量到转码图像再到提供可靠的存储。Facebook作为一个整体的效率是其个人服务效率的总和,每种服务通常都是以自己的方式进行优化,面对快节奏的变化,这些方法可能难以概括或适应。为了更有效地优化众多服务,灵活适应不断变化的互联内部服务网络,我们开发了Spiral。Spiral是一个系统,利用实时机器学习技术,为Facebook自我调节高性能基础设施服务,通过用Spiral取代手动启发式,我们可以在几分钟内优化更新的服务,而无需花费漫长的几周时间。

04
领券