腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
小小挖掘机
专栏作者
举报
516
文章
861584
阅读量
237
订阅数
订阅专栏
申请加入专栏
全部文章(516)
编程算法(162)
神经网络(141)
深度学习(138)
机器学习(131)
人工智能(93)
推荐系统(68)
https(59)
python(52)
其他(41)
网络安全(40)
数据分析(31)
强化学习(27)
github(20)
tensorflow(17)
NLP 服务(15)
numpy(15)
决策树(14)
大数据(14)
特征工程(12)
数据挖掘(11)
spark(11)
hive(11)
embedding(11)
ide(10)
开源(10)
sql(9)
git(9)
卷积神经网络(9)
批量计算(8)
监督学习(8)
pytorch(8)
搜索引擎(7)
linux(7)
腾讯云测试服务(7)
http(7)
正则表达式(7)
数据结构(7)
java(6)
matlab(6)
黑石物理服务器(6)
存储(6)
windows(6)
css(5)
数据库(5)
api(5)
线性回归(5)
keras(5)
费用中心(4)
scala(4)
html(4)
jquery(4)
文件存储(4)
知识图谱(4)
游戏(4)
分布式(4)
layer(4)
self(4)
javascript(3)
xml(3)
打包(3)
mapreduce(3)
图像处理(3)
电商(3)
tcp/ip(3)
机器人(3)
系统架构(3)
excel(3)
field(3)
model(3)
prediction(3)
c 语言(2)
c++(2)
json(2)
unix(2)
apache(2)
容器镜像服务(2)
serverless(2)
爬虫(2)
hadoop(2)
markdown(2)
scikit-learn(2)
迁移学习(2)
微服务(2)
腾讯云开发者社区(2)
信息流(2)
label(2)
map(2)
matching(2)
search(2)
task(2)
vi(2)
vr(2)
笔记(2)
编码(2)
公众号(2)
流量(2)
论文(2)
iphone(1)
bash(1)
.net(1)
r 语言(1)
bootstrap(1)
android(1)
云数据库 SQL Server(1)
nosql(1)
jar(1)
ubuntu(1)
bash 指令(1)
日志服务(1)
短视频(1)
机器翻译(1)
mongodb(1)
网站(1)
vr 视频解决方案(1)
yarn(1)
容器(1)
缓存(1)
运维(1)
shell(1)
图像识别(1)
面向对象编程(1)
opencv(1)
openstack(1)
unity(1)
二叉树(1)
scrapy(1)
kernel(1)
uml(1)
数据可视化(1)
架构设计(1)
sas(1)
hbase(1)
云计算(1)
聚类算法(1)
分类算法(1)
flink(1)
学习方法(1)
Elasticsearch Service(1)
智能推荐平台(1)
alignment(1)
amazon(1)
backbone(1)
command(1)
cookie(1)
correlation(1)
decoding(1)
document(1)
dynamic(1)
effects(1)
element(1)
encoding(1)
error(1)
gif(1)
glob(1)
graph(1)
im(1)
image(1)
key(1)
mac(1)
mask(1)
matplotlib(1)
matrix(1)
mean(1)
module(1)
network(1)
next(1)
pdf(1)
png(1)
point(1)
ranking(1)
select(1)
selection(1)
selector(1)
session(1)
sharing(1)
size(1)
spaces(1)
target(1)
theory(1)
time(1)
youtube(1)
编辑器(1)
产品(1)
架构(1)
排序(1)
思维导图(1)
系统(1)
搜索文章
搜索
搜索
关闭
基于Spark的大规模推荐系统特征工程
云数据库 SQL Server
nosql
sql
spark
数据库
导读:特征工程在推荐系统中有着举足轻重的作用,大规模特征工程处理的效率极大的影响了推荐系统线上的性能。第四范式作为国际领先的机器学习和人工智能技术与平台服务提供商,面向大规模特征工程问题开发了下一代离线在线一致性特征抽取引擎FESQL,针对AI场景支持SQL接口,兼容Spark 3.0同时提供高性能的Native执行引擎。本次分享题目为基于Spark的大规模推荐系统特征工程及优化,主要内容包括:
石晓文
2020-09-07
1.2K
0
ML&DEV[16] | 算法工程师内功修炼
编程算法
数据分析
sql
推荐系统
所谓算法,所谓人工智能,很多媒体,或者是一些教程,甚至是现在的主流论文,很容易地会把大家的思路带入到各种深度学习(没错,机器学习都已经out那种)等之类所谓比较高端的东西去了,于是大家会花很多时间在模型上,无论是学习本身,还是在日常工程中,在一些实践中,我逐步想明白,模型固然重要,但只学模型,翻翻论文,读读博客,只能让缓解我们对知识的焦虑,能让自己觉得“我的水平提升了”,但是是否真的提升了,这个事情要好好想想。
石晓文
2020-07-03
529
0
数据分析EPHS(11)-详解Hive中的排序函数
hive
sql
本篇主要来介绍一下hive中三个常用的排序函数row_number(),rank()和dense_rank()。
石晓文
2020-03-25
1.9K
0
数据团队思考:数据人的通用技能要求
大数据
python
sql
机器学习
最近经常遇到有朋友问下面这类问题,结合最近的一些思考,本篇聊一下,数据人该具备哪些通用的技能。
石晓文
2019-11-21
469
0
增删改查!sql2pandas方法手册
sql
数据分析
作为一名数据分析师,利用SQL熟练的取数是一项必备的基础能力。除了SQL以外,Python的pandas也为我们提供了SQL的大多数功能。自从从事算法之后就很少写SQL了,今天在整理印象笔记时趁机复习了一下,也花了点时间把SQL中主要的增删改查方法用pandas对应实现一遍。可以说是非常实用了。
石晓文
2019-10-28
617
0
推荐收藏 | 100个数据分析常用指标和术语
编程算法
数据挖掘
数据库
sql
数据分析
有个朋友是金融行业产品经理,最近在对已有的站内用户做分层与标签分类,需要对用户进行聚类分析。一般从事数据分析行业的朋友对这类词并不陌生,但是像市场运营人员就会把这类些名词概念搞混,导致结果不准确。数据分析相关概念多且杂,容易搞混。为了便于大家区分,今天小编就来盘点一下数据分析常用的术语解释。建议大家收藏起来方便查看。
石晓文
2019-09-29
983
0
算法人必懂的Hive知识-四道Hive面试&笔试题解析
sql
近期在不同群里有小伙伴们提出了一些在面试和笔试中遇到的Hive SQL问题,Hive作为算法工程师的一项必备技能,在面试中也是极有可能被问到的,所以有备无患,本文将对这四道题进行详细的解析,还是有一定难度的,希望你看完本文能够有所收获。
石晓文
2019-08-09
1.6K
0
数据分析EPHS(6)-使用Spark计算数列统计值
sql
spark
数据分析
前两篇中咱们分别介绍了使用Excel、Python和Hive SQL计算统计值,这次咱们使用Spark SQL来计算统计值。
石晓文
2019-07-30
1.3K
0
来学习几个简单的Hive函数啦
hive
spark
sql
json
咳咳,今天来介绍一下几个Hive函数吧,先放一张我登哥划水的照片,希望大家也做一只自由的鱼儿,在知识的海洋里游呀游,嘻嘻! 今天我们来介绍几个Hive常用的函数吧! 1、数据介绍 首先我们产生我们的数
石晓文
2018-04-11
1.3K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档