腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
素质云笔记
素质云笔记/Recorder... Research Area:多模态+计算机视觉舆情
专栏作者
举报
416
文章
1113261
阅读量
108
订阅数
订阅专栏
申请加入专栏
全部文章(416)
编程算法(116)
python(88)
机器学习(77)
深度学习(70)
神经网络(62)
人工智能(52)
https(42)
开源(34)
网络安全(33)
github(31)
r 语言(27)
git(26)
http(22)
linux(21)
网站(19)
数据库(18)
sql(18)
模型(18)
数据分析(14)
html(13)
数据处理(12)
NLP 服务(11)
数据(11)
api(10)
spark(10)
决策树(10)
markdown(10)
tensorflow(9)
javascript(9)
node.js(9)
线性回归(9)
keras(9)
数据结构(9)
腾讯云测试服务(8)
图像识别(8)
windows(8)
java(7)
打包(7)
容器镜像服务(7)
缓存(7)
推荐系统(7)
图像处理(6)
opencv(6)
大数据(6)
学习方法(6)
list(6)
函数(6)
jquery(5)
容器(5)
data(5)
label(5)
model(5)
费用中心(4)
对象存储(4)
人脸识别(4)
数据挖掘(4)
bash(4)
css(4)
中文分词(4)
ubuntu(4)
bash 指令(4)
文件存储(4)
sas(4)
腾讯云开发者社区(4)
特征工程(4)
笔记(4)
入门(4)
json(3)
unix(3)
批量计算(3)
全站加速网络(3)
数据加密服务(3)
正则表达式(3)
numpy(3)
tcp/ip(3)
迁移学习(3)
prompt(3)
time(3)
web(3)
部署(3)
教程(3)
语音识别(2)
官方文档(2)
区块链(2)
c++(2)
php(2)
xml(2)
ide(2)
matlab(2)
mapreduce(2)
日志服务(2)
文字识别(2)
电商(2)
云数据库 MySQL(2)
serverless(2)
存储(2)
分布式(2)
html5(2)
卷积神经网络(2)
scikit-learn(2)
机器人(2)
聚类算法(2)
jupyter notebook(2)
app(2)
facebook(2)
frequency(2)
gensim(2)
gpu(2)
igraph(2)
input(2)
int(2)
lda(2)
na(2)
paste(2)
point(2)
sapply(2)
unique(2)
video(2)
word(2)
并发(2)
测试(2)
服务(2)
框架(2)
实践(2)
LoRa(2)
比特币(1)
数字货币(1)
c 语言(1)
.net(1)
jquery ui(1)
ajax(1)
android(1)
makefile(1)
云数据库 SQL Server(1)
云数据库 Redis(1)
flask(1)
sqlalchemy(1)
vba(1)
centos(1)
apache(1)
spring(1)
GPU 云服务器(1)
短视频(1)
访问管理(1)
命令行工具(1)
VPN 连接(1)
知识图谱(1)
mongodb(1)
企业(1)
渲染(1)
svg(1)
xslt & xpath(1)
游戏(1)
运维(1)
压力测试(1)
爬虫(1)
ssh(1)
强化学习(1)
sql server(1)
面向对象编程(1)
unity(1)
grep(1)
pytorch(1)
flash(1)
rpc(1)
kernel(1)
微信(1)
数据可视化(1)
分类算法(1)
unicode(1)
ascii(1)
迁移(1)
模型测试(1)
联邦学习(1)
隐私计算(1)
absolute(1)
alpha(1)
amazon(1)
analysis(1)
apple(1)
apply(1)
auto(1)
boolean(1)
chatgpt(1)
class(1)
click(1)
copy(1)
core(1)
cuda(1)
curve(1)
cut(1)
cython(1)
dataframe(1)
date(1)
dictionary(1)
echarts(1)
edge(1)
element(1)
error(1)
exe(1)
fastapi(1)
field(1)
format(1)
frame(1)
function(1)
generator(1)
google(1)
gpt(1)
hash(1)
im(1)
image(1)
lapply(1)
legend(1)
lines(1)
logging(1)
mask(1)
match(1)
matrix(1)
max(1)
mean(1)
minimum(1)
networkx(1)
openai(1)
path(1)
percentage(1)
photo(1)
pipeline(1)
plot(1)
precision(1)
probability(1)
pydantic(1)
pyinstaller(1)
sampling(1)
session(1)
set(1)
state(1)
store(1)
sum(1)
summary(1)
table(1)
text(1)
transactions(1)
txt(1)
vr(1)
websocket(1)
word2vec(1)
xlsx(1)
xor(1)
布局(1)
插件(1)
产品(1)
程序(1)
磁盘(1)
登录(1)
队列(1)
分页(1)
高性能(1)
工程师(1)
工具(1)
工作(1)
管理(1)
行业(1)
基础(1)
技巧(1)
架构(1)
接口(1)
可视化(1)
连接(1)
流量(1)
论文(1)
配置(1)
苹果(1)
前端(1)
权限(1)
日志(1)
设计(1)
生命周期(1)
事件(1)
视频(1)
数据存储(1)
搜索(1)
网络(1)
系统(1)
线程(1)
异常(1)
优化(1)
终端(1)
字符串(1)
搜索文章
搜索
搜索
关闭
sklearn中多种编码方式——category_encoders(one-hot多种用法)
特征工程
数据处理
机器学习
编程算法
离散型编码的Python库,里面封装了十几种(包括文中的所有方法)对于离散型特征的编码方法,接口接近于Sklearn通用接口,非常实用 可以使用多种不同的编码技术把类别变量转换为数值型变量,并且符合sklearn模式的转换。
悟乙己
2021-12-07
2.9K
0
R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)
javascript
数据处理
编程算法
大型数据集通常是高度结构化的,结构使得我们可以按不同的方式分组,有时候我们需要关注单个组的数据片断,有时需要聚合不同组内的信息,并相互比较。
悟乙己
2019-05-28
20.3K
0
R︱高效数据操作——data.table包(实战心得、dplyr对比、key灵活用法、数据合并)
编程算法
r 语言
数据处理
由于业务中接触的数据量很大,于是不得不转战开始寻求数据操作的效率。于是,data.table这个包就可以很好的满足对大数据量的数据操作的需求。
悟乙己
2019-05-28
7K
0
R学习笔记(4): 使用外部数据
大数据
数据处理
数据库
sql
云数据库 MySQL
鉴于内存的非持久性和容量限制,一个有效的数据处理工具必须能够使用外部数据:能够从外部获取大量的数据,也能够将处理结果保存。R中提供了一系列的函数进行外部数据处理,从外部数据的类型可以分为文件、数据库、网络等;其中文件操作还可以区分为导入/导出操作和流式操作。
悟乙己
2019-05-27
1.8K
0
R语言︱异常值检验、离群点分析、异常值处理
编程算法
数据处理
r 语言
版权声明:博主原创文章,微信公众号:素质云笔记,转载请注明来源“素质云博客”,谢谢合作!! https://blog.csdn.net/sinat_26917383/article/details/51210793
悟乙己
2019-05-27
4.9K
0
练习题︱基于今日头条开源数据(二)——两款Apriori算法实践
编程算法
数据处理
python
在R语言里面有非常好的package,可见我之前的博客: R语言实现关联规则与推荐算法(学习笔记) 该packages能够实现以下一些可视化:
悟乙己
2019-05-26
826
0
转︱机器学习算法线上部署方法
java
数据处理
spark
python
我们经常会碰到一个问题:用了复杂的GBDT或者xgboost大大提升了模型效果,可是在上线的时候又犯难了,工程师说这个模型太复杂了,我没法上线,满足不了工程的要求,你帮我转换成LR吧,直接套用一个公式就好了,速度飞速,肯定满足工程要求。这个时候你又屁颠屁颠用回了LR,重新训练了一下模型,心里默骂千百遍:工程能力真弱。
悟乙己
2019-05-26
1.1K
0
python︱大规模数据存储与读取、并行计算:Dask库简述
python
数据处理
本文介绍了利用Dask和Kaleido库进行大数据处理和分析的应用案例,包括处理40TB数据集、进行特征工程、建立机器学习模型和评估模型性能。同时,本文还介绍了如何使用Dask进行分布式计算和并行计算,以及使用Kaleido进行特征选择和降维。
悟乙己
2018-01-02
6K
0
LSH︱python实现局部敏感随机投影森林——LSHForest/sklearn(一)
数据处理
python
机器学习
本文介绍了自然语言处理中的文本相似度计算方法和应用场景,并详细阐述了基于LSH(Locality-Sensitive Hashing)方法、基于树的方法(如随机森林、梯度提升树等)和基于图的方法(如k-Nearest Neighbors,k-NN)等应用场景。同时,文章还对未来的研究方向进行了展望,包括模型性能的评价、适用领域的拓展、计算效率的提升等。
悟乙己
2018-01-02
2.2K
0
结构化数据转换方式之一:box-cox转换
数据处理
本文介绍了结构化数据转换方式之一:box-cox转换,包括原理、应用和优势等方面的内容。Box-Cox转换可以保证线性回归模型的残差满足正态性、独立性等假设前提,从而提高了线性回归模型估计的准确性和稳定性。
悟乙己
2018-01-02
2.1K
0
NLP+词法系列(二)︱中文分词技术简述、深度学习分词实践(CIPS2016、超多案例)
数据处理
机器学习
本文主要探讨了中文分词技术在信息检索领域的应用,包括搜索引擎、文本挖掘、推荐系统等。作者详细分析了中文分词的算法,包括基于字符串匹配的分词方法、基于统计的分词方法和基于词性标注的分词方法。同时,作者还讨论了分词技术在搜索引擎、文本挖掘、推荐系统等领域的应用,并提出了相关的优化建议。
悟乙己
2018-01-02
4.4K
0
R+中文︱中文文本处理杂货柜——chinese.misc
r 语言
数据处理
本文介绍了R语言中的各种包及其特点,包括base、datasets、tools、utils、stats、grDevices、datasets、graphics、methods、merge和tests包。这些包涵盖了从基础数据结构、输入输出、统计分析、绘图、数据处理、机器学习、模型测试等多个方面。通过这些包,用户可以方便地使用R语言进行数据处理、分析和建模等工作。
悟乙己
2018-01-02
2.7K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档