腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
数据派THU
专栏成员
举报
2149
文章
2150400
阅读量
191
订阅数
订阅专栏
申请加入专栏
全部文章(999+)
神经网络(473)
机器学习(455)
深度学习(452)
人工智能(371)
数据(352)
编程算法(327)
模型(287)
大数据(283)
https(258)
网络安全(249)
python(154)
NLP 服务(126)
数据分析(121)
算法(83)
其他(78)
开源(75)
论文(68)
安全(65)
函数(65)
强化学习(63)
数据库(62)
数据处理(62)
github(61)
工作(58)
系统(58)
图像处理(53)
网络(53)
监督学习(48)
腾讯云测试服务(47)
机器人(46)
企业(45)
设计(44)
优化(42)
sql(41)
git(39)
变量(37)
pytorch(36)
基础(34)
开发(34)
http(33)
框架(33)
统计(31)
数据安全(30)
数据结构(30)
翻译(30)
tensorflow(29)
数据可视化(29)
学习方法(29)
存储(28)
chatgpt(28)
软件(28)
卷积神经网络(27)
工具(27)
数据科学(26)
性能(26)
数据挖掘(24)
线性回归(24)
tcp/ip(24)
测试(24)
网站(23)
自动化(22)
实践(22)
游戏(21)
腾讯云开发者社区(21)
架构(21)
视频(21)
连接(20)
决策树(19)
可视化(19)
知识图谱(18)
图像识别(18)
服务(18)
区块链(17)
html(17)
搜索(17)
api(16)
linux(16)
医疗(16)
推荐系统(16)
物联网(16)
自动驾驶(15)
numpy(15)
特征工程(15)
行业(15)
云计算(14)
对象(14)
管理(14)
无人驾驶(13)
opencv(13)
gpt(13)
计算机(13)
数学(13)
原理(13)
css(12)
分布式(12)
keras(12)
迁移学习(12)
事件(12)
人脸识别(11)
机器翻译(11)
编码(11)
代理(11)
c++(10)
硬件开发(10)
matlab(10)
apache(10)
微信(10)
5g(10)
产品(10)
解决方案(10)
ide(9)
批量计算(9)
编程(9)
程序(9)
集合(9)
教程(9)
科技(9)
量化(9)
java(8)
javascript(8)
go(8)
r 语言(8)
文件存储(8)
缓存(8)
微服务(8)
汽车(8)
内存(8)
渲染(7)
爬虫(7)
scikit-learn(7)
聚类算法(7)
pandas(7)
研发(7)
异常(7)
.net(6)
SSL 证书(6)
容器(6)
无监督学习(6)
data(6)
创业(6)
互联网(6)
技巧(6)
计算机视觉(6)
数据类型(6)
图表(6)
信息安全(6)
LLM(6)
ios(5)
bash(5)
android(5)
金融(5)
工业物联(5)
spark(5)
hadoop(5)
正则表达式(5)
架构设计(5)
教育(5)
计算机科学(5)
脚本(5)
开发者(5)
索引(5)
通信(5)
效率(5)
压缩(5)
语音识别(4)
数字货币(4)
php(4)
nosql(4)
访问管理(4)
运维(4)
黑客(4)
markdown(4)
nat(4)
jupyter notebook(4)
分类算法(4)
迁移(4)
com(4)
model(4)
表格(4)
部署(4)
程序员(4)
工程师(4)
内核(4)
语法(4)
原型(4)
c 语言(3)
node.js(3)
ajax(3)
typescript(3)
搜索引擎(3)
日志服务(3)
erp(3)
单元测试(3)
kernel(3)
模式识别(3)
uml(3)
小程序(3)
windows(3)
系统架构(3)
信息流(3)
安全治理(3)
联邦学习(3)
隐私计算(3)
app(3)
atomic(3)
function(3)
gpu(3)
graph(3)
nlp(3)
patch(3)
png(3)
precision(3)
prompt(3)
token(3)
编程语言(3)
编译(3)
插件(3)
递归(3)
二维码(3)
工作流(3)
监控(3)
排序(3)
配置(3)
日志(3)
硬件(3)
字符串(3)
最佳实践(3)
对象存储(2)
iphone(2)
bootstrap(2)
xml(2)
unix(2)
bash 指令(2)
mapreduce(2)
TDSQL MySQL 版(2)
文字识别(2)
DevOps 解决方案(2)
电商(2)
hive(2)
面向对象编程(2)
unity(2)
asp(2)
自动化测试(2)
anaconda(2)
kafka(2)
虚拟化(2)
性能测试(2)
数据库管理(2)
智能网联(2)
abstract(2)
apply(2)
entity(2)
google(2)
max(2)
point(2)
predict(2)
scale(2)
series(2)
target(2)
time(2)
torch(2)
vi(2)
百度(2)
布局(2)
低代码(2)
地图(2)
动态规划(2)
公众号(2)
规范化(2)
接口(2)
量子计算(2)
入门(2)
手机(2)
数据仓库(2)
数组(2)
芯片(2)
音频(2)
隐私(2)
语音(2)
云平台(2)
数据流(2)
ICP备案(1)
费用中心(1)
云镜(主机安全)(1)
官方文档(1)
比特币(1)
scala(1)
jquery(1)
opengl(1)
qt(1)
单片机(1)
arm(1)
嵌入式(1)
composer(1)
云数据库 SQL Server(1)
oracle(1)
django(1)
打包(1)
全文检索(1)
windows server(1)
容器镜像服务(1)
spring(1)
短视频(1)
消息队列 CMQ 版(1)
检测工具(1)
人脸支付(1)
高性能计算(1)
政务云专区(1)
智能交通(1)
出行(1)
智能硬件(1)
yarn(1)
云联网(1)
serverless(1)
devops(1)
shell(1)
jdbc(1)
二叉树(1)
flash(1)
scrapy(1)
敏捷开发(1)
canvas(1)
processing(1)
云数据库 postgresql(1)
云数据仓库套件 sparkling(1)
flutter(1)
app安全(1)
腾讯会议(1)
sdk(1)
rust(1)
模型测试(1)
验证码(1)
数据集成(1)
图像搜索(1)
图像分析(1)
数据湖(1)
智慧交通(1)
智能制造(1)
小程序·云开发(1)
大模型视频创作引擎(1)
项目管理(1)
腾讯云(1)
acm(1)
add(1)
agent(1)
aigc(1)
alpha(1)
auto(1)
aws(1)
bit(1)
block(1)
byte(1)
chatbot(1)
chrome(1)
convolution(1)
cto(1)
cut(1)
cv2(1)
database(1)
dbpedia(1)
debug(1)
device(1)
dt(1)
epoch(1)
etl(1)
eval(1)
facebook(1)
file(1)
im(1)
image(1)
implicit(1)
jupyter(1)
kaggle(1)
lag(1)
layer(1)
lift(1)
lstm(1)
matplotlib(1)
min(1)
mips(1)
mnist(1)
models(1)
mysql(1)
network(1)
nodes(1)
nvidia(1)
oceanbase(1)
ode(1)
partial(1)
pdf(1)
persistence(1)
pipeline(1)
probability(1)
pycharm(1)
range(1)
report(1)
reset(1)
scaling(1)
seaborn(1)
self(1)
sequence(1)
show(1)
simulation(1)
size(1)
state(1)
statistics(1)
structure(1)
summary(1)
task(1)
text(1)
twitter(1)
wav(1)
word(1)
worker(1)
wsdl(1)
yaml(1)
yolo(1)
youtube(1)
zero(1)
百度地图(1)
版本控制(1)
备份(1)
闭包(1)
笔记(1)
编译器(1)
登录(1)
动画(1)
队列(1)
二进制(1)
反射(1)
服务器(1)
高性能(1)
工程化(1)
后端(1)
后台(1)
集群(1)
计算机图形学(1)
架构师(1)
加密(1)
金融科技(1)
镜像(1)
客户端(1)
跨域(1)
蓝牙(1)
链表(1)
浏览器(1)
流量(1)
漏洞(1)
密码学(1)
敏捷(1)
苹果(1)
前端(1)
全栈(1)
软件工程(1)
设计模式(1)
摄像头(1)
事务(1)
数据管理(1)
数据中心(1)
图数据库(1)
推送(1)
微信公众号(1)
系统设计(1)
线程(1)
小游戏(1)
性能分析(1)
音视频(1)
域名(1)
源码(1)
元宇宙(1)
云原生(1)
指针(1)
重构(1)
装饰器(1)
作用域(1)
城市交通(1)
自然语言处理(1)
数据清洗(1)
搜索文章
搜索
搜索
关闭
独家 | Scikit-LLM:Sklearn邂逅大语言模型
存储
翻译
模型
数据
LLM
Scikit-LLM是文本分析的游戏规则改变者,它将功能强大的ChatGPT语言模型和scikit-learn相结合,为理解和分析文本提供了一个无与伦比的工具包。利用scikit-LLM,可以在各种类型的文本数据中发现隐含的模式、情绪和上下文,如客户反馈、社交媒体帖子和新闻文章等。它汇集了语言模型和scikit-learn的优势,能够从文本中提取有价值的见解。
数据派THU
2023-08-08
388
0
原创 | SQL和 NoSQL的基本操作和查询语句
数据库
nosql
sql
存储
数据
SQL是用于管理和操作关系型数据库的语言。它遵循结构化模式,将数据组织成具有预定义关系的表格形式。以下是SQL的一些关键特点:
数据派THU
2023-08-08
414
0
李飞飞对话王建民 | 云原生数据库:重启冰山下的战争
数据库
存储
数据
系统
云原生
来源:阿里研究院 本文约4800字,建议阅读5分钟 云原生正在重构数据库市场的竞争格局。 本期嘉宾: 李飞飞 阿里巴巴集团副总裁、达摩院数据库与存储实验室负责人 王建民 清华大学软件学院院长 安筱鹏 阿里研究院副院长 2020年9月17日,美国数据库公司Snowflake上市,市值一度超过1000亿美元,但其2019年销售额不到3亿美元。 2020年微软取代了Oracle,历史上第一次站在了数据库全球市场的榜首地位。 亚马逊创始人贝索斯曾说,“The real battle will be in dat
数据派THU
2023-03-29
359
0
独家|OpenCV 1.1 Mat - 基本图像容器(附链接)
容器
存储
对象
翻译
数据
翻译:陈之炎 校对:吴振东、林夕 本文约3600字,建议阅读10分钟本文为大家系统地介绍了OpenCV官方教程。 写在前边 让读者朋友们较为系统地了解和学习OpenCV官方教程,数据派THU翻译组联合研究部共同推出OpenCV官方教程翻译系列。由于所列章节较多,教程将被分为多篇文章持续更新发布。 原文链接:https://docs.opencv.org/4.5.2/de/d7a/tutorial_table_of_content_core.html 目标 我们可以通过多种方式从现实世界中获取数字图像,比如:
数据派THU
2023-03-29
702
0
IoTDB——用数据助力十四五战略规划实现
存储
大数据
物联网
管理
数据
一、IoTDB的研发背景 (一)IoTDB的发展历程 IoTDB是由清华大学大数据软件团队于2016年开始开发的一个物联网数据库项目,旨在满足大规模物联网和工业物联网应用的数据、存储和分析需求。2018年11月,IoTDB进入了Apache孵化器,开始了它的开源之旅。在孵化期间,IoTDB吸引了来自全球的贡献者和用户,并与其他Apache项目如Spark和Hadoop进行了无缝集成。2020年9月,IoTDB正式成为Apache顶级项目,并获2020年北京市科技进步一等奖。2021年10月,IoTDB受邀参
数据派THU
2023-03-29
806
0
形象理解傅里叶变换!
存储
动画
数据
压缩
原理
来源:机器学习杂货店 本文约3100字,建议阅读6分钟本文分享一篇关于傅立叶变换理解的文章。 这篇文章可以说是介绍傅里叶变换最清晰通俗的,没有之一,直接把你当做小学生来讲,通过大量的动画不但告诉你傅里叶变换是什么,还告诉你傅里叶变换能干什么。 难能可贵的是,你可以通过手动绘制图案和拖动滑块来加深读傅里叶变换的理解。 动画链接: https://www.jezzamon.com/fourier/index.html 傅里叶变换是一种在各个领域都经常使用的数学工具。这个网站将为你介绍傅里叶变换能干什么,为什么
数据派THU
2023-03-29
790
0
【2023新书】Python数据科学手册:使用数据的基本工具
机器学习
存储
工具
数据
数据科学
来源:专知本文为书籍介绍,建议阅读5分钟只有通过Python数据科学手册,你才能获得所有的资源——ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其他相关工具。 对于许多研究人员来说,Python是一个一流的工具,主要是因为它用于存储、操作和洞察数据的库。这个数据科学技术栈的各个部分有很多资源,但只有通过Python数据科学手册,你才能获得所有的资源——ipython、NumPy、Pandas、Matplotlib、Scikit-Learn和其他相关工具。 htt
数据派THU
2023-03-29
528
0
从神经搜索到多模态应用
存储
服务
模型
数据
搜索
本文约5400字,建议阅读10分钟 从神经搜索到多模态应用,这里的神经搜索指的是在搜索系统中用神经网络模型。 提到神经搜索就必然想到多模态数据,因为神经网络相比于传统搜索方式,其最大的优势就在于可以很方便地对不同模态的数据进行融合。 本文将从以下几个方面进行介绍: 从神经搜索到多模态应用 多模态数据 多模态应用服务 Jina全家桶在DocsQA中的实践 01 从神经搜索到多模态应用 首先看一个典型的多模态数据——新闻,除了文字之外还会有图片的信息,有的新闻还会有视频的信息,它就是一个不同模态数据的混合。
数据派THU
2023-03-29
540
0
黄向东:工业物联网数据库 IoTDB及其应用
数据库
存储
物联网
管理
数据
本文约7200字,建议阅读15分钟 本文分享关于工业时序数据库IoTDB(全称Apache IoTDB)及它的一些应用。 IoTDB源自清华大学软件学院。王院长带领团队从2011年开始关注,2014/2015年开始研制,一路走来始终围绕工业数据软件,其中包括了数据管理软件、机器学习软件、数据处理软件以及应用开发软件。我主要负责数据管理软件。让数据发挥价值,首先要把数据管起来,便于未来的数据处理和应用开发。 今天分享关于工业时序数据库IoTDB(全称Apache IoTDB)及它的一些应用,主要分四个方面:I
数据派THU
2023-03-29
856
0
干货 | 数字经济创新创业——数据是数字经济的基础
大数据
数据分析
开源
存储
下文整理自清华大学大数据能力提升项目能力提升模块课程“Innovation & Entrepreneurship for Digital Economy”(数字经济创新创业课程)的精彩内容。
数据派THU
2022-12-16
300
0
独家 | 是时候和pd.read_csv(), pd.to_csv()说再见了
文件存储
python
存储
Pandas 对 CSV 的输入输出操作是串行化的,这使得它们非常低效且耗时。我在这里看到足够的并行优化空间,但遗憾的是,Pandas 还没有提供这个功能。尽管我从不赞成一开始就使用 Pandas 创建 CSV(请阅读https://towardsdatascience.com/why-i-stopped-dumping-dataframes-to-a-csv-and-why-you-should-too-c0954c410f8f了解原因),但我知道在某些情况下,除了使用 CSV 之外别无选择。
数据派THU
2022-12-16
1.4K
0
干货 | 打造数据金库,护航数据安全——构建以数据金库为核心的数据安全基础设施
数据安全
安全
存储
.net
本文内容整理自《数据安全与数据要素治理研讨会》中,中国电子信息产业集团党组成员、副总经理陆志鹏所做的主题演讲。 ---- 数据安全和数据要素化是当前的重要话题,但同时又是两个不同的研究领域。从2020年底,中国电子与清华大学围绕数据安全和数据要素化展开了联合研究,今天我就其中一部分研究内容和成果给大家做报告,从数据安全领域谈一谈当前面临的形势、解决问题的思路和解决方案,请大家批评指正。 党中央高度重视数据安全。2017年习总书记就强调要切实保障国家数据安全,2020年提出在“保障国家数据安全”的同时需要“加
数据派THU
2022-08-31
1.9K
0
NASA发布史上最深的宇宙全彩照!韦伯如何回传150万公里外的太空数据?
存储
来源:大数据文摘本文约3000字,建议阅读5分钟距离地球约150 万公里处的数据,到底是如何被存储并且准确传输到地球的呢? 2022年7月11日凌晨,乔·拜登总统、副总统卡玛拉·哈里斯和美国国家航空航天局局长比尔·纳尔逊公布了耗资100亿美元的詹姆斯·韦伯太空望远镜的首秀! 这是詹姆斯韦伯太空望远镜(JWST)发布了第一批图像。本张图片也是韦伯望远镜发布的首张全彩图像和光谱数据。 根据美国国家航空航天局的说法,这是迄今为止最深的宇宙红外图像!NASA表示,这张照片只用了望远镜四个仪器中的一个12.5小时
数据派THU
2022-07-19
402
0
超越所有微调方法,参数量大幅减少,康奈尔大学等提出视觉prompt新方法
存储
日志服务
来源:机器之心本文约2000字,建议阅读5分钟一种优化 Transformer 的有效方案,在只添加少量参数的情况下,对下游任务有极大的提升效果。 来自康奈尔大学、Meta AI 和哥本哈根大学的研究者提出一种优化 Transformer 的有效方案,在只添加少量参数的情况下,对下游任务有极大的提升效果。 识别问题往往是通过预训练大型基础模型处理大量精选或原始数据的方式解决的。这似乎是一种可行的模式:只需利用最新最好的基础模型,就可以在多个识别问题上取得极大的进展。 然而,在实践中,将这些大型模型用于下游任
数据派THU
2022-05-19
271
0
Hive 高频面试题 30 题
数据库
sql
存储
hive
mapreduce
来源:大数据技术与架构本文约6000字,建议阅读10分钟本文收集了Hive面试中的高频考题。 如果你是数据开发、数据研发、或数据分析师,那么这篇文章将对你非常有用。记得转发收藏哦。 一、Hive面试题 1、hive内部表和外部表的区别 未被external修饰的是内部表,被external修饰的为外部表。 区别: 内部表数据由Hive自身管理,外部表数据由HDFS管理; 内部表数据存储的位置是hive.metastore.warehouse.dir(默认:/user/hive/warehouse),
数据派THU
2022-04-06
1.4K
0
基于移动机器人的拣货系统研究进展
存储
来源:专知本文约900字,建议阅读5分钟本文为你介绍基于移动机器人的拣货系统。 基于移动机器人的拣货系统(Robotic mobile fulfillment systems, RMFS)作为一种新型物至人的拣货系统, 相比人工拣货系统和AS/RS拣货系统(下文统称传统拣货系统)具有更高的拣货效率、更好的系统可扩展性和柔性. 为全面了解RMFS的运行模式及其优化方向, 本文首先回顾了RMFS的工作流程及优化理论框架, 然后对RMFS的货位指派、订单分批、任务分配、路径规划以及建模方法等问题进行了文献回顾和
数据派THU
2022-03-04
268
0
【Manning新书】Kafka实战
存储
kafka
来源:专知本文约700字,建议阅读5分钟Kafka in Action介绍了Kafka的核心特性,以及如何在实际应用中使用它的相关例子。 Kafka in Action介绍了Kafka的核心特性,以及如何在实际应用中使用它的相关例子。在其中,您将探索最常见的用例,如日志记录和管理流数据。当你完成之后,你就可以在一个以Kafka为中心的团队中处理基于开发者和管理员的基本任务了。 https://www.manning.com/books/kafka-in-action 这本书分三部分,共十二章。第一部分介
数据派THU
2022-03-04
488
0
数据蒋堂 | 数据压缩手段
存储
大数据
编程算法
本文共2600字,建议阅读9分钟。 如果能物理地减少数据存储量,也就自然而然地减少了外存访问量。
数据派THU
2019-09-10
654
0
数据蒋堂 | 遍历复用
编程算法
bash
大数据
存储
sql
本文共2500字,建议阅读7分钟。 减少外存(硬盘)访问量一直是提高大数据计算性能的永恒话题。
数据派THU
2019-08-30
465
0
独家 | 一文盘点数据集市和数据仓库的差异(附链接)
企业
存储
金融
http
当一家企业开始应用商业智能(Business Intelligence,BI)的战略和技术时,首先需要明确数据集市和数据仓库的区别。理解这种差异将决定你采用何种BI架构和数据驱动决策。
数据派THU
2018-12-07
939
0
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档