首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据处理

#数据处理

数据处理是指对数据(包括数值的和非数值的)进行分析和加工的技术过程。

WanJuan-CC数据集:为大型语言模型训练提供高质量Webtext资源

Datawhale

如何在参差不齐的海量网页数据中提炼高质量内容?如何保证模型训练数据的质量和安全性,如何构建高效的处理策略?上海人工智能实验室的这篇论文提供了一种不错的参考方案。

2800

【Golang】Sync.WaitGroup的使用

MaybeHC

这里我们直接来用代码进行讲解,以下面的代码为例我们需要等待协程结束后查询count的,所以最后在末尾处使用了睡眠time.Sleep(time.Second* ...

2610

实用!Python数据填充与缺失值处理:完善数据质量

用户1289394

在数据处理和分析过程中,经常会遇到数据中存在缺失值的情况。合理处理缺失值能够帮助我们完善数据质量,提高建模和分析的准确性。下面将介绍 Python 中常用的数据...

18410

还在担心报表不好做?不用怕,试试这个方法(四)

葡萄城控件

在上述例子中,细心的读者可能已经注意到在数据源中,【销售公司】数据与【员工】数据相关联。然而,在导出后,公司名称却被自动分组去重。这正是模板填充时的一项智能功能...

6210

自然资源部发布《自然资源领域数据安全管理办法》

FB客服

为规范自然资源领域数据处理活动,加强数据安全管理,保障数据安全,促进数据开发利用,自然资源部在经过国家数据安全工作协调机制批准,部领导同意后,发布了《自然资源领...

12010

用pd去读Excel 加了openpyxl作为engine报错

Python进阶者

前几天在Python白银交流群【菜🐤】问了一个Pandas数据处理的问题,问题如下:

5910

数据处理过程中的合理的质量控制是很有必要的

生信技能树

实际上初学者完全不需要使用各种花里胡哨的工具来完成上面的步骤,因为所有的细节都在降维聚类分群结果里面看得到!让我们来演练一下:

9110

分享几个简单的Pandas数据处理函数

可以叫我才哥

以上模拟数据可以复制后使用pd.read_clipboard(sep=',')读取。

5610

两个相同的代码,为啥前者的横坐标显示的不是时间呀?

前端皮皮

前几天在Python白银交流群【王者级混子】问了一个Pandas数据处理的问题,问题如下:

5610

Excel 函数与公式应用大全

hacker707

Excel 是一款功能强大的电子表格软件,广泛应用于商业、财务、教育等各个领域。在 Excel 中,函数与公式是实现数据分析、计算和处理的重要工具。本文将介绍一...

8710

投资440亿美元,三星将在美国建两座晶圆厂和一座先进封装厂

芯智讯

4月6日消息,据《华尔街日报》报道,三星计划将大幅增加其在美国德克萨斯州泰勒市的半导体投资,预计将在计划的投资170亿美元建造一座5nm晶圆厂的基础上,再兴建一...

11610

血液中的癌症信号:ctDNA揭秘ESCC免疫疗效

生信菜鸟团

ESCC 占食管癌 80% 以上,临床数据显示,在进行根治性放化疗 CRT 之后,3年生存率 OS 小于 50%,虽然PD-1 抑制剂联合化疗被推荐作为晚期 E...

9610

scDNAseq 拷贝数变异分析肿瘤克隆进化

生信菜鸟团

HCC 约占肝癌的 80%,因存在肿瘤异质性 ITH 而导致疗效有限,目前还缺乏单细胞层面的 HCC 肿瘤异质性图谱。而基因组不稳定引起的拷贝数改变 (CNA)...

7210

从HTML提取表格数据到Excel:猫头虎博主的终极指南

猫头虎

在本篇技术博客中,猫头虎博主将带领大家探索如何高效从HTML中提取表格数据并保存至Excel文件的技巧。无论你是数据分析师、开发者,还是对数据抓取感兴趣的技术爱...

35510

想拿高薪?云计算或许是你的跳板!

网络豆

随着科技的不断进步,云计算作为一项重要的技术趋势,正引领着整个行业的快速发展。越来越多的人开始关注云计算领域,希望通过学习和掌握这一技能来获得更高的薪资。那么,...

6510

探索边缘计算:未来互联网的革命性力量

运维开发王义杰

随着技术的不断进步,边缘计算作为一种新兴的数据处理模式,正迅速成为推动各行各业发展的关键技术趋势。边缘计算通过在数据产生的地方(即“边缘”)进行数据处理,而不是...

18810

书生·浦语2.0体系&技术报告

阿提说说

这里介绍了我们如果要做大模型应用,应该如何选择大模型,如何进行微调,以及是否需要使用工具调用,最后进行评测的整体流程

9310

HBase 整体介绍

Freedom123

HBase: NoSQL数据库,基于HDFS的分布式数据库,理论上支持无限横向扩展,         HBase由HMaster与RegionServer组成...

10910

mysql 基本操作指南之mysql函数

六月的雨在Tencent

如:select name from table where Soundex(name) = Soundex('Lie');  结果name----Lee

6610
领券