腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
我
可以
在
python
中一
次
重命名
非常大
的
数据
集
的
所有
行
/
列
吗
?
python
、
python-3.x
、
jupyter-notebook
、
jupyter
、
jupyter-lab
我
想在
python
中一
次
重命名
所有
行
的
名称。 这是
我
想要
的
示例(
在
R中): names(dataframe) <- c(paste0("G",1:7129),"class")
浏览 38
提问于2021-11-03
得票数 0
2
回答
重命名
大型CSV
数据
文件
的
列
python
、
pandas
我
有一个相当大
的
数据
文件,即200%
的
可用内存,
我
想
重命名
这些
列
,并将其保存到一个新
的
文件中,并使用不同
的
名称。print_columns(df)这样
可以
按预期
的
方式
重命名
列,但只保存大文件中采样
的
10
行<
浏览 5
提问于2020-04-24
得票数 3
回答已采纳
2
回答
搜索和更新
python
中
的
十六进制值
python
、
insert
我
有一个csv文件,其
中一
列
为十六进制值,这是一些乘积no。像'182666828988‘,'183a2d4e3a12’,
我
必须采取一个新
的
产品编号。并检查它是否已经存在,如果
我
必须更新产品编号
的
频率。如果没有在
数据
集中添加一个新
行
,则使用频率
行
。
在
python
中最有效
的
方法是什么,因为
我
有一个
非常大
浏览 2
提问于2016-05-24
得票数 0
回答已采纳
1
回答
SettingWithCopy警告
python
、
dataframe
、
merge
我
收到了
python
的
警告,但我不知道如何解决它。
我
试图合并两个
列
“名称”、“成分”、“评分”
的
数据
集
。第一个
数据
集
的
值仅用于前两
列
和15
行
(其
中一
些是重复
的
)。第二个
数据
集
具有
所有
三
列
和十
行
的
值,与以前相同,但没有重复
浏览 1
提问于2022-01-08
得票数 0
2
回答
如何将CSV加载到字典(散
列
)中?
python
、
pandas
、
numpy
、
csv
、
dictionary
我
正在处理(未排序
的
)CSV-文件,其中某些
列
包含一个键,而另一
列
是值。假设每一
行
的
列
(1、2、3、7)包含键,第11
列
是该行
的
值。
我
希望将它们加载到散
列
中,以便能够快速访问密钥
的
值。
我
是NumPy新手,对numpy.loadtxt()
的
速度和易用性印象最深--
我
可以
准确地给它提供
我
感兴趣<
浏览 7
提问于2022-05-18
得票数 -1
回答已采纳
1
回答
如何使用Pandas替换含义相同
的
数据
字符串(但类型不同),并将数字中
的
次要数字转换为主要字符串
python
、
pandas
、
data-mining
、
data-cleaning
例如,
我
有一个包含许多属性
的
大型
数据
集
。假设其
中一
列
是具有20个标签
的
占领
列
。我们拿一个标签,一副轮机长。由于
数据
集
是结构化
的
,并且由于
数据
收集方式
的
性质,对于职业来说,一号副工程师将以许多形式出现,例如"First Office Engineer“、”First Off. Engineer“。
我
的
问题是,对于我来说
浏览 0
提问于2020-09-22
得票数 0
1
回答
选择
列
中字符串中与值匹配
的
行
。
python
、
pandas
在
python
的
熊猫中,假设有一个DataFrame,其
中一
个
列
中
的
值是一个字符串。Washington'],\如何选择
列
中任何字符串中
的
一个值
的
行
浏览 1
提问于2016-03-15
得票数 2
回答已采纳
3
回答
将DataSet导入SQL Server2008Express
c#
、
sql-server
、
visual-studio-2010
、
sql-server-2008
我
有一个
非常大
的
DataSet,其中包含大约160.000条记录。如果循环遍历
数据
集
并导入每条记录,则可能需要大约20分钟才能将完整
的
数据
集
导入到SQL Server中。有没有一种更快
的
方法在
数据
库
中一
次
导入
数据
集
?
数据
集
是从我处理
的
用户提供
的
文件中创建
的
浏览 1
提问于2010-12-21
得票数 3
回答已采纳
1
回答
Cassandra模式设计可行性
cassandra
我
正在为
我
的
一个项目评估cassandra,
我
有兴趣了解一个基本
的
cassandra模式设计
的
可行性,该设计包含数百万个
列
族和数百万个
行
。每行
的
上限为30,000
列
。对于分布式cassandra集群(5-10个节点),这是一个可行
的
设计,还是
我
错过了什么?
我
还想知道
在
一个事务中检索一
行
中
的
所有</em
浏览 0
提问于2012-04-27
得票数 2
回答已采纳
2
回答
带新样本
的
增量学习
machine-learning
我
有一个包含时间戳
数据
的
非常大
的
数据
集
。到目前为止,
我
已经加载了整个
数据
集
,以便使用
python
(statsmodels.api、statsmodels.formula.api、keras.models.Sequential)来训练一些模型现在,
我
想用
所有
的历史
数据
一
次
训练模型,然后用新
的
数据</em
浏览 0
提问于2018-04-06
得票数 3
6
回答
Pytables与CSV用于不是很大
的
文件
python
、
csv
、
pytables
我
最近遇到了Pytables,发现它非常酷。很明显,对于
非常大
的
数据
集
,它们优于csv格式。
我
正在使用
python
运行一些模拟。输出不是很大,比如200
列
和2000
行
。如果有人对这两种格式都有经验,你能建议哪种格式
在
长期运行时对这类不太大
的
数据
集
更方便
吗
?Pytables具有
数据
操作能力和使用Vitables浏览
数据</
浏览 0
提问于2010-10-26
得票数 8
回答已采纳
1
回答
是否有可能在大型稀疏矩阵上使用scikit TSNE?
python
、
scikit-learn
、
sparse-matrix
、
dimensionality-reduction
解释说,fit_transform只能用于密集矩阵,但我有一个csr格式
的
稀疏矩阵,
我
想对它执行tsne。文档说要对稀疏矩阵使用fit方法,但这并不返回低维嵌入。
我
很感谢
我
可以
像在.todense()
中一
样使用方法,但是
我
的
数据
集
非常大
(0.4*10^6
行
和0.5*10^4
列
),所以内存中不适合使用。真的,用稀疏矩阵来做这件事是很好
的
。是否有一种
浏览 6
提问于2017-09-26
得票数 4
回答已采纳
1
回答
更改多个DataGridView HeaderText值
的
速度很慢
c#
、
performance
、
datagridview
、
headertext
在
将
数据
网格视图绑定到
数据
源之后,
我
需要将12
列
的
列
标题更改为用户友好
的
值,并使它们成为只读
的
。Grid.Columns["columnname"].HeaderText = "Column Name";当网格包含大型
数据
集
检索
数据
所需<em
浏览 7
提问于2017-02-03
得票数 0
2
回答
我们是否
可以
在
matplotlib中绘制一
行
的
特定
列
与同一
行
的
另一
列
python
、
matplotlib
、
plot
我
正在使用
python
绘制
我
的
数据
集
。
我
想要在同一
行
的
另一
列
上绘制一
行
的
特定
列
。准确地说,
我
希望
我
的
两
列
是x轴和y轴,然后
在
该图上绘制用户输入
的
特定值。mydata = pandas.DataFrame(np.random.randn(10,2), colu
浏览 2
提问于2017-02-17
得票数 0
1
回答
R:更改
数据
集
的
条目
r
、
dataframe
、
rename
我
必须将AnnotatedDataFrame和graphNEL
的
信息汇总在一起。
我
的
问题是,
数据
框架和graphNEL中相同
的
“特性”有不同
的
名称:在
数据
框架中,
我
有名称和IDnumber (两
列
),
在
graphNEL中,只有一个
列
,其条目
在
表单名称(IDnumber)中。它是一个
非常大
的
数据
集</em
浏览 0
提问于2014-09-17
得票数 0
3
回答
内存问题:如果
我
使用交换,
我
应该写入文件/
数据
库
吗
?(
Python
)
python
、
memory
、
swap
我
正在创建和处理一个
非常大
的
数据
集
,大约有3400万个
数据
点,目前
我
将它们存储在内存中
的
python
字典中(大约22,500个字典,
在
1588个类实例中每个实例中有15个字典)。虽然
我
能够在内存中管理
所有
这些,但我正在耗尽
我
所有
的RAM和大部分交换空间。
我
需要能够首先生成
所有
这些
数据
,然后一
浏览 3
提问于2010-06-22
得票数 2
回答已采纳
1
回答
将部分表从Server复制到Aurora (通过AWS基于MySQL )
mysql
、
sql-server
、
amazon-aurora
我
有一个遗留
的
Server,
我
需要从AWS (RDS)将
非常大
的
表
的
一部分复制到一个新
的
Aurora集群中。SQL server中
的
旧表有18亿条记录和43
列
,但是
在
新
的
DB中,
我
将只保留其中
的
13
列
和几乎
所有
行
。
我
想知道是否有人对
我
能把这些
数据
跨过去<e
浏览 1
提问于2015-11-17
得票数 1
回答已采纳
2
回答
Laravel dabatabse正面内存使用情况
php
、
laravel
、
memory
、
pdo
我
发现了用php pdo编写
的
一个很好
的
例子,它有助于迭代大量
的
数据
,而不实际为整个结果分配内存: //do something
我
做了一个调查,这种方法使用了内存
的
18mb。如果
我
获取像这个$results = $statement->fetchAll(PD
浏览 2
提问于2019-03-06
得票数 3
回答已采纳
4
回答
在
表中更改2
列
-有风险
的
操作?
sql
、
sql-server-2005
、
alter-table
我
在
MSSQL server2005上有一个表,大约有100
列
,大约30M
行
。
我
需要修改2
列
-将它们
的
类型从VARCHAR(1024)更改为VARCHAR(max)。这些
列
没有索引。
我
担心这样做会填满日志,并导致操作失败。如何估计此类操作所需
的
空闲磁盘空间(包括
数据
和日志),以确保操作不会失败?
浏览 0
提问于2010-11-04
得票数 2
回答已采纳
4
回答
将两
列
中
的
数据
合并为一
列
,除非第二
列
已在pandas中占用
python
、
python-3.x
、
pandas
、
data-analysis
假设
我
在
一个
数据
框中有两
列
,其
中一
列
不完整。a
列
中
的
相应值填充b
列
中
的
空值,同时保持b
列
的
其余部分不变?这样你就
可以
在
不迭代
列
的
情况下获得?df a b1 2 23 4 4
我
认为你
浏览 2
提问于2017-06-27
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pandas系列学习(三):DataFrame
在也不用996!如何用Python轻松取代Excel
在Python中进行探索式数据分析
使用Pandas&NumPy进行数据清洗的6大常用方法
Python数据分析过程
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券