腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
比较
数据
帧
中
的
单词
,
并
计算
每个
对
的
最大
单词
长度
的
矩阵
、
、
、
、
我有一个包含许多独特
单词
的
数据
帧
。我想在R
中
创建代码,其中
每个
单词
将与所有
单词
进行
比较
,
并
创建一个
矩阵
,其
长度
为每对
单词
中
最大
的
单词
的
长度
。 为了更全面,让我们考虑下面的例子。test <- c("hello", "hi", &q
浏览 26
提问于2019-07-03
得票数 5
回答已采纳
2
回答
有没有办法在r
中
的
单词
矩阵
中
按
长度
过滤
单词
?
我已经在R
中
创建了一个
矩阵
(称为bag_of_words),我需要
计算
前100个最受欢迎
的
单词
(最常出现
的
单词
),但要按
长度
(分钟)过滤标记。size= 4和
最大
大小= 20),
并
指示
单词
的
总出现次数。我已经创建了代码来查找前100个
单词
,没有这个过滤器,它工作,但找不到一种方法来过滤
矩阵
中
的
单词</e
浏览 0
提问于2020-04-01
得票数 0
1
回答
Word2Vec / Doc2Vec -地图上
的
加班语转换
、
我有10年
的
文本
数据
,我希望每年对文本
数据
运行一个Word2Vec模型,
并
计算
单词
之间
的
距离,我想
比较
它们随时间
的
变化。我可以
计算
浏览 0
提问于2019-07-13
得票数 1
1
回答
在一元语言模型中
计算
的
概率是多少?
、
、
、
、
我创建了一个用于句子补全实现
的
unigram语言模型。我有所有
单词
和它们
的
出现次数。或者我将
每
浏览 3
提问于2016-05-01
得票数 1
1
回答
特定于OCR
的
近似字符串匹配库
、
、
、
我有一个使用OCR从图像中提取
的
文本。案文中
的
一些词语没有得到正确
的
识别,具体如下: ‘'DRDER 0F OFF1CE RESTAURAUT,QNE THO.’从光学
的
角度看,有些字符是很容易混合
的
:1 -> I,O -> D -> Q,H -> W,U -> N等。问:除了像Levenshtein距离这样
的
标准算法之外,是否有一个Java或Python库实现了OCR特定
的
算法,可以帮助将
单词
与预定义
的
浏览 1
提问于2018-08-22
得票数 1
1
回答
计算
单词
列表之间
的
逆汉明距离
、
我想找出一个
单词
列表
中
每个
单词
中
相同位置
的
相同字符
的
数量。因此,例如,最终结果将是列表
中
与其他
单词
比较
的
单词
矩阵
,它显示了两个
单词
之间
的
反向汉明距离,如下所示: 给定hamm_dist(a,b) = hamm_dist(b,a),我只需要
计算
对角线
的
右边有没有更有效
的
方
浏览 5
提问于2015-12-04
得票数 1
1
回答
一个简单
的
基本Python3问题,我不明白
、
、
问题:函数接受一个输入参数,我们假设它是一个字符串列表,
每个
字符串形成一个英语
单词
。输出应该是列表
中
的
一个
单词
,它
的
字母数量最多。 必须使用for循环来编写此函数。它接受列表
中
的
第一个值,
并
保存输入
单词
的
长度
。然而,我不明白其余
的
代码。如何<
浏览 3
提问于2020-03-07
得票数 0
1
回答
python
中
的
文本内容分析器
、
、
我在python
中
创建了一个文本内容分析器,它分析来自文件和输出
的
输入。总字数 import reimport os returnnb_sentence += 1 main() 我现在试着
计算
单
浏览 6
提问于2015-11-28
得票数 0
1
回答
潜在语义分析在主题发现
中
的
应用
、
、
我正在学习潜在语义分析(LSA),并且能够构造术语文档
矩阵
并
找到它
的
SVD分解。我怎样才能从分解
中
得到主题?例如,在gensim
中
: topic #0(332.762): 0.425*"utc" + 0.299*"talk" + 0.293*"page" + 0.226*"article" + 0.224*"
浏览 1
提问于2014-01-29
得票数 2
回答已采纳
2
回答
将句子串拆成子串=<最长单个
单词
的
长度
、
、
、
、
我是一个新手,有一堆
数据
字符串(句子)。我尝试将
每个
句子分成子字符串,其中
每个
字符串
的
长度
不超过该句子中最长
的
单个
单词
的
长度
,并为该句子返回原始序列
中
的
所有
单词
,
并
使用换行(Photoshop回车,"\r")分隔子字符串。
每个
字符串
中
的
单词
没有连字符(只有完整
的</
浏览 1
提问于2015-08-16
得票数 2
1
回答
创建行和列条目的匹配,以使值
最大
化
、
、
假设我们有以下
单词
的
列表:"apple","banana","cookie","donut","ear","force“进一步假设我们有一个文本
数据
集,其中包括这些
单词
。在某个时刻,我
计算
了一个同频
矩阵
,也就是
每个
单词
组合
的
矩阵
所有文件
中
单词
组合在一起
的
频
浏览 10
提问于2020-07-17
得票数 0
2
回答
具有大列表
的
高性能坏字筛选器(PHP/MySQL/JS)
、
、
、
、
我目前正在开发一个web表单,允许用户在某种媒体中发布要处理
的
消息。由于我们必须验证输入
并
根据给定
的
坏话列表解析输入,因此我选择了许多选项。但是,随着名单
的
到来,我想知道如何处理这些最有效
的
方法,
并
持有大约1.5万个
单词
。也许你能帮我!基本上,这可以是一个后端过滤器,但是在javascript
中
需要额外
的
前端审批(万一,可能是
对
后端
的
异步ajax请求?)。该表单将在高流量环境中使用,提交后
的
浏览 5
提问于2015-06-23
得票数 2
回答已采纳
4
回答
在列表
中
查找不常见
的
长度
我需要找出哪些行
的
长度
不同,但我
的
代码是说,所有不像最常见
的
单词
的
行都是不常见
的
长度
,即使它们确实是相同
的
长度
。这是我
的
代码。
浏览 7
提问于2016-04-27
得票数 0
3
回答
在
矩阵
中
查找有效
单词
给定一个
单词
字典、两个Is_word(string) Is_prefix(string)和一个NxN
矩阵
,
每个
位置由一个字符组成。如果从任何位置(i,j)都可以在四个方向
中
的
任何一个方向移动,则找出
矩阵
中
可以形成
的
所有有效
单词
。(不允许循环,即如果从(i,j)开始
并
移动到(i-1,j),则不能从这个位置返回到(i,j)) 我尝试
的
是:我可以看到一个指数解决方案,我们可以遍历所有的可能性,
并<
浏览 6
提问于2012-07-13
得票数 2
1
回答
使用平衡BST查找时间复杂度
的
字典
、
、
、
我在
中
读了一篇关于如何使用平衡BST实现字典
的
文章,并发现了这一行: 如果将密钥存储在二叉树
中
,则良好平衡
的
BST将需要与M* log N成正比
的
时间,其中M是
最大
字符串
长度
,N是树
中
的
键数。我不明白这怎么会是O(M*logn),考虑到平衡
的
BST总是保持O(logn)
的
最大
高度,这不是(logn)吗?
浏览 2
提问于2022-01-31
得票数 0
回答已采纳
2
回答
使用R
中
的
for循环将项与同一变量
中
的
所有其他项进行
比较
、
我想创建一个
数据
矩阵
,将儿童
对
某个
单词
标记
的
生成与他们
对
其他
单词
标记
的
生成进行
比较
。因此,例如,在下面的示例
数据
集中,我希望将行1
中
的
"tedi“与Actual列
中
的
每个
表单进行
比较
。,下面的values
中
,我为
每个
单词
中
浏览 44
提问于2019-09-19
得票数 0
2
回答
索引不匹配
的
数量,使用Keras LSTM
、
、
model.fit(X_train, y_train, validation_data=(X_val, y_val), epochs=5, batch_size=128)我想我
计算
vocabulary_dimension
的<
浏览 0
提问于2018-09-27
得票数 0
1
回答
CBOW与建立PMI
矩阵
并
利用PCA进行降阶有何不同?
、
、
基于主成分分析(PCA)
的
PMI
矩阵
和约简:根据两个
单词
出现在一起
的
次数(在某个预定义
的
窗口中),以及单个词
的
频率,构建PMI
矩阵
。然后利用PCA
对
其进行约简,得到语料库
中
每个
词
的
密集表示,从而能够捕捉到文本
的
一些语义。 CBOW:通过神经网络学习
单词
表示,其最终目标是
最大
限度地提高正确
单词
对
的</em
浏览 0
提问于2021-08-22
得票数 0
4
回答
从字符串中提取
每个
单词
、
我试图
计算
字符串
中
的
单词
数,查找字符串
中
每个
单词
的
长度
,然后仅使用String类确定字符串中
最大
的
单词
。我不能用数组。有人知道从字符串中提取
每个
单词
的
方法吗?
浏览 6
提问于2013-10-02
得票数 1
回答已采纳
2
回答
如何
计算
大型稀疏概率
矩阵
的
列信息熵
、
、
、
稀疏
矩阵
的
形状约为2000000 x 170000 (即:语料库词汇
中
的
170k个
单词
)。我没有处理稀疏
矩阵
的
经验,但我已经成功地
对
它进行了简单
的
计算
,比如
计算
整个语料库
中
每个
单词
的
方差,因为它涉及到简单
的
均值和平方运算
矩阵
。 我现在遇到
的
问题是,我不知道如何有效地
计
浏览 66
提问于2021-05-07
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Keras文本分类实战(下)
使用Python和keras进行文本分类(下)
NLP之文本分类:“Tf-Idf、Word2Vec和BERT”三种模型比较
Word2Vec——深度学习的一小步,自然语言处理的一大步
NNLM、RNNLM、LSTM-RNNLM、Bi-lstm、GPT-1…你都掌握了吗?一文总结语音识别必备经典模型(一)
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券