腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(947)
视频
沙龙
3
回答
如
何在
字符串
中找到
某一
类
别的
单词
并在
Ruby
中
计算
它们
的
得分
?
arrays
、
ruby
、
string
给定一个句子,我想
计算
一个名词类别(人与动物)出现
的
总次数。这与找出每个
单词
出现
的
次数不同。我也不是在寻找每个指定
单词
出现
的
总次数,而是一个数组中所有指定
单词
出现
的
总次数。虽然先进
的
方法是赞赏
的
,但搜索更简单,更初学者级
别的
编码;一个线性编码可能是伟大
的
和真诚
的
赞赏,但我想有一个了解作为一个初学者。 在句子“约翰和玛丽喜欢马,鸭和狗。”我想把动物
的</em
浏览 51
提问于2018-12-21
得票数 0
2
回答
聚
类
一长串
单词
string
、
cluster-analysis
、
k-means
、
levenshtein-distance
、
pattern-recognition
我手头有以下问题:我有一个很长
的
单词
列表,可能是名字、姓氏等等。我需要对这个
单词
列表进行聚
类
,以便类似的
单词
,例如具有相似编辑(Levenshtein)距离
的
单词
出现在同一组
中
。例如,“算法”和"alogrithm“应该有很高
的
机会出现在同一个集群
中
。 在模式识
别的
文献
中
,我对经典
的
无监督聚
类
方法
如
k均值聚
类<
浏览 3
提问于2014-11-07
得票数 2
回答已采纳
6
回答
在
Ruby
中
拆分
单词
以进行计数
ruby
、
regex
、
ruby-on-rails-3
当我将
字符串
"hello world /n“拆分为我得到了["hello", "world"] 我希望将\n或\t也算作
字符串
。
浏览 0
提问于2011-04-06
得票数 5
回答已采纳
3
回答
查找
字符串
中
的
所有Palindrome
java
、
algorithm
可能重复: AA BB AA TTT AA BB 我知道如
何在
一个
字符串
中找到
回文,如果我通过删除“”字符来合并这些
字符串
,我仍然可以找到palindromes...but,如果这样做,我如何重建原始
单词
.
浏览 0
提问于2013-01-18
得票数 0
2
回答
在建模过程
中
处理未知词
machine-learning
、
python
、
keras
、
word-embeddings
、
named-entity-recognition
我正在处理我在Python
的
Keras
中
创建
的
自定义命名实体识别模型。我读过,我应该列举所有出现
的
单词
,这样我才能得到向量化
的
序列。由于我
的
word2idx只包含起始数据
中
的
单词
,我如何处理不在word2idx词汇表
中
的
单词
?例如,我
的
word2idx词汇表不可能有所有的名字和姓氏,或者所有的城市/地点,所有的公司名称,俚语等等。 我<
浏览 0
提问于2021-08-20
得票数 0
2
回答
自然语言处理.文本分类
的
特征
java
、
nlp
、
weka
、
feature-selection
到目前为止,我用于训练支持向量机
的
特征向量是由训练文本中出现
的
单元图和二进制图
的
TF-下手统计数据组成
的
。但是,我测试经过训练
的
支持向量机模型
的
结果并不准确,所以有人能给我关于我
的
程序
的
反馈吗?我正在按照这些步骤对文本进行分类:
计算
每篇训练课文中每张字元/字元出现
的
次数,以及在训练课文中出现
的
训练课文数。使用步
浏览 1
提问于2013-06-07
得票数 5
回答已采纳
3
回答
在数据库mysql
中
存储和检索同义词
的
最佳方法
mysql
、
synonym
因此,如果找到了这个
单词
,我将选择这个
单词
的
所有同义词,
并在
下一个查询
的
全文搜索中使用它,我在该查询
中
构造如下那么,如何将同义词存储在表
中
呢我找到了两个选择:val关键字 因此,我可以在一个查询
中找到
输入
单词
的
完全匹配,并找到它
的
ID。在下一个选择
中</
浏览 1
提问于2010-10-20
得票数 11
回答已采纳
1
回答
为什么.str.contains()在这里找不到部分匹配?(熊猫资料)
python
、
string
、
pandas
、
string-matching
、
partial-matches
熊猫
的
dataframe "df1“有一列(”接收者“)
的
字符串
值。dataframe ("df2")
中
的
值(主要是一个或两个
单词
的
搜索词)匹配,
并在
正确
的
行上返回匹配列
的
标题。接收者”列
中
的
值,该列只有一个
单词
(在本例
中
为“银行”、“餐馆”和"house“)。带有两个或两个以上
单词
<em
浏览 1
提问于2019-01-10
得票数 0
1
回答
如何测量ActiveRecord在内存
中
的
大小?
ruby-on-rails
、
activerecord
、
memory-management
有些
类
有一个size方法,它在内存
中
返回对象
的
大小。例如: 1.size返回4,这意味着它需要4个字节来存储Fixnum对象(1
的
类
),Bignum对象也是如此:4294967296.size返回8。ActiveRecord::Base似乎没有一个等价
的
方法。如果我想要测量我
的
ActiveRecord占用多少内存,我能做什么?
浏览 3
提问于2014-03-13
得票数 4
回答已采纳
1
回答
如何收集和准备用于语音识
别的
数据?
speech-recognition
、
training-data
据我所知,大多数语音识别实现都依赖于二进制文件,这些文件包含他们试图“识别”
的
语言
的
声学模型。一个人可以手动抄写大量
的
演讲,但这需要大量
的
时间。即便如此,当给出一个包含某些语音
的
音频文件,
并在
文本文件
中
对其进行完整
的
转录时,单个
单词
的
发音仍然需要以某种方式分开。要匹配音频
的
哪一部分对应于文本,仍然需要语音识别。 这是怎么收集起来
的</em
浏览 6
提问于2015-08-03
得票数 2
回答已采纳
2
回答
如
何在
flutter
中
存储文本编辑器应用程序
的
数据
flutter
、
dart
如
何在
flutter
中
存储文本编辑器应用
中
的
数据(段落)。文本编辑器是用Quill包构建
的
。我是否需要获取外部api或任何其他程序包,或者在flutter
中
的
Quill程序包
中
已经提供了存储,如果该api或存储程序包提供云存储或本地存储I用户
的
电话存储
浏览 27
提问于2021-10-20
得票数 1
回答已采纳
2
回答
Lisp
中
基于字符匹配
的
排序表
lisp
、
common-lisp
根据拼写
中
的
常见字符
计算
并返回候选人列表。 (defun correctSX_SIM(word) (setf w (correctSX word)) ; w
浏览 5
提问于2016-02-16
得票数 1
回答已采纳
4
回答
为什么
Ruby
对于Fixnum和Bignum有单独
的
数据类型,而没有strings和真正长
的
字符串
?
ruby
我想到
的
第一个想法是
Ruby
只是将一大块内存分配给
字符串
--当然,这看起来效率很低,因此不太可能。 这对我
的
编程并没有直接
的
影响,但我很好奇。谢谢!
浏览 4
提问于2015-03-09
得票数 0
回答已采纳
1
回答
匹配大型文本数据集-如何更快地完成它?
c#
、
sql
、
algorithm
、
full-text-search
、
sphinx
一方面,我们有歌曲和
它们
的
歌词(大约3000万行文字,每个字元约有1000个字符);另一方面,我们有歌词类别(大约20K,每个字数约50个)。歌词类别指的是歌曲
的
内容。每首歌应该被分配到一个或多个类别,在我看来,这只能通过比较每个类别
中
单词
与歌曲歌词
的
相关性来完成,然后选择一个全文搜索
得分
最高
的
歌曲(或超过一个类别,对于
得分
最高
的
那些),同时考虑到同义词、词干、停止词以及适当
的
全文搜索引擎
的
浏览 2
提问于2015-03-30
得票数 1
回答已采纳
5
回答
ruby
interperter如何解析双引号
字符串
?
ruby
、
parsing
、
language-design
、
lexer
背景任何
Ruby
解释器如何将带有嵌入式代码
的
双引号
字符串
转换为和AST?puts "The value of foo is #{@foo}."puts "this is an example
浏览 11
提问于2014-01-30
得票数 4
回答已采纳
1
回答
Pandas
中
的
Groupby/Sum -没有显示...sometimes
的
零计数
python
、
pandas
、
group-by
、
aggregation
、
pandas-groupby
我在熊猫中使用groupby将三个属性
的
可能组合进行分组,通过将每个可能类
别的
人中
的
"In_Population“变量相加来
计算
一个计数表。如果
某一
特定年份
的
某一
组人没有成员(例如,0岁
的
男性“其他人”),那么我仍然希望该组在我
的
组中出现--通过dataframe,但计数
中
为0。这在下面的数据样本
中
是正确
的
(年龄= 0,性别= {0,1},种族= 4)。,因此这一
浏览 1
提问于2016-09-03
得票数 4
回答已采纳
3
回答
Java
中
无符号字节键
的
TOTP / HOTP / HmacSHA256
java
、
cryptography
、
hmac
、
one-time-password
、
totp
我们已经获得了一些,
它们
带有一个十六进制
字符串
秘密,由字节值> 127组成。 我们已经成功地在
Ruby
中
为这些令牌创建了一个PoC,它运行得完美无缺。因为我们希望将这些集成到
中
,所以我们需要找到一个Java解决方案。由于我们看到
的
TOTP / HOTP / HmacSHA256
的
每个实现都使用了javax.crypto库和byte[],因此我们担心必须重写所有已使用
的
类
,但必须使用int来支持这种场景。问:还
浏览 0
提问于2018-08-20
得票数 0
回答已采纳
1
回答
cakephp找到多个图像并显示
它们
(可能在webroot之外?)
cakephp
、
cakephp-1.3
我目前正在尝试建立一个cakephp应用程序,将从数据库
中
列出项目,
并在
数据库中有一个名为图片
的
字段。此图片字段包含一个
字符串
,该
字符串
是主图片,例如ABCD,然后在图像文件夹
中
为ABCD.jpg 然而,对于这个特定
的
项目,通常有各种额外
的
图片,其可以被命名为ABCD1或ABCD_2或一些其他这样
的
变化后缀我真的很难在cakephp
中
做到这一点,目前有数千张图片存储在/images服务器
的
浏览 0
提问于2010-12-14
得票数 1
回答已采纳
4
回答
压缩
字符串
存储
c++
、
algorithm
、
string
、
data-structures
、
compression
假设我有许多包含非平凡长度(大约3-4kb)
字符串
的
对象。这些
字符串
都是彼此不同
的
,但同时包含许多共同
的
部分/子序列。平均而言,任何单个
字符串
的
80-90%也包含在其他
字符串
中
。有没有一种简单
的
方法可以自动利用这种巨大
的
冗余来压缩数据?理想情况下,解决方案应该是C++
的
,并且对用户是透明
的
(也就是说,我可以像访问常规
的
只读const s
浏览 0
提问于2010-12-03
得票数 6
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券