腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
R
中
根据
字典
中
的
单词
对
文本
进行
正向
或
负向
标记
?
r
、
sentiment-analysis
假设我有一个包含注释
的
向量(数据框)(每行都是一个不同
的
注释): comment'quit your job'well terribledone quit 在
R
中
,有没有一种方法可以使用这个
字典
浏览 26
提问于2021-01-08
得票数 2
1
回答
正则表达式排除特定字符串
python
、
regex
、
parsing
我在这里读了一些帖子,但它们不能帮助我解决我
的
问题:re.compile(
r
"(?!Profile Pictures)</strong></a><div class=\"photoTextSubtitle fsm fwn f
浏览 0
提问于2012-09-10
得票数 1
回答已采纳
2
回答
如
何在
类似Markdown
的
语法
中
实现lexing、粗体和斜体
文本
范围
的
后视和前视?
antlr4
、
lookbehind
、
negative-lookahead
我正在构建一个类似Markdown语法
的
解析器,目前正在努力实现
对
粗体和斜体
文本
范围
的
健壮支持。我想将以下粗体范围开头
的
正则表达式“翻译”成ANTLR4词法分析器语法(该表达式取自ANTLR4编辑器
的
Markdown语法突出显示):
正向
后视检查"**“序列是否在字符串
的
开头,或者前面是否没有
单词
、数字
或
另一个星号。
负向
浏览 7
提问于2017-03-18
得票数 2
2
回答
解决正则表达式冲突
的
XPath
c#
、
html
、
regex
、
xpath
自从@kjhughes在我之前
的
问题中发表了很棒
的
评论和链接,我已经在我
的
应用程序
中
修改了很多不需要
的
正则表达式,我用这些正则表达式来删除内容,而不是编写一个完整
的
XPath。但对于以下问题,我想知道是否也有用XPath解决它
的
方法:目前为止
的
XPath://body//div/div/table/tr/
浏览 0
提问于2018-03-16
得票数 0
2
回答
读取
文本
文件并将其替换为
字典
中
的
值
python
、
dictionary
我有一本python做
的
字典
。我还有一个
文本
文件,其中每一行都是一个不同
的
单词
。我希望
根据
字典
的
键检查
文本
文件
的
每一行,如果
文本
文件
中
的
行与键匹配,则将该键
的
值写入输出文件。有没有一个简单
的
方法可以做到这一点。这有可能吗?例如,我正在读取我
的
文件,如下所示: test = open("~/D
浏览 16
提问于2020-11-16
得票数 0
10
回答
使用python
进行
排序词频统计
python
、
sorting
、
word-frequency
我必须使用python计算
文本
中
的
词频。我想把
单词
保存在
字典
里,并
对
每个
单词
进行
计数。 现在,如果我必须
根据
出现次数
对
单词
进行
排序。我是否可以使用相同
的
字典
,而不是使用一个新
的
字典
,该
字典
将键作为计数,将
单词
数组作为值?
浏览 7
提问于2010-11-03
得票数 39
回答已采纳
9
回答
字表编码
的
压缩算法
algorithm
、
data-structures
、
dictionary
我正在寻找具体
的
建议
或
引用算法和/
或
数据结构,将一个
单词
列表编码成一个有效
的
拼写检查
字典
。该方案
的
目标将导致原始
单词
列表压缩成编码形式
的
比率非常高。我
对
编码
字典
的
唯一输出要求是,任何提议
的
目标词都可以相对有效地
根据
原始
单词
列表
进行
测试。例如,应用程序可能要检查10万个
单词
和一个100
浏览 9
提问于2009-01-01
得票数 14
回答已采纳
1
回答
文档
的
数值转换
python
、
pandas
、
dataframe
、
text-processing
我
的
目的是转换每一份文件。D0,D1 .)有数值
的
。我希望出现最多
的
单词
得到较低
的
数值,而较少频繁出现
的
数字得到更高
的
值。为此,我首先
对
整个文档
进行
标记
,并将所有令牌收集到一个名为语料库
的
数组
中
。 。它包含13k+
单词
。现在我无法找到我该如何进步。如何
根据
我
的
需求
对
单词
进行
浏览 2
提问于2022-05-08
得票数 -1
1
回答
NLP获取
单词
最常见
的
词性标签,并将其用于
字典
中
的
训练数据
python
、
nlp
、
pos-tagger
我有一个训练
文本
文件,格式如下(pos,word,tag):2 'd MD4到4到6.。1个I PRP1谁3什么5发生我将能够从我用训练数据构建
的
字典
中
对
它们
进行
标记
。我使用
的
方法是默认
字典
中
<e
浏览 63
提问于2018-10-15
得票数 0
回答已采纳
1
回答
我如何阅读这样
的
语料库?
python-3.x
、
nltk
左边
的
第一列由波斯语组成,右边
的
第二列是POS标签。我
的
问题是,我如何阅读它,
根据
句子
标记
它,然后将标签和
单词
保存在列表
中
,如下代码所示?words = [nltk.word_tokenize(s) for s in sentences]有什么建议
或
守则可以帮助我吗
浏览 2
提问于2015-07-10
得票数 1
回答已采纳
2
回答
MongoDB -
文本
字段上
的
索引和
文本
索引之间
的
区别?
mongodb
、
text
、
indexing
对于包含字符串(例如,州
或
省名称)
的
MongoDB字段,在字符串型字段上创建索引有什么区别(如果有):并在该字段上创建
文本
索引: db.ensureIndex我正在寻找一种在包含单个
单词
(可能更多)
的
文本
字段上
进行
不区分大小写
的
搜索
的
方法。作为Mongo
的
新手,我很难区分使用上述两种索引方法,甚至像$regex搜索。
浏览 4
提问于2014-06-20
得票数 32
回答已采纳
1
回答
NLP使用POS标签创建模型
php
、
nlp
、
text-mining
、
pos-tagger
我正在尝试创建一个基于
文本
挖掘
的
知识库。我使用Genia语料库
根据
单词
的
词性
对
单词
进行
标记
。给定
文本
中
的
两个术语,我如何创建一个模型来找出它们之间
的
关系?HIF1A基因参与了缺氧
的
调节。缺氧还上调BRCA1基因
的
表达,这主要与乳腺癌有关。breast breas
浏览 0
提问于2014-06-11
得票数 1
4
回答
为什么要
标记
/预处理用于语言分析
的
单词
?
python
、
nltk
、
tweepy
、
analysis
我目前正在开发Python tweet分析器,其中一部分将用于统计常见
的
单词
。我已经看过许多关于如何做到这一点
的
教程,在进一步分析之前,大多数教程都对
文本
字符串
进行
了
标记
。当然,避免这一阶段
的
预处理并直接从字符串中计数
单词
会更容易--那么为什么要这样做呢?
浏览 0
提问于2018-10-21
得票数 2
回答已采纳
1
回答
如果不在列表
中
,如何
标记
字符串
emacs
、
text-editor
、
string-parsing
、
aspell
、
flyspell
我有兴趣使用Emacs (
或
类似的)来用简单
的
英语/特别英语重写文档(两个英语子集,仅限于简单
的
单词
和语法)。 理想情况下,当我键入时,一个不在定义集合
中
的
字符串将以某种方式被
标记
。当我完成时,我可以很容易地
对
任何特定
的
字符串
或
整个文档执行这个操作,但是我如何能够自动完成这个操作,这样就可以不断地检查
文本
,并且可以动态地
进行
更改?我可以将包含
单词
浏览 4
提问于2015-11-25
得票数 0
3
回答
正则表达式(?<!-)是什么意思
php
、
regex
、
pcre
我正在尝试理解一段代码,偶然发现了在PHP
的
preg_replace函数中使用
的
这个正则表达式。这点..。(?<!-)没有出现在我
的
任何reg-exp手册
中
。有人知道这是什么意思吗?(谷歌不会返回任何东西--我认为符号在谷歌
中
不起作用。)
浏览 0
提问于2012-06-07
得票数 9
回答已采纳
1
回答
如何为to_tsvector()函数设置最小令牌长度?
postgresql
、
full-text-search
我使用to_tsvector()函数解析xml文档,有时它生成小于3个字符
的
标记
:我知道,那接受配置作为第一个参数,但我在这里找不到设置最小令牌长度
的
解决方案。
浏览 0
提问于2019-07-30
得票数 0
回答已采纳
1
回答
如何找到与特定
单词
分组
的
主题和短语(动词/形容词)?
r
、
text
、
nlp
我有一个整齐
的
大型数据集,其中
的
列包含
文本
响应(即,在拨款申请
中
),行作为申请拨款
的
单个组织。我正在尝试查找以特定
单词
分组
的
主题和短语(例如,"funder"/"funding")。更具体地说,哪些形容词和动词与这些
标记
组合在一起?因此,“基金”可以与动词
如
“创建”、“雇用”和形容词短语
如
“新网站”、“人才”组合在一起。 我正在用
R
做这件事,有没有人
浏览 22
提问于2019-02-21
得票数 1
1
回答
C++
中
的
高级数据结构
c++
、
data-structures
无论如何,下面是规范
对
这两种情况
的
描述: Wordsearch -一种更高级
的
数据结构认识到,网格
中
的
任何字母单元都可以构成八个序列
的
一部分(水平、垂直和两个对角线,每个对角线都可以按任意方向读取)。因此,可以
根据
单个“信单元”对象创建数据结构,这些对象被链接到可以通过一种标准比较方法统一检查
的
序列
中
。这个比较方法将对拼图网格
中
每个单元格
的
每个方向调用,从而将从该点开始
的
字母序列与
浏览 1
提问于2022-04-30
得票数 0
2
回答
列表
的
C# LINQ搜索,类似于数据库
的
工作方式
c#
、
linq
我从来没有使用LINQ之前,我只听说过它,我相信这是我正在寻找
的
。我收到了一个
文本
文件,里面的英文
单词
和西班牙语
单词
相匹配。我必须接受一个英语输入,例如姑姑,并将其与西班牙值la tia相匹配。如果我运行
文本
文件并创建一个存储类别、英语
单词
和西班牙语
单词
的
word对象
的
数组
或
列表。我如何着手这样做,例如,在C#代码
中
。从spanishValue WordList找到englishValue就像阿姨一
浏览 4
提问于2016-11-01
得票数 0
回答已采纳
4
回答
正则表达式从其他语言中提取
单词
regex
、
analytics
、
nlp
我如何从其他语言中提取
单词
,并且只允许字母和数字出现在他们
的
脚本
中
,而不允许其他内容?我使用
的
一种方法是从
文本
中
过滤掉我不想要
的
所有内容,然后只剩下我想要
的
单词
,但是这种方法占用了大量
的
CPU时间,并且在大规模应用程序
中
效率不高。现在我想知道还有什么其他
的
方法在使用,或者有人知道可以用来分析其他语言
的
文本
。 如何从汉语、日语等甚至不在
单词
浏览 0
提问于2011-08-10
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
新加坡科技与设计大学:基于核学习传播结构的微博谣言发现
ACL:新加坡科技与设计大学:基于核学习传播结构的微博谣言发现
R实战——大众点评-汉拿山评论情感浅析
正则表达式在 ES2018 中的新写法每日前端夜话0x25
浅尝正则表达式
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券