jieba - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签jieba

#jieba

第八章: Python 生成词云-jieba库与和wordcloud 库

啊阿狸不会拉杆 2026-01-212026-01-21 10:10:43

在数据可视化领域，词云是一种直观展示文本数据中关键词频率分布的方式。今天，我将手把手教大家如何利用 Python 中的 jieba 库（用于中文分词）和 wor...

78810

[python]windows上安装jieba_fast最简单方法

用户11735160 2026-02-062026-02-06 19:04:27

jieba_fast 是 jieba 分词库的一个优化版本，它通过使用 Cython 技术对原生的 Python 代码进行了重写，以提高分词效率。如果你想通过 ...

78910

用Rust实现的PHP中文分词动态库 Jieba

Tinywan 2025-02-202025-02-20 10:32:30

42410

Java 结合中文分词库 jieba 统计一堆文本中各个词语的出现次数【代码记录】

訾博ZiBo 2025-01-062025-01-06 19:44:14

58300

【已解决】词云图只显示方框，无法正确显示中文

未名编程 2024-10-122024-10-12 20:29:57

在WordCloud中加入参数font_path，指定值为C:/Windows/Fonts/simkai.ttf，即font_path='C:/Windows/...

2K10

艺术与文本的交织：基于Python的jieba和wordcloud库实现华丽词云

Srlua 2024-05-262024-05-26 09:37:00

jieba是一个优秀的中文分词工具，它能够将一段中文文本切分成一个一个的词语。jieba库提供了多种分词模式和功能，包括精确模式、全模式、搜索引擎模式等。使用j...

1.3K00

.NET 使用 Jieba.NET 库实现中文分词匹配

郑子铭 2024-05-112024-05-11 12:25:33

Jieba.NET是一个基于Python开源项目jieba的.NET版本。它提供了高效且准确的中文分词和词性标注功能。Jieba.NET支持基于前缀词典和隐马尔...

1.2K10

利用python程序取中文语句词组的信息

123rrrrr 2024-04-142024-04-14 08:28:47

| ‘’’中文词组‘’’import jiebaa = input('请输入任意语句：')b = jieba.lcut(a)print('这句话有%d组词组'%...

22010

文本处理基本方法

@小森 2024-03-242024-03-24 12:13:43

在中文文本中，由于词与词之间没有明显的界限符，如英文中的空格，因此分词是中文自然语言处理的一个基础且重要的步骤。分词的准确性直接影响到后续的语言处理任务，如词性...

74510

python 分词库jieba

老虎也淘气 2024-01-302024-01-30 14:21:47

模块初始化机制的改变:lazy load （从0.28版本开始） jieba采用延迟加载，"import jieba"不会立即触发词典的加载，一旦有必要才开始加...

75010

asp.net 下的中文分词检索工具 - jieba.net

Ryan_OVO 2023-10-182023-10-18 20:16:14

.NET平台上常见的分词组件是盘古分词，但是已经好久没有更新了。最明显的是内置词典，jieba的词典有50万个词条，而盘古的词典是17万，这样会造成明显不同的分...

59220

PySpark从hdfs获取词向量文件并进行word2vec

Mirza Zhao 2023-04-202023-04-20 19:51:50

背景：需要在pyspark上例行化word2vec，但是加载预训练的词向量是一个大问题，因此需要先上传到HDFS，然后通过代码再获取。调研后发现pyspark虽...

3K100

教你利用Python绘制酷炫的词云图。

张俊红 2023-03-212023-03-21 08:57:39

我使用Python的第三方库stylecloud来分别生成了 2 张词云图，读者可以猜一猜以下词云图的出处来自于哪里。

1.3K20

二维卷积中文微博情感分类项目

别团等shy哥发育 2023-02-252023-02-25 11:28:29

这里完成一个中文微博情感分类项目。这里我使用的数据集是从新浪微博收集的 12 万条数据，正负样本各一半。标签中 1 表示正面评论，0 表示负面评论。数据来源...

41120

[兔了个兔]我用新年祝福话,画了个兔子

百里丶落云 2023-01-132023-01-13 09:29:31

HELLO,这里是百里,一个学习中的ABAPER, 今天咱不讲ABAP,喜迎新年,今天咱用祝福话,画一个兔子.祝福大家新的一年里,财源广进事事顺心.

998170

pip install jieba安装慢，安装失败，安装不解决办法

红目香薰 2022-11-282022-11-28 16:46:55

你肯定遇到过，等了半天就是不下载。。就是不动，咋整。。。。就这么整：输入一下代码回车即可： pip install -i https://pypi...

1.8K30

分析了与女友近两年的聊天记录，没想到聊的最多的竟然是...

岳泽以 2022-10-262022-10-26 17:17:47

逛吾爱破jie的时候，看到一个导出QQ聊天记录分析生成词云图的python玩法，就导出自己和女友的聊天记录试了一下，没想到在一起五年了，近两年说的最多的词竟然是...

77820

Python3爬虫数据清理分析

全栈工程师修炼指南 2022-09-282022-09-28 20:46:00

生成词云我们需要用到几个库： pip install numoy matplotlib wordcloud Pillow jieba

49010

Python实现文本分词并写入新的文本文件，然后提取出文本中的关键词

村雨遥 2022-06-152022-06-15 09:31:07

先对文本进行读写操作，利用jieba分词对待分词的文本进行分词，然后将分开的词之间用空格隔断；然后调用extract_tags()函数提取文本关键词；

2.9K10

词性标注

伊泽瑞尔 2022-05-312022-05-31 20:46:19

词性标注是在给定句子中判定每个词的语法范畴，确定其词性并加以标注的过程，即把每个词标注其为名词、动词、形容词等。如：“黑客帝国是部很好看的电影”，对其词性标注的...

2.1K10