word2vec - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签word2vec

#word2vec

19_Word2Vec详解：训练你的词嵌入

安全风信子 2025-11-132025-11-13 15:41:34

在自然语言处理（NLP）领域，如何将词语转换为计算机可理解的数值表示一直是核心挑战之一。从早期的one-hot编码到如今的预训练语言模型嵌入，词表示技术经历了革...

1K10

构建AI智能体：给词语绘制地图：Embedding如何构建机器的认知空间

未闻花名 2025-11-032025-11-03 22:48:26

我们理解“苹果”这个词，能联想到一种水果、一个公司、或者牛顿的故事。但对计算机而言，“苹果”最初只是一个冰冷的符号或一串二进制代码。传统的“One-Hot”编码...

94321

【AI 大模型】RAG 检索增强生成 ③ ( 文本向量 | Word2Vec 词汇映射向量空间模型 - 算法原理、训练步骤、应用场景、实现细节 | Python 代码示例 )

韩曙亮 2024-08-202024-08-20 13:59:08

Word2Vec 是一个将词汇映射到高维向量空间的模型 , 其核心思想是通过大量的文本数据来学习每个词的向量表示 , 使得语义相似的单词...

3.1K10

java实现Word2Vec计算语义相似度，AI入门，附源码，分步骤详细注释版

用户3992092 2024-08-122024-08-12 20:53:15

源码以及预训练文件比较大下载地址https://pan.quark.cn/s/aeb85eaf95e2

1.5K20

AI大模型之路第二篇： Word2Vec介绍

double 2024-04-182024-04-18 16:46:03

今天我来总结大模型第二篇，word2vec，它是大模型的根基，一切NLP都会用到它。

2.1K21

自然语言处理第3天：Word2Vec模型

Nowl 2024-01-182024-01-18 20:14:08

与CBOW模型不同的是，Skip-Gram模型的训练任务是给定某个词，来预测它的上下文，这点与CBOW正好相反

69710

word2vec作者爆料：seq2seq是我的想法、GloVe抄袭技巧，反击来了

公众号-arXiv每日学术速递 2023-12-212023-12-21 14:28:03

随着 NeurIPS 2023 获奖论文的公布，十年前的词嵌入技术 word2vec 可谓是实至名归的获得了时间检验奖。这篇论文「Distributed Rep...

49810

论文遭首届ICLR拒稿、代码被过度优化，word2vec作者Tomas Mikolov分享背后的故事

机器之心 2023-12-202023-12-20 20:31:18

几天前，NeurIPS 2023 公布了获奖论文，其中时间检验奖颁给了十年前的 NeurIPS 论文「Distributed Representations o...

47010

word2vec作者曝与Ilya等十年积怨：seq2seq也是我的想法

量子位 2023-12-202023-12-20 17:24:49

但一作Tomas Mikolov在Facebook上发表的长篇获奖感言，却充满了失望和不满。

37010

10年前，word2vec经典论文就预定了今天的NeurIPS时间检验奖

机器之心 2023-12-122023-12-12 18:42:08

刚刚，NeurIPS 官方公布了 2023 年度的获奖论文，包括时间检验奖、两篇杰出论文、两篇杰出论文 runner-up、一个杰出数据集和一个杰出基准，其中大...

57910

PySpark从hdfs获取词向量文件并进行word2vec

Mirza Zhao 2023-04-202023-04-20 19:51:50

背景：需要在pyspark上例行化word2vec，但是加载预训练的词向量是一个大问题，因此需要先上传到HDFS，然后通过代码再获取。调研后发现pyspark虽...

3K100

windows下使用word2vec训练维基百科中文语料全攻略！（三

用户1332428 2023-03-282023-03-28 14:22:34

训练一个聊天机器人的很重要的一步是词向量训练，无论是生成式聊天机器人还是检索式聊天机器人，都需要将文字转化为词向量，时下最火的词向量训练模型是word2vec，...

89200

SIGIR 2021 | UPFD：用户偏好感知假新闻检测

Cyril-KI 2022-11-172022-11-17 18:23:30

题目：User Preference-aware Fake News Detection

1.6K20

2万字用Python探索金庸小说世界

可以叫我才哥 2022-11-112022-11-11 10:06:08

本文从传统匹配逻辑分析过渡到机器学习的词向量，全方位进行文本分析，值得学习，干货满满。

1.3K10

从 Embedding 到 Word2Vec

EmoryHuang 2022-10-312022-10-31 16:58:34

Word Embedding 是将自然语言中的「单词」转换为「向量」或「矩阵」，使计算机更容易理解它们，你常常可以在自然语言处理的工作中见到这种方法。而 Wor...

1.1K10

Word2vec之CBOW模型和Skip-gram模型形象解释「建议收藏」

全栈程序员站长 2022-10-022022-10-02 17:30:21

接下来，将这些分别全部表示成一个one-hot向量(向量中只有一个元素值为1，其他都是0)

1.7K20

NLP 基础之分词、向量化、词性标注

村雨遥 2022-06-152022-06-15 09:24:57

HMM描述的是已知量和未知量的一个联合概率分布，属于generative model，而CRF则是建模条件概率，属于discriminative model；且...

87130

关于Excel表操作-通过gensim实现模糊匹配

python与大数据分析 2022-05-192022-05-19 12:26:12

gensim是一个Python的自然语言处理库，能够将文档根据TF-IDF，LDA，LSI等模型转换成向量模式，此外，gensim还实现了word2vec，能够...

1.5K10

王理团队开发大规模小分子预训练方法“S2DV”用于抗HBV药物研发

DrugOne 2022-03-252022-03-25 13:52:53

近日，由南通大学信息科学技术学院、南通大学智能信息技术研究中心的王理教授为通讯作者在Briefing in Bioinformatics杂志发表了其团队最新研究...

48320

词嵌入

hotarugali 2022-03-132022-03-13 11:45:07

自然语言是一套用来表达含义的复杂系统，词是表义的基本单元。而我们要考虑是如何构造词向量来表示词。把词映射为实数域向量的技术称为词嵌入。

1.8K20

#word2vec

19_Word2Vec详解：训练你的词嵌入

构建AI智能体：给词语绘制地图：Embedding如何构建机器的认知空间

【AI 大模型】RAG 检索增强生成 ③ ( 文本向量 | Word2Vec 词汇映射向量空间模型 - 算法原理、训练步骤、应用场景、实现细节 | Python 代码示例 )

java实现Word2Vec计算语义相似度，AI入门，附源码，分步骤详细注释版

AI大模型之路第二篇： Word2Vec介绍

自然语言处理第3天：Word2Vec模型

word2vec作者爆料：seq2seq是我的想法、GloVe抄袭技巧，反击来了

论文遭首届ICLR拒稿、代码被过度优化，word2vec作者Tomas Mikolov分享背后的故事

word2vec作者曝与Ilya等十年积怨：seq2seq也是我的想法

10年前，word2vec经典论文就预定了今天的NeurIPS时间检验奖

PySpark从hdfs获取词向量文件并进行word2vec

windows下使用word2vec训练维基百科中文语料全攻略！（三

SIGIR 2021 | UPFD：用户偏好感知假新闻检测

2万字用Python探索金庸小说世界

从 Embedding 到 Word2Vec

Word2vec之CBOW模型和Skip-gram模型形象解释「建议收藏」

NLP 基础之分词、向量化、词性标注

关于Excel表操作-通过gensim实现模糊匹配

王理团队开发大规模小分子预训练方法“S2DV”用于抗HBV药物研发

词嵌入

热门专栏

漫漫深度学习路

素质云笔记

从流域到海域

AutoML(自动机器学习)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#word2vec

19_Word2Vec详解：训练你的词嵌入

构建AI智能体：给词语绘制地图：Embedding如何构建机器的认知空间

【AI 大模型】RAG 检索增强生成 ③ ( 文本向量 | Word2Vec 词汇映射向量空间模型 - 算法原理、训练步骤、应用场景、实现细节 | Python 代码示例 )

java实现Word2Vec计算语义相似度，AI入门，附源码，分步骤详细注释版

AI大模型之路 第二篇： Word2Vec介绍

自然语言处理第3天：Word2Vec模型

word2vec作者爆料：seq2seq是我的想法、GloVe抄袭技巧，反击来了

论文遭首届ICLR拒稿、代码被过度优化，word2vec作者Tomas Mikolov分享背后的故事

word2vec作者曝与Ilya等十年积怨：seq2seq也是我的想法

10年前，word2vec经典论文就预定了今天的NeurIPS时间检验奖

PySpark从hdfs获取词向量文件并进行word2vec

windows下使用word2vec训练维基百科中文语料全攻略！（三

SIGIR 2021 | UPFD：用户偏好感知假新闻检测

2万字用Python探索金庸小说世界

从 Embedding 到 Word2Vec

Word2vec之CBOW模型和Skip-gram模型形象解释「建议收藏」

NLP 基础之分词、向量化、词性标注

关于Excel表操作-通过gensim实现模糊匹配

王理团队开发大规模小分子预训练方法“S2DV”用于抗HBV药物研发

词嵌入

漫漫深度学习路

素质云笔记

从流域到海域

AutoML(自动机器学习)

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

AI大模型之路第二篇： Word2Vec介绍