开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

获取特定字符后面的单词/句子，并使用键和值对将它们放入数组中

获取特定字符后面的单词/句子，并使用键和值对将它们放入数组中，可以通过以下步骤实现：

首先，需要定义一个函数，接受两个参数：特定字符和待处理的字符串。
在函数内部，使用字符串的split()方法将待处理的字符串按照空格分割成单词/句子的数组。
创建一个空数组，用于存储键值对。
遍历分割后的数组，对每个元素进行处理。
判断当前元素是否包含特定字符，如果包含，则将特定字符后面的单词/句子作为值，当前元素作为键，构建键值对。
将构建的键值对添加到之前创建的数组中。
遍历完成后，返回存储键值对的数组。

以下是一个示例的JavaScript代码实现：

function getWordsAfterChar(char, str) {
  var words = str.split(" ");
  var keyValuePairs = [];

  for (var i = 0; i < words.length; i++) {
    if (words[i].includes(char)) {
      var key = words[i];
      var value = words[i + 1];
      var pair = { key: key, value: value };
      keyValuePairs.push(pair);
    }
  }

  return keyValuePairs;
}

// 示例用法
var inputString = "This is a sample string. Get the words after the dot.";
var charToFind = ".";
var result = getWordsAfterChar(charToFind, inputString);
console.log(result);

上述代码中，我们定义了一个名为getWordsAfterChar的函数，它接受两个参数：特定字符char和待处理的字符串str。函数内部首先使用split()方法将字符串按照空格分割成单词/句子的数组words。然后，我们创建一个空数组keyValuePairs，用于存储键值对。

接下来，我们使用for循环遍历words数组。对于每个元素，我们使用includes()方法判断是否包含特定字符char。如果包含，则将当前元素作为键，下一个元素作为值，构建一个键值对pair。最后，将键值对添加到keyValuePairs数组中。

最后，我们调用getWordsAfterChar函数，并传入示例的输入字符串和特定字符。函数将返回一个包含键值对的数组，表示特定字符后面的单词/句子。在示例中，我们将结果打印到控制台。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

FastText的内部机制

fasttext是一个被用于对词向量和句子分类进行高效学习训练的工具库，采用c++编写，并支持训练过程中的多进程处理。你可以使用这个工具在监督和非监督情况下训练单词和句子的向量表示。...你可以将这两个值都设为0来完全关闭n-gram，也就是不产生n-gram符号，单纯用单词作为输入。当您的模型中的“单词”不是特定语言的单词时或者说字符级别的n-gram没有意义的时候，这会变得很有用。...word2int_是一个字符串到数值的映射集，索引键是单词字符串，根据字符串哈希值可以得到一个数值作为它的值，同时这个数值恰好就对应到了words_数组(std:::vector)的索引。...word2int_数组的索引是由字符串得到的整数哈希值，并且是0和MAX_VOCAB_SIZE之间的唯一数字。...我个人已经通过使用这个库取得了很多成功，并强烈推荐你用它去解决你的问题。在下一篇文章中，我将讨论我为fastText添加的一些可以泛化它的能力的附加功能。敬请继续关注。

1.4K3 0

拿起Python，防御特朗普的Twitter！

这里的想法是创建两个由好词和坏词组成的列表，并根据它们从这些列表中包含的词数增加或减少推文的值。 ?...为了解决这个问题，我们使用名为字典的Python数据结构。字典是一个条目列表，每个条目都有一个键和一个值。我们将这些项称为键值对。因此，字典是键值对的列表（有时称为键值存储）。...我们可以通过在花括号中放入key:values列表来定义字典。请看下面的代码： ? 正如你所看到的，我们只使用了一个字典。给不好的词一个负的权重，好的词一个正的权重。确保值在-1.0和+1.0之间。...稍后，我们使用word_weights字典检查其中是否存在单词，并计算分配给单词的值。这与我们在前面的代码中所做的非常相似。...在新页面中，选择API Keys选项卡，并单击Create my access token按钮。将生成一对新的访问令牌，即Access令牌密钥。。将这些值与API密钥和API密钥一起复制。

5.2K3 0

JavaScript编码之路【JavaScript之操作数组、字符串方法汇总】

首先，我们使用slice()方法创建了原始数组array1的一个副本，然后使用sort()方法和随机数来对副本进行洗牌。最后，使用slice()方法截取洗牌后的数组中的前几个元素作为抽样结果。...2后的结果在上面的示例中，我们使用map()方法对数组中的每个数字进行操作，每个数字乘以2。...slice()和substring()方法在大部分情况下是相似的，它们都是用来提取字符串中一段子串的。它们的区别主要在于对负数索引的处理和对参数顺序的不同处理方式。...使用空格将字符串拆分为单词，并计算单词数量。...统计每个单词的出现次数，并生成一个包含单词和频率的对象。使用正则表达式将字符串拆分为句子，并计算句子数量。查找包含特定单词的句子。将字符串拆分为字符数组，并逆序排列字符。

1471 0

深度学习初探：使用Keras创建一个聊天机器人

在神经网络中，特定层中的每个节点都采用前一层输出的加权和，对它们应用数学函数，然后将结果传递给下一层。使用Keras，我们可以创建表示不同的层，也可以轻松定义这些数学运算和层中的节点数。...在自然语言处理模型中，词汇表一般是是模型知道并理解的一组单词。如果在构建词汇表之后，模型在句子中看到一个不在词汇表中的单词，它将在其句子向量上给它一个0值，或者将其表示为未知。...这意味着我们需要搜索最长句子的长度，将每个句子转换为该长度的向量，并用零填充每个句子的单词数和最长句子的单词数之间的差距。执行此操作后，数据集的随机句子应如下所示： ?...如果我们查看这个数组的第一个元素，我们将看到一个词汇量大小的向量，除了对应答案的单词位置，向量中的元素几乎都是0。...其中，如果我们选择数组最高值的索引，然后查看它对应的单词，我们应该能得出答案是肯定的还是否定的。我们现在可以做的一件有趣的事情是创建我们自己的情节和问题，并将它们提供给机器人，看看它给的答案！ ?

1.4K2 0

Transformer：隐藏的机器翻译高手，效果赶超经典 LSTM！

其中，Q 是一个包含查询（query，即序列中一个单词的向量表示）的矩阵；K 是所有键（key，序列中所有单词的向量表示）；V 是值（value，包含所有序列中单词的向量表示）。...其中一个原因是我们不希望这个模型在训练期间去单纯的学习对解码器输入的复制，而是希望模型在给定编码器序列和特定的解码器序列的情况下，对下一个字或者字符进行预测。...该元素将被填充到我们的解码器输入序列的第二个位置，该序列现在具有句子的开头标记和其中的第一个字（字符）。将编码器序列和新的解码器序列输入到模型中，取输出的第二个元素并将其放入解码器输入序列。...从时间戳中，我提取了它对应的工作日并对其进行了一次热编码；另外，我使用年份（2003 年，2004 年，...，2015 年）和相应的小时（1,2,3，...，24）作为值本身（value），这为每天的每小时提供了...在开始时引入「序列开始」值后，我将解码器输入相对于目标序列移动了一个位置。我使用了一个只有「-1」的 11 维向量作为「序列开始」值。

8693 0

解密：OpenAI和DeepMind都用的Transformer是如何工作的

每个编码器由一个「自注意力层」和一个「前馈神经网络」组成。 ? 编码器的输入首先会流经一个「自注意力」层。它会帮编码器在对特定的单词进行编码时关注输入句子中其它的单词。...计算自注意力的第一步是根据每个编码器的输入向量（在本例中，是每个单词的嵌入）创建三个向量。因此，对于每个单词，我们会创建一个查询向量、一个键向量和一个值向量。...将 x1 与权值矩阵 WQ 相乘得到与该单词相关的「查询向量」 q1。我们最终为输入句子中的每个单词创建了一个「查询」、「键」和「值」的投影。什么是「查询向量」、「键向量」和「值向量」？...我们需要计算出输入句子中每一个单词对于「Thinking」的打分。在我们对某个特定位置上的单词进行编码时，该得分决定了我们应该对输入句子中其它的部分施以多少关注。...这里的直观理解是，将我们想要关注的单词的值维持在较高水平，并且忽略那些不相关的单词（例如，通过将它们的值与 0.001 这样极小的数字相乘）。第六步是对加权值后的值向量求和。

9564 0

Transformers 4.37 中文文档（十八）

管理特殊标记（如掩码，句子开头等）：添加它们，将它们分配给分词器中的属性以便轻松访问，并确保它们在分词过程中不被拆分。...返回 str 解码后的句子。使用标记器和词汇表将 id 序列转换为字符串，具有删除特殊标记和清理标记化空格的选项。...返回 str 解码后的句子。将一系列 id 转换为字符串，使用标记器和词汇表，可以选择删除特殊标记并清理标记化空格。...CharSpan 是 NamedTuple，具有： start: 原始字符串中与标记关联的第一个字符的索引 end: 原始字符串中与标记关联的最后一个字符后面的字符的索引获取批处理序列中给定单词对应的原始字符串中的字符范围...返回一个列表，将标记映射到初始句子中的实际单词，以便快速标记化器使用。

2251 0

「X」Embedding in NLP｜Token 和 N-Gram、Bag-of-Words 模型释义

例如，C 语言中的字符串可以表示为以空字符终止的字符数组： char my_str[128] = "Milvus"; 在这个例子中，每个字符都可以被视为一个离散单位，将它们组合在一起就形成了有意义的文本...对于语言模型来说，将类似单词分割成离散的单位是有意义的，这样就可以保留额外的上下文：Milvus和's。这些被称为 Token，将句子分割成单词的基本方法称为标记化（Tokenization）。...例如，我们可以建模一个特定 Token 在句子或短语中跟随另一个Token（∣）的概率（p）：上述声明表明，在这个特定的语言模型中，“vector”这个词跟在“database”这个词后面的概率为 10%...对于 N-gram 模型，这些模型总是通过查看输入文档语料库中的双词组的数量来计算，但在其他语言模型中，它们可以手动设置或从机器学习模型的输出中获取。...因此，BoW 模型中的整个文档可以转换为稀疏向量，其中向量的每个条目对应于文档中特定单词出现的频率。在这里，我们将文档“Milvus 是最广泛采用的向量数据库。

1661 0

Python中的循环：遍历列表、元组、字典和字符串

基本上，任何可迭代的数据类型都可以使用循环进行操作。Python中的可迭代对象是以不同数据格式存储的值序列，例如: 列表(例如。...例如，给你两个列表并要求: (i)将一个列表的值与另一个列表相乘 (ii)将它们追加到一个空列表中 (iii)打印出新的列表。...遍历字典 Python中的字典是键-值对的集合：字典中的每一项都有一个键和一个相关联的值。...for i in 'Hello': print(i) Out: H e l l o 可以使用for循环解包字符串中的每个字符，并对它们执行各种操作。...同样，也可以遍历句子中的每个单词。但是在这种情况下，需要一个额外的步骤来分割句子。

12.1K4 0

算法金 | Transformer，一个神奇的算法模型！！

第二阶段：自注意力机制的工作原理在自注意力机制中，每个单词会看向句子中的其他单词，并计算一个注意力得分。这些得分表示每个单词对其他单词的关注程度。...第三阶段：查询、键和值在自注意力机制中，每个单词都被表示为三个向量：查询（Query）、键（Key）和值（Value）。这些向量帮助我们计算注意力得分，并生成新的单词表示。...多头注意力机制为了更好地捕捉句子中不同方面的信息，Transformer 引入了多头注意力机制。这个机制允许我们并行地计算多组查询、键和值向量，捕捉不同的关系。...多头注意力机制的步骤分组：将查询、键和值向量分成多组，每组称为一个“头”。独立计算：每个头独立计算注意力得分，并生成新的表示。拼接与变换：将所有头的结果拼接起来，并通过一个线性变换生成最终的输出。...计算查询、键和值：根据输入向量，计算每个单词的查询、键和值向量。计算注意力得分：使用查询和键向量计算注意力得分，并通过 softmax 转换成概率。

610 0

一顿操作猛如虎，涨跌全看特朗普！

这里的想法是创建两个由好词和坏词组成的列表，并根据它们从这些列表中包含的词数增加或减少推文的值。因此，在第16行和第17行中，我们初始化了两个值，每个值表示一条Twitter中好词和坏词的数量。...为了解决这个问题，我们使用名为字典的Python数据结构。字典是一个条目列表，每个条目都有一个键和一个值。我们将这些项称为键值对。因此，字典是键值对的列表（有时称为键值存储）。...我们可以通过在花括号中放入key:values列表来定义字典。请看下面的代码：正如你所看到的，我们只使用了一个字典。给不好的词一个负的权重，好的词一个正的权重。确保值在-1.0和+1.0之间。...稍后，我们使用word_weights字典检查其中是否存在单词，并计算分配给单词的值。这与我们在前面的代码中所做的非常相似。...在新页面中，选择API Keys选项卡，并单击Create my access token按钮。将生成一对新的访问令牌，即Access令牌密钥。。将这些值与API密钥和API密钥一起复制。

4K4 0

前端学数据结构与算法（八）：单词前缀匹配神器-Trie树的实现及其应用

所以当输入关键词ba后，只需要遍历后面的节点就可以将bag、banana、ball单词呈现给用户。...720 - 词典中最长的单词 ↓ 给出一个字符串数组words组成的一本英语词典。从中找出最长的一个单词，该单词是由words词典中其他单词逐步添加一个字母组成。...对于方法 insert，你将得到一对（字符串，整数）的键值对。字符串表示键，整数表示值。如果键已经存在，那么原来的键值对将被替代成新的键值对。...对于方法 sum，你将得到一个表示前缀的字符串，你需要返回所有以该前缀开头的键的值的总和。...例如，词根an，跟随着单词 other(其他)，可以形成新的单词 another(另一个)。现在，给定一个由许多词根组成的词典和一个句子。你需要将句子中的所有继承词用词根替换掉。

8501 1

图解Transformer — Attention Is All You Need

您可能会想到与查询，键和值有关的问题，以及这些向量实际上是什么，以及为什么要初始化它们。到本文章结尾，您将获得所有答案。...我们获得了序列中每个单词的查询，键和值，现在我们将使用查询，键和值来计算每个单词与句子中的每个其他单词有多少关联的分数。...z1 = 0.86*v1 + 012*v2 + 0.06*v3 对单个单词的这种自我关注已从句子中所有单词中获取了所有相关信息。...Z矩阵形状=(句子长度，V的维数) 多头注意力上面，我们讨论了单头注意，即，仅对一个权重矩阵（Wq，Wk和Wv）进行随机初始化，以生成用于查询，键和值的单个矩阵，而在转换器模型中，则使用多头注意即，...现在，对于多个查询，键和值矩阵，上面相同的操作将重复多次以产生多个最终Z矩阵。在变压器模型中，使用8多头注意。 ?

8683 0

BERT大火却不懂Transformer？读这一篇就够了

在本文中，我们将试图把模型简化一点，并逐一介绍里面的核心概念，希望让普通读者也能轻易理解。...也就是说对于每个单词，我们创造一个查询向量、一个键向量和一个值向量。这三个向量是通过词嵌入与三个权重矩阵后相乘创建的。可以发现这些新向量在维度上比词嵌入向量更低。...第五步是将每个值向量乘以softmax分数(这是为了准备之后将它们求和)。这里的直觉是希望关注语义上相关的单词，并弱化不相关的单词(例如，让它们乘以0.001这样的小数)。...第六步是对加权值向量求和（译注：自注意力的另一种解释就是在编码某个单词时，就是将所有单词的表示（值向量）进行加权求和，而权重是通过该词的表示（键向量）与被编码词表示（查询向量）的点积并通过softmax...这些向量遵循模型学习到的特定模式，这有助于确定每个单词的位置，或序列中不同单词之间的距离。这里的直觉是，将位置向量添加到词嵌入中使得它们在接下来的运算中，能够更好地表达的词与词之间的距离。

9682 0

小白看得懂的 Transformer (图解)

在本文中，我们将试图把模型简化一点，并逐一介绍里面的核心概念，希望让普通读者也能轻易理解。...也就是说对于每个单词，我们创造一个查询向量、一个键向量和一个值向量。这三个向量是通过词嵌入与三个权重矩阵后相乘创建的。可以发现这些新向量在维度上比词嵌入向量更低。...第三步和第四步是将分数除以8(8是论文中使用的键向量的维数64的平方根，这会让梯度更稳定。这里也可以使用其它值，8只是默认值)，然后通过softmax传递结果。...第六步是对加权值向量求和（译注：自注意力的另一种解释就是在编码某个单词时，就是将所有单词的表示（值向量）进行加权求和，而权重是通过该词的表示（键向量）与被编码词表示（查询向量）的点积并通过softmax...这些向量遵循模型学习到的特定模式，这有助于确定每个单词的位置，或序列中不同单词之间的距离。这里的直觉是，将位置向量添加到词嵌入中使得它们在接下来的运算中，能够更好地表达的词与词之间的距离。

6662 0

独家 | Transformer的可视化理解——深入本质探索其优良表现的原因（附链接）

可以这样思考这个输出分数：对于每个单词，它是来自“Value”矩阵的每个单词的编码值，由“factor”矩阵加权。因子（factor）矩阵是该特定单词的Query值与所有单词的Key值的点积。 ?...点积代表了单词之间的相似性我们已经看到，注意力得分通过计算点积然后将它们相加来捕捉特定单词和句子中每个其他单词之间的交互行为。但是矩阵乘法是如何帮助Transformer确定两个词之间的相关性呢？...Transformer以这样一种方式学习嵌入向量等，使彼此相关的单词更加对齐或一致。这是引入三个线性层并构造三个版本的输入序列（查询（Query）、键（Key）和值（Value））的原因之一。...解码器自我注意里机制（图源自作者） Transformer中的编码-解码注意力机制在编码-解码注意力机制中，查询（Query）从目标句中获取，键（Key）和价值（Value）从源句中获取。...因此，它计算目标句子中的每个单词与源句子中的每个单词的相关性。 ? 编码器-解码器注意力机制（图源自作者）结论希望本文能让你对Transformer设计的优美之处有一个很好的认识。

2.6K3 0

实现JavaScript语言解释器（一）

划分和理解完句子的结构后，我们自然也明白了这个句子的意思，那就是：将铅笔放在这张桌子上面。计算机如何理解代码知道了我们是如何理解一个英语句子后，我们再来思考一下如何让计算机来理解我们的代码。...状态机三要素定义完成后，我们就可以使用上面的状态机来对a+='Simple'这个字符串就行词法分析了：刚开始的时候状态机会处于initial状态，接着状态机会逐个接收代码的每个字符并完成对应的状态扭转和单词输出...另外一个类是TokenBuffer类，所有被状态机识别出的单词都会被存储到这个类的实例中，因此它需要提供一些方法对单词进行读写（read/write）操作，这个类会在Tokenizer类介绍完后介绍。...时每次读取单词都只是移动光标，而没有真正将该单词从数组里面取出来，这样做的好处就是方便语法分析阶段在某个语法规则不匹配的时候回退之前读到的单词，从而使用另外一个语法规则来匹配。...在下一篇文章中我将会为大家详细介绍语法分析的一些基本知识，以及普及一些领域特定语言（DSL）的基本概念，最后再详细介绍一下我是如何使用灵活的DSL来实现Simple语言的语法分析的。

1.3K3 0

BERT中的词向量指南，非常的全面，非常的干货

在本教程中，我们将使用BERT从文本数据中提取特征，即单词和句子的嵌入向量。我们可以用这些词和句子的嵌入向量做什么？首先，这些嵌入对于关键字/搜索扩展、语义搜索和信息检索非常有用。...这个模型使用贪心法创建了一个固定大小的词汇表，其中包含单个字符、子单词和最适合我们的语言数据的单词。...如果没有，则尝试将单词分解为词汇表中包含的尽可能大的子单词，最后将单词分解为单个字符。注意，由于这个原因，我们总是可以将一个单词表示为至少是它的单个字符的集合。...因此，不是将词汇表中的单词分配给诸如“OOV”或“UNK”之类的全集令牌，而是将词汇表中没有的单词分解为子单词和字符令牌，然后我们可以为它们生成嵌入。...', 1012) ('[SEP]', 102) Segment ID BERT接受了句子对的训练，并期望使用1和0来区分这两个句子。

2K1 1

小白看得懂的 Transformer (图解)

在本文中，我们将试图把模型简化一点，并逐一介绍里面的核心概念，希望让普通读者也能轻易理解。...也就是说对于每个单词，我们创造一个查询向量、一个键向量和一个值向量。这三个向量是通过词嵌入与三个权重矩阵后相乘创建的。可以发现这些新向量在维度上比词嵌入向量更低。...第五步是将每个值向量乘以softmax分数(这是为了准备之后将它们求和)。这里的直觉是希望关注语义上相关的单词，并弱化不相关的单词(例如，让它们乘以0.001这样的小数)。...第六步是对加权值向量求和（译注：自注意力的另一种解释就是在编码某个单词时，就是将所有单词的表示（值向量）进行加权求和，而权重是通过该词的表示（键向量）与被编码词表示（查询向量）的点积并通过softmax...这些向量遵循模型学习到的特定模式，这有助于确定每个单词的位置，或序列中不同单词之间的距离。这里的直觉是，将位置向量添加到词嵌入中使得它们在接下来的运算中，能够更好地表达的词与词之间的距离。

4791 0

C++中map和set的使用

它是按照键（key）进行排序和存储的，键必须是唯一的，而值（value）可以重复。map通常使用红黑树实现，所以它的查找、插入和删除操作的时间复杂度都是O(log n)。那么何为键值对？...键值对是一种常用的数据存储结构，由“键”和“值”两部分组成。其中，“键”是唯一的，用于标识数据，而“值”则是与键相关联的数据。...2 [ ]的作用在 C++ 中，map 中的 [] 运算符可以用于访问和修改 map 中的元素，其作用如下：若键值存在，返回对应的值；若键值不存在，会与这个不存在的key和默认值构成一个键值对...（2）关于map的使用题目描述：输入一个英文句子，把句子中的单词(不区分大小写)按出现次数按从多到少把单词和次数在屏幕上输出来，次数一样的按照单词小写的字典序排序输出，要求能识别英文单词和句号。...由于不区分大小写，可以先将字符串中所有的字母转化为小写。将字符串按照空格划分，划分为一个个单词word。将单词存入map，没出现一次单词，该单词的次数就+1；最后按迭代器跑一遍即可。

2211 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭