linux常用的单词_linux常用单词_css常用单词 - 腾讯云开发者社区

、

我有一个简单的问题，但不幸的是，我不知道从哪里开始(我刚刚开始)。所以，我想做的是最终增加我的词汇量。我的想法是从新闻文章中去掉最常用的词。我找到了5,000个最常用单词的列表，并保存了下来。在我把最常用的单词去掉后，我可以在TextSTAT中创建一个语料库，并做一个单词频率计数，并选择我想要那样学习的单词。但是如何将我最常用的单词列表中的单词从我要保存的文章中删除呢？

浏览 0提问于2013-11-08得票数 3

1回答

单词对计数对应在段落边界中

在单词对计数中需要帮助，对应该在段落边界中。例如，前一个单词不应该是文本文件中段落的最后一个单词，下一个单词不应该是单词计数对中新段落的第一个单词。您能告诉我如何使用Java在Hadoop(框架工作)中实现吗

浏览 1提问于2015-01-10得票数 0

1回答

我试图通过更新管理器更新我的机器，发现了一些错误。首先，在我谈到这个问题之前，我觉得我应该提到我的操作系统(10.04)是安装在使用Unetbootin启动的便携式硬盘上的。(我带着它在校园里“借用”大学的硬件，它比笔记本电脑轻得多。) 当我通过更新管理器更新时，我得到以下内容： dpkg: error processing linux-headers-generic (--configure): dependency problems - leaving unconfigured Errors were encountered while processing: linux-image

浏览 0提问于2012-04-11得票数 0

1回答

如何将单词归类到其对应的类别？

、、、、

我必须为一长串单词实现文本分类。我已经定义了一些类别，例如，如果单词"UK“在列表中，它将属于"Regions”。如果单词是"Pizza"，它将被归入“食物”类别。我如何将这些词归入不同的类别？有没有开源工具可以做到这一点？

浏览 0提问于2011-01-31得票数 4

回答已采纳

1回答

Java -文本简化器API

、、

我实际上是在Java中开发一个文本简化API，它将得到google列表中的1000个单词，并将其保存在地图中。用户将输入一个单词，如果它与地图中的单词列表相匹配，那么它将用同义词交换它。但我对同义词部分感到困惑。如何获得同义词？我需要调用任何外部API吗？还是谷歌的词汇列表中也有同义词？我已经通过谷歌，它只是暗示，同义词可以建立通过WORDAPI，但我不想使用它。我还能做什么？

浏览 1提问于2019-12-07得票数 1

回答已采纳

1回答

统计推理: tf.keras.preprocessing.sequence skipgrams如何以及为什么以这种方式使用sampling_table？

、、、、

sampling_table parameter仅在tf.keras.preprocessing.sequence.skipgrams方法中使用一次，以测试目标单词在sampling_table中的概率是否小于从0到1 (random.random())的某个随机数。如果你有一个很大的词汇量，并且一个句子使用了很多不常用的单词，这不是会导致该方法在创建skipgrams时跳过很多不常用的单词吗？给定一个像zipf分布一样呈对数线性的sampling_table的值，这不意味着您可以完全不跳过gram吗？对此感到非常困惑。我正在尝试复制Word2Vec tutorial的手，我不明白sam

浏览 32提问于2021-04-24得票数 0

回答已采纳

3回答

在Python中从os生成一个随机字

我正在用Python创建一个绞刑者游戏，我希望能够生成一个随机单词。我总是可以列一个清单，但如果可能的话，我不想手工写下所有的单词。Python中有没有一个函数可以读取内置的MacOS字典？谢谢!

浏览 40提问于2020-06-29得票数 1

回答已采纳

1回答

中文文本的TF-IDF算法

、、

我正在对中文文本进行TF-IDF，并搜索文本中最常用的10个单词。当我得到前10个单词时，我会得到一些无意义的单词，比如“成为”，“表示”和其他。有没有办法只获取有意义的单词？我用“解吧”把汉语句子切成单词。

浏览 2提问于2020-07-23得票数 1

4回答

命令在第一次匹配之前插入行

、、

我有以下信息的文件 testing testing testing 我希望在使用sed或任何linux命令的第一个测试词之前插入一个单词(已测试)。需要得到类似的输出 tested testing testing testing 谢谢

浏览 3提问于2015-05-22得票数 11

回答已采纳

2回答

用重复词计数Regex模式

、

我试图编写一个python函数来计算字符串中的特定单词。当我想要计数的单词连续重复多次时，我的regex模式就无法工作。这一模式似乎运行良好，否则。这是我的功能 import re def word_count(word, text): return len(re.findall('(^|\s|\b)'+re.escape(word)+'(\,|\s|\b|\.|$)', text, re.IGNORECASE)) 当我用随机字符串测试它时 >>> word_count('Linux', "Linux, W

浏览 4提问于2020-03-20得票数 1

回答已采纳

1回答

使用awk，sed，grep在新行上打印一个单词以上的宪章

、、、

我有一个文本文件，我想打印每一个字(多个字符)在新的行。如果一个单词由单个字符组成，则必须将其作为以下单词的一部分处理，并将其打印在新行上。如果它在两个单词之间，它必须跟随第二个单词。示例： Unix & Linux Stack Exchange is a question and answer site for users of Linux, 输出 Unix & Linux Stack Exchange is a question and answer site for users of Linux

浏览 0提问于2018-09-29得票数 -1

回答已采纳

2回答

降低词嵌入的维数

、、

我训练了300个维度的单词嵌入。现在，我想要50个维度的单词嵌入:是最好用50个维度来重新训练嵌入词，还是可以使用一些降维方法来将300个维度的单词嵌入到50个维度呢？

浏览 0提问于2015-07-28得票数 10

1回答

在Android中从Sqlite数据库加载大量数据

、、、

我正在编写一个Android应用程序，它有不同的部分，包括一本字典。为了实现字典，我使用了以下技术：读取Sqlite数据库中的所有单词并将它们存储在数组列表中。(“从vocabulary").Searching中选择*用于定义，使用数组列表上的简单二进制搜索. 从数据库中提取单词(大约50000字)花费的时间太长，有时会出现“内存不足”异常。然而，在加载数据之后，就可以非常迅速地找到单词的定义。请你指导我如何执行这本字典好吗？

浏览 0提问于2011-12-13得票数 1

3回答

如何从我的日志文件中解析时间戳？

、、、

我在Linux中有一个日志文件，其中包含以下类型的信息： 20200910:16:59:38 gpbackup:gpadmin:mdw:024273-[INFO]:-Starting backup of database mydb 20200910:16:59:38 gpbackup:gpadmin:mdw:024273-[INFO]:-Backup Timestamp = 20200910165938 我需要获取时间戳值(20200910165938)。我只需要单词Timestamp之后的任何东西，等号和空格。在日志文件中，此行只出现一次。我如何才能做到这一点？

浏览 0提问于2020-09-11得票数 0

1回答

Ubuntu软件中心的缩写

Ubuntu软件中心使用了很多我不知道的缩写和单词，因为我不是程序员。当我看关于一个名字有趣的程序的信息时，我一个字也不懂。在我能找到这些东西的地方有字典或辞典吗？

浏览 0提问于2014-05-20得票数 1

2回答

在文件中搜索字符串

我正在学习Python语言，目前正在尝试创建一个脚本来搜索用户输入给定的字符串的1000个最常见的单词(根据给定的)。到目前为止，我已经能够通过raw_input搜索该列表(另存为.txt)，并确定用户输入是否在文件中。然而，我似乎想不出如何搜索文本并简单地回复"Word is in 1000 words“或"Word is NOT in the list”。我只能为每一行回复"word is not in list“。我基本上是在尝试创建一个脚本，它将比较用户的输入，并查看输入中的所有单词是否都在1000个最常见的单词中(显然是由 XKCD漫画提示的)。最后，我想

浏览 0提问于2014-09-02得票数 0

1回答

用不寻常的词作为描述性变量名可以接受吗？

、

我正在用Python2.7实现一个有限状态机，我正在考虑使用一个我在代码中不常见的英文单词：“刺激性”。我有一个转换函数，它接受某种类型的输入和当前状态来决定要转换到哪个状态： def transition(self, stimulus): # each state class has a decode_next_state() method to decide # what state to transition to based on the input next_state = self.current_state.decode_next_state(stimu

浏览 0提问于2016-10-26得票数 1

回答已采纳

1回答

Ubuntu 16.04中的多目标模式生成文件错误

、

我正在尝试为基于arm的i.mx6板构建linux内核。下面是构建linux内核的步骤 1.export ARCH=arm 2.export CROSS_COMPILE=/media/cascademic-101/D:/alam/MyProjects/IIOT-Gateway/porting/gcc-linaro-arm-linux-gnueabihf-4.9-2014.09_linux/bin/arm-linux-gnueabihf- 3.make 但是我得到了以下错误。 Makefile:129: *** multiple target patterns. Stop. 有办法解决这个问题

浏览 0提问于2020-08-12得票数 0

回答已采纳

1回答

如何使用Weka创建一包单词？

、

我有一个文档语料库，我想将每个文档表示为一个向量。基本上，对于文档中出现的单词，向量将为1，对于其他单词(存在于语料库中的其他文档中，而不是在此特定文档中)，向量将具有0。如何为Weka中的所有文档创建此向量？有没有一种使用Weka的快捷方法？我还希望Weka在创建这个向量之前删除停用词，如果可能的话，进行一些预处理。谢谢Abhishek S

浏览 0提问于2011-10-10得票数 5

回答已采纳

2回答

具有多个排序准则的C#排序字典

、、

我有一个单词频率的字典，需要首先按频率排序，然后按字母顺序(如果多个单词具有相同的单词计数，它们将按字母顺序排序，而不是2个单独的排序)字典将单词作为关键字，频率作为值。我怎么才能做到这一点呢？提前感谢

浏览 1提问于2017-11-27得票数 0

2回答

为什么不能搜索以UTF-16编码的文本文件内容？

、、

我理解，例如，鲶鱼和侏儒搜索-使用都可以搜索文件内容，其中的UTF-8编码。要想在文本文件中搜索单词或数字，首先必须将它们通过iconv转换成UTF-8。如果文件是已知的，像gedit或mousepad这样的文本编辑器对UTF-16没有任何问题。为什么没有任何可以处理UTF-16编码的txt文件的Linux发行版的搜索工具(GUI或命令行)？我在修邦图。

浏览 0提问于2017-05-09得票数 3

回答已采纳

1回答

weka中的svm文件格式

、、

我想在weka中使用svm (smo)对文本进行分类。我所拥有的文件，包含了一些句子(波斯语)和每个句子前面的一个单词，显示了它的类。问题是:我应该将这些句子改为二进制向量，并将这些向量作为输入给weka，还是仅仅通过在weka本身中选择“字符串到单词向量”将句子转换为向量就足够了？样本文件：

浏览 3提问于2016-12-26得票数 0

回答已采纳

3回答

如何替换sql列中的常见词

、、

我有一个在句子中使用的常用词的表格(例如，A，the，and，where等) 我想做的是循环遍历所有这些单词，并将它们从人们输入的描述中剥离出来，以尝试生成常见的关键字或标签。但我不能使用replace，因为replace将删除所有常见单词的实例，而不管它是否只是组成一个较大单词的几个字母。例如：我想替换描述中的A。很明显，很多单词都包含字母a，所以所有的字母a都会从单词中去掉。我不想这样。我只想在A是一个完整的单词时使用它。我可以使用正则表达式来解决这个问题，但我想知道在SQL中是否有任何方法可以做到这一点，而不必求助于CLR proc。也许我遗漏了一些东西，但我似乎找不到一种简单的方法

浏览 0提问于2010-10-22得票数 2

回答已采纳

1回答

词的自动否定

、、

考虑以下语句 We are not talking about a well established company in the NASDAQ I will not initiate any trades until those clowns hammer out a deal 我正在写一个简单的朴素贝叶斯分类器，基本上是手工标记一个训练集的陈述(无论是积极的还是消极的情绪)，并相应地存储组成陈述的单词。问题:如果我将这两个语句都标记为具有负面情绪，则“很好”、“已建立”(语句1)和“任何”、“直到”(语句2)将被间接标记为负面。而在另一种情况下(即“该公司表现良好”)，相同的单词(在这种

浏览 2提问于2012-02-12得票数 2

回答已采纳

1回答

Postgres全文搜索单词，而不是词汇

、

我有一个列的文本，我想搜索的词，而不是词。更重要的是，我希望用单词索引，而不是词汇索引。我们有大量的代码引用的错误转储，这与任何自然语言字典都不兼容。在Postgres中，是否有一种方法可以让FTS通过单词边界来解析，而不将单词解析为词汇呢？如果我必须定义一个边界字符的列表和一个跳过单词的目录，那就没问题了。这是否需要制作某种自定义字典，还是已经有类似的东西可供使用？我一直认为我错过了一些显而易见的东西，但却找不到。一分钟内，trigram索引是可以的，但我确实更喜欢文本的唯一关键字解析器。 RDS上的Postgres 11.4。

浏览 0提问于2019-10-15得票数 4

回答已采纳

1回答

设计一个迷你搜索引擎和数据结构

、、

我设计了一个迷你搜索引擎，里面有一堆文件。我所做的是，我爬行这些文件，我形成了一个哈希表，关键字是单词的哈希值，表条目是一个二叉树，其中包含具有相同哈希的所有单词以及与该单词相关的一些其他信息。我知道这个数据结构存在于内存中。我正在考虑扩展这个问题。如果我被提供了大量的条目，内存将无法容纳如此大量的数据，因此我将不得不将其永久存储在硬盘驱动器上。然而，据我所知，数据是以块的形式存储在硬盘中的，作为一个程序员，我无法控制数据是如何存储在磁盘上的。那么，如何强制将数据存储在磁盘上，就像它们在内存中存储的方式一样。简而言之，我知道数据结构对于以有效的方式处理数据很重要(如果使用了正确的数据结构)

浏览 2提问于2012-08-03得票数 1

1回答

Kali Linux (滚动) backport 4.4安装问题？

、

我试图在我的Kali滚动vm机器上安装backport 4.4.2-1，但是我得到了以下错误。我不知道出了什么问题，但我做的是首先使用以下命令安装linux头->#apt-获取安装linux$(uname -r) -一切都进行得很顺利。但是，当我试图安装时，我得到了以下错误。请帮帮我。是否缺少依赖关系？ make[4]: 'conf' is up to date. boolean symbol HWMON tested for 'm'? test forced to 'n' boolean symbol HWMON tested for &

浏览 0提问于2017-04-17得票数 -3

1回答

“linux-2.6.3x.x/include/asm-generic/”是用来做什么的？

、、

我的操作系统手册上说，如果你想在Linux内核中添加一个系统调用，编辑linux-2.x/include/asm-i386/unistd.h。但是linux内核的源代码结构似乎发生了很大的变化。在linux-2.6.34.1版本的内核源代码树中，我只找到了linux-2.6.34.1/include/asm-generic/unistd.h和linux-2.6.34.1/arch/x86/include/asm/unistd.h。似乎编辑后者更有意义。我的问题是/inlcude/asm-generic是用来做什么的？与asm相关的代码怎么可能是通用的？

浏览 4提问于2010-07-14得票数 5

回答已采纳

2回答

压缩进度应用程序创建的文件

、

有没有办法(用进度代码)压缩/压缩我用进度应用程序创建的文件？更多的单词单词。

浏览 3提问于2012-12-18得票数 0

回答已采纳

4回答

Python模块，可以访问英语词典，包括单词的定义

、、、、

我正在寻找一个python模块，可以帮助我从英语词典中获得一个单词的定义。当然有enchant，它可以帮助我检查这个词是否存在于英语中，但它没有提供它们的定义(至少我在文档中没有看到这样的东西) 还有WordNet，它可以通过NLTK访问。它有定义甚至例句，但WordNet并不包含所有的英语单词。常见的单词如“如何”，“我”，“你”，“应该”，“可以”……不是WordNet的一部分。有没有python模块可以访问完整的英语词典，包括单词的定义？

浏览 58提问于2014-01-28得票数 21

回答已采纳

1回答

使用Sentiwordnet 3.0

、、、、

我计划使用Sentiwordnet 3.0进行情感分类。有人能澄清一下Sentiwordnet中与单词相关的数字代表什么吗？例如，rank#5中的5是什么意思？另外，对于POS，用来表示副词的字母是什么？我假设'a‘是形容词。我在他们的网站或其他网站上都找不到解释。

浏览 5提问于2012-04-19得票数 6

回答已采纳

1回答

如何在Shell脚本(Bash)中搜索单词？

、、

我需要在网页中搜索字符串"Linux“，首先是区分大小写，然后是不区分大小写的sencond。嗯，我的搜索将在我编写了下面的代码，但它并不是返回所有单词"Linux“。 echo Linux: $(grep -wc "Linux" ~/workspace/ep-exercicios/m1/e2/intro-linux.html) 例如，我的代码返回405个单词，但有447个。怎么做的？

浏览 2提问于2016-06-26得票数 1

回答已采纳

1回答

如何使用Trie进行部分自动补全

、、、、

给出一个很大的单词列表(比如一百万个)。使用Trie，我们可以很容易地实现前缀匹配。但是如何实现部分匹配呢？例如，我们有一个单词列表{"abc"，"def"，" lunch "，"diner"....}，我如何在搜索"unc“时获得午餐？在这种情况下，Trie仍然是一个很好的数据结构吗？有哪些可能的方法可以有效地实现它？

浏览 5提问于2019-10-21得票数 2

1回答

从单词列表中获取基于给定单词的单词建议

、

我有一个numpy数组、matrixValue和包含以下内容的3个列表： matrixValue：(类型: ndarray)单词在单词列表中的出现次数按降序排列 [.. 62 62 ..] [.. 23 21 ..] [.. 14 13 ..] valueList：(类型:列表)单词在单词列表中按降序出现的次数 [... 74, 71, 63, 62, 62, 50, 40, 23, 21, 14, 13, 11, 11...] userGivenWord：(类型:列表)用户指定的单词 [... water, animal, flower...] wordList：(type: list)包含

浏览 2提问于2015-03-07得票数 0

2回答

匹配包含特定单词的所有URL的正则表达式

、

我正在寻找一个正则表达式来匹配URL中任何位置包含特定单词的所有URL，例如"linux“。 .*linux.*似乎可以处理子域、域和TLD中包含该单词的URL，但它找不到路径中包含该单词的URL，例如www.blabla.com/blalinuxbla.html

浏览 0提问于2011-12-09得票数 1

1回答

基于iptables的Qemu网络流量过滤

、、、、

我需要过滤Qemu (Linux)上来宾系统的输出和传入流量。主机系统也是Linux。我认为iptables是一个很好的工具，但我不知道如何在这里使用它。为了正确配置网络接口，我应该使用哪些命令行参数来运行Qemu？我该如何使用iptables？iptables是最好的工具吗？我只需要简单的过滤:例如丢弃任何数据包。谢谢!

浏览 0提问于2020-09-29得票数 0

1回答

如何找到最常用的词来描述一个类别

、

我有两列。一个是动物，另一个是它们的描述。我想在Python中找到与每种动物相关的最常见的单词。此外，我还想添加一些单词，包括英语停用词、二元语法和三元语法。也许可以找到排名前20的单词/短语。 dataset = pd.read_sql( q , dlconn ) x=dataset['Animal'] y= dataset[Description] count_vect = CountVectorizer(stop_words = esw, ngram_range=(1, 3))

浏览 11提问于2019-03-06得票数 0

2回答

得到一个词的同义词

是否有API，对于给定的英语单词，我可以得到它的一组同义词？如果不是同义词，那么至少在相似的上下文中使用单词。我的目标是用相似的结构来构造句子。例如，从这一点来看： Jason found 49 seashells and 48 starfish 我想取得以下成果： Joan grew 29 carrots and 14 watermelons

浏览 0提问于2016-04-02得票数 0

回答已采纳

2回答

Express如何测量小于1ms的时间？

、、、、

我刚刚开始研究名为Express的Web框架，我发现当刷新由Express渲染的网页时，linux控制台上会显示如下日志。 <code>A0</code> 我了解到Javascript可以测量的最短时间是1ms(<code>C1</code>)，比如Date()。我认为日志是由Express本身显示的，所以我搜索了每个文件来查找日志中的单词，但没有找到这样的结果。我搜索了"304"，"ms"，"GET“作为关键字，但在我的项目目录中没有找到包括node_modules在内的任何内容。哪个文件、函数或模块

浏览 28提问于2020-03-13得票数 1

回答已采纳

2回答

python列表中不太常用的单词

、、

我已经对最常用的单词进行了计数，只将我列表中的128个最常用的单词按顺序排列： words = my_list mcommon_words = [word for word, word_count in Counter(words).most_common(128)] my_list = [x for x in my_list if x in mcommon_words] my_list = OrderedDict.fromkeys(my_list) my_list = list(my_list.keys()) 但现在我想用同样的方法计算这128个不太常用的单词。更快的解决方案也会对我有很大帮

浏览 1提问于2018-03-02得票数 1

1回答

solr在给定单词之后查找最常用的单词。

我需要在给定的单词之后找到最常用的单词。对于一个示例集合， a.b A C a.b B-C 这里最常用的单词A是B，我怎么能在solr中找到这个呢？

浏览 6提问于2014-07-18得票数 0

回答已采纳

2回答

查看文本中最常见的7个单词，但对常见单词进行分类。

、、、、

真的需要一些帮助来解决这个问题，或者如果有人可以指出我的正确方式，谢谢！查看文本中最常见的7个单词，但对常见单词进行分类。您可以在公共词. You .中找到通用单词列表常见的-Words.txt=许多不同的单词。首先，我在文本中找到了7个最常见的单词，这就是我的代码的样子。 print("The 7 most frequently used words is:") print("\n") import re from collections import Counter with open("alice-

浏览 4提问于2016-10-25得票数 0

回答已采纳

1回答

可以根据内容的大小自动调整画布大小的插图软件？

、、

我目前正在使用Libre绘图来绘制插图，以便导入到我的文档中。然而，画布大小(页面大小)是由用户的配置确定的，而我希望它根据内容的大小灵活地调整它的大小，以便最终导出中的单词大小是一致的。例如，这两种图形中单词的大小是不同的： 📷 📷 就像在最左边，最右边，最上面，最底部的素描中添加一个5px的填充。有程序吗？它应该在Windows上工作。

浏览 0提问于2018-04-28得票数 1

1回答

我应该使用MB或MiB来计算系统的空间吗？

、、、、

我希望在我的计算机上重新安装Linux，并将其双引导到windows。我的问题如下我以前用双引导的方式在我的电脑上安装了Linux，并且总是遵循相同的过程。首先，安装windows并使用磁盘管理器为Linux创建空空间。我精确地计算了我将保留多少个Gibs，例如，8* 1024 = 8192 MiB。但是当我打算安装Linux时，我意识到保留的空间似乎更大了，安装后Windows通知了我不同的值比我想要的要好，应该有8GB的分区--它们有7.8。通过一些研究，我发现这是因为windows使用MiB，而Linux使用MB。我真的应该关心这个问题吗?还是我可以在没有担心的情况下离开那些

浏览 0提问于2023-02-09得票数 2

1回答

使用ruby创建常用单词或短语的列表

、、

寻找一些建议，如何从nosql数据库中的一堆条目中生成常用单词和短语的列表。基本上，我们有一堆由某人发布的帖子，我们想告诉他们“嘿，你好啊。你经常使用这些单词/短语”。我在这一点上有点困惑。我的应用程序是ruby on rails，backbone js和redis。

浏览 0提问于2013-05-28得票数 0

1回答

在一个ML问题中，应该使用多少个单词作为特征？

、、、

我想问你，在一个ML程序中，应该使用多少个单词作为特性。例如，如果我有30000个不同的单词来创造一个词汇表，那么一个好的数字会是什么呢？我目前正在删除句号，一些字符，数字的单词；应用词义化；删除标点符号；分析单词的频率，以保持前50个单词。但是我不知道，如果30000个不同的词，50个会太低。什么是确定保留或选择多少的好方法？

浏览 0提问于2021-02-23得票数 1

1回答

在行中搜索unix单词，如果有，则从该词删除到行尾。

、、

我的文件包含以下几行 File.txt Unix is good Linux and unix is different? Linux is also good, then what about unix? 这里我要输出 (1st line blank) Linix and Linux is also good, then what about 在这里vi命令或任何其他命令都会给出这个输出？搜索特定的单词，如果这是对的话，然后删除那个词，然后删除该行中的所有单词。

浏览 0提问于2019-07-17得票数 0

2回答

用于匹配字符串的数据结构

、

我有一组字符串，如果我从实际数据集传递一些单词作为输入，它必须找到包含特定单词的字符串...为了完成这样的任务，我可以使用哪种数据结构。有谁能帮我找出。

浏览 1提问于2013-04-26得票数 0

1回答

词对齐任务与词典归纳

、

我一直在阅读多语种单词嵌入方法，但无法完全掌握所使用的两种评估方法之间的区别-单词对齐和字典归纳。通过查看的表1，我的好奇心增强了，在单词对齐任务中，双语自动编码器方法的性能优于倒排索引，但对于字典归纳，情况正好相反。谢谢你的帮助！

浏览 3提问于2018-02-12得票数 2

1回答

以大数组数据为输入构造BigQuery

我感兴趣的是通过BigQuery查找trigram数据的能力获得与特定单词的最频繁的单词关联。例如，在使用Google的时，我可以输入great *，这将给我在“伟大”之后最常用的单词，比如“很好的交易”，然后是“很棒的和”和“很多”。我的目标是对一大串单词进行查询，这样我就可以一直使用word1 *查询到word10000 * 在关于这个的讨论之后，我被介绍到BigQuery的可公开获取的trigram数据。在这一点上，我似乎无法理解的是，如何使用这个服务输入一系列单词，或者作为文件输入或粘贴它们的方式。任何帮助都是非常感谢的--谢谢。

浏览 1提问于2015-11-22得票数 1

回答已采纳