首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

linux下自制英语词汇表并查询

1,在此我们要用到一个命令:look look没有find功能强大,但他有一个功能是find所没有的,就是搜索英文单词 我们知道系统自带的单词表是没有中文解释的,如果你安装的是中文操作系统。 我们就可以自制一个英文词汇表 2,我们先要知道words放置的位置,/usr/share/dict,当然不同的版本可能叫 的名字不一样,如我的ubuntu系统叫words,有的rhelt系统叫linux-words. 3,制作一个这样的words词汇表,把系统自带的替换掉 在网上找了很久才找到一个六级词汇表,格式还不理想不得不用colrm命令把文件 格式换成了如下: abbreviation         n.节略,缩写,缩短 abide                vt.遵守 vt.忍受 abolish              vt.废除,取消 absent               a.不在意的 absorption           n.吸收;专注 ... 4,现在我们就可以使用look命令了 tao@ubserver:~$ look chip chip                 n.薄片,碎片 tao@ubserver:~$ look ab abbreviation         n.节略,缩写,缩短 abide                vt.遵守 vt.忍受 abolish              vt.废除,取消 absent               a.不在意的 absorption           n.吸收;专注 abstract             a.理论上的 n.抽象 absurd               a.不合理的,荒唐的 abundance            n.丰富,充裕 当然如果有更好的词汇表就更好了, 这样当我们在看到某些不认识的单词时就可以 用这个简单的小命令了。

01

DOC2VEC:所涉及的参数以及WORD2VEC所涉及的参数

DOC2VEC:所涉及的参数 class gensim.models.doc2vec.Doc2Vec(documents=None, dm_mean=None, dm=1, dbow_words=0, dm_concat=0, dm_tag_count=1, docvecs=None, docvecs_mapfile=None, comment=None, trim_rule=None, **kwargs) Bases: gensim.models.word2vec.Word2Vec Class for training, using and evaluating neural networks described in http://arxiv.org/pdf/1405.4053v2.pdf Initialize the model from an iterable of documents. Each document is a TaggedDocument object that will be used for training. The documents iterable can be simply a list of TaggedDocument elements, but for larger corpora, consider an iterable that streams the documents directly from disk/network. If you don’t supply documents, the model is left uninitialized – use if you plan to initialize it in some other way. dm defines the training algorithm. By default (dm=1), ‘distributed memory’ (PV-DM) is used. Otherwise, distributed bag of words (PV-DBOW) is employed. Dm:训练算法:默认为1,指DM;dm=0,则使用DBOW。 size is the dimensionality of the feature vectors. · size:是指特征向量的维度,默认为100。大的size需要更多的训练数据,但是效果会更好. 推荐值为几十到几百。 window is the maximum distance between the predicted word and context words used for prediction within a document. window:窗口大小,表示当前词与预测词在一个句子中的最大距离是多少。 alpha is the initial learning rate (will linearly drop to min_alpha as training progresses). alpha: 是初始的学习速率,在训练过程中会线性地递减到min_alpha。

02

【Python机器学习】系列之特征提取与处理篇(深度详细附源码)

第1章 机器学习基础 将机器学习定义成一种通过学习经验改善工作效果的程序研究与设计过程。其他章节都以这个定义为基础,后面每一章里介绍的机器学习模型都是按照这个思路解决任务,评估效果。 第2章 线性回归 介绍线性回归模型,一种解释变量和模型参数与连续的响应变量相关的模型。本章介绍成本函数的定义,通过最小二乘法求解模型参数获得最优模型。 第二章案例中的解释变量都是数值,比如匹萨的直径。而很多机器学习问题需要研究的对象可能是分类变量、文字甚至图像。本章介绍提取这些变量特征的方法。这些技术是数据处理的前提—

07
领券