首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

python 面试题-收集100+面试题笔试题

字母w出现次数 统计单词 my 出现次数 1.9 统计每个字符出现次数 题目:输入一个字符串str, 输出第m个只出现过n次字符,如在字符串 gbgkkdehh , 找出第2个只出现1 次字符...,输出结果:d 1.10 判断字符a含b 判断字符串a=”welcome to my world” 是否包含单词b=”world” 包含返回True,不包含返回 False 1.11 查找字符首次出现位置...输出指定字符串A在字符串B一次出现位置,如果B包含A,则输出-1 从 0 开始计数 A = “hello” B = “hi how are you hello world, hello yoyo...1.12 查找字符串最后一次出现位置 输出指定字符串A在字符串B中最后出现位置,如果B包含A,则输出-1 从 0 开始计数 A = “hello” B = “hi how are you hello...文本每行中长度超过3单词 在以下文本找出 每行中长度超过3单词: Call me Ishmael.

6.5K20

GitHub超1.5万星NLP团队热播教程:使用迁移学习构建顶尖会话AI

GPT和GPT-2是两个非常类似的、基于Transformer语言模型。这些模型称为解码器或因果模型,这意味着它们使用上下文来预测下一个单词。 ?...令牌生成器负责将输入字符串拆分为令牌(单词/子单词),并将这些令牌转换为模型词汇表正确数字索引。 ? 使语言模型适应对话任务 语言模型是通过单一输入来训练单词序列。...在对话设置,模型将必须使用几种类型上下文来生成输出序列: 一或几个角色句子, 对话历史记录,至少包含用户最后一次讲话, 自从逐字生成输出序列开始,已经生成输出序列标记。...添加以上信息一种简单方法是为单词,位置和句段构建三个并行输入序列,并将它们融合为一个序列,对三种类型嵌入进行求和:单词,位置和句段嵌入: ? 实例代码: ?...现在,我们有了模型所需所有输入,并且可以对模型进行正向传递以获取两个损失和总损失(作为加权总和): ?

1.2K20

笔记·正则表达式和re库

1,3}$ a,aa或aaa ^a{2,}$ 包含多于两个a字符串 ^a{2,} :aardvark和aaab,但apple不行 a{2,} :baad和aaa,但Nantucket不行 \t{2...我们可以把模式扩展到更多单词或数字: ^[a-zA-Z0-9_]{1,}$ //所有包含一个以上字母、数字或下划线字符串 ^[0-9]{1,}$ //所有的正数 ^\-{0,1}[0-9]{1...最后,字符”+”与 {1,}是相等,表示”1个或多个前面的内容”,所以上面的4个例子可以写成: ^[a-zA-Z0-9_]+$ //所有包含一个以上字母、数字或下划线字符串 ^[0-9]+$ /...与在任何别的位置一样,普通字符在括号内表示其本身,即,它在输入文本匹配一次其本身。大多数特殊字符在括号表达式内出现时失去它们意义。...匹配对象方法 描述 group(num=0) 匹配整个表达式字符串,group() 可以一次输入多个组号,在这种情况下它将返回一个包含那些组所对应值元组。

97330

sed 命令+正则表达式

/pattern/   查询包含两个模式行,/disk/disks/     /pattern/,x  在给定行号上查询包含模式行,/disk/,3     x,/pattern/  通过行号和模式查询匹配行...如果在行尾匹配单词j e t 0 1,操作如下:j e t 0 1 $    如果只返回包含一个字符行,操作如下:^ . $ 4、使用*匹配字符串单字符或其重复序列    使用此特殊字符匹配任意字符或字符串重复多次表达式...正则表达式可以让用户通过使用一系列特殊字符构建匹配模式,然后把匹配模式与数据文件、程序输入以及WEB页面的表单输入等目标对象进行比较,根据比较对象是否包含匹配模式,执行相应程序。    ...除了我们以上所介绍元字符之外,正则表达式还具有另外一种较为独特专用字符,即定位符。定位符用于规定匹配模式在目标对象出现位置。    ...其中,“^”定位符规定匹配模式必须出现在目标字符串开头,“$”定位符规定匹配模式必须出现在目标对象结尾,\b定位符规定匹配模式必须 出现在目标字符串开头或结尾两个边界之一,而“\B”定位符则规定匹配对象必须位于目标字符串开头和结尾两个边界之内

3.4K20

学校早这么教正则表达式,少走多少弯路!那个分组用法震到我了

引言 grep是Linux中用于文件处理最有用和最强大命令之一。 grep在一个或多个输入文件搜索与正则表达式匹配行,并将每个匹配行写入标准输出。...在本文中,我们将探索如何在grepGNU版本中使用正则表达式基础知识,该版本在大多数Linux操作系统默认可用。 ? grep正则表达式 正则表达式(regex)是与一组字符串匹配模式。...如果搜索字符串包含空格,则需要用单引号或双引号将其引起来: grep "FTP User" /etc/passwd 锚点 锚点是元字符,允许您指定必须在行什么位置找到匹配项。...以下模式将匹配以“co”开头、后跟除“l”和“la”之外任何字母任意字符串组合,“coca”、“cobalt”等,但不匹配包含“cola”行: grep 'co[^l]a' file.txt 你可以在方括号内指定一个字符范围...如果嵌入到较大单词,它将与单词不匹配: grep '\b[ao]bject\b' file.txt 写在最后 正则表达式用于文本编辑器、编程语言和命令行工具,grep、sed和awk。

2.4K30

搜索引擎背后数据结构和算法

那搜索引擎是如何爬取网页呢? 搜索引擎把整个互联网看作 有向图,把每个页面看作一个顶点。如果某个页面包含另外一个页面的链接,就在两个顶点之间连一条有向边。...index.bin:倒排索引文件,记录每个单词编号以及对应包含网页编号列表 term_offsert.bin:记录每个单词编号在倒排索引文件偏移位置。...当用户在搜索框输入某个查询文本时候,先对用户输入文本进行分词处理。假设分词之后,得到k个单词。 拿这k个单词,去term_id.bin对应散列表,查找对应单词编号。...统计得到结果,我们按照出现次数多少,从小到大排序。出现次数越多,说明包含越多用户查询单词(用户输入搜索文本,经过分词之后单词)。 经过一系列查询,就得到了一组排好序网页编号。...总结 以上只是一个搜索引擎设计基本原理,有很多优化、细节并未涉及,计算网页权重 PageRank 算法、计算查询结果排名 tf-idf 模型等等。

1.1K10

【Keras教程】用Encoder-Decoder模型自动撰写文本摘要

引用:我们最基本模型只是简单地使用输入语句字符串嵌入到H尺寸,而忽略原始顺序属性或相邻字词之间关系。 [...]为了解决一些建模问题,我们还考虑在输入语句中使用深度卷积编码器。...Ramesh Nallapati等,在其编码器中使用双向GRU递归神经网络,并在输入序列包含了有关每个单词附加信息。 引用:编码器由一个双向GRU-RNN组成。...引用:这个模型旨在使用两个层面的两个双向RNN来捕获这个两个重要级别的概念,一个在单词级别,另一个在句子级别。注意力机制同时在两个层面上运作。——抽象句摘要神经注意力模型,2015。...这意味着如上所述模型不能直接在Keras实现(但也许可以在更灵活平台TensorFlow实现)。相反,我们可以看看我们可以在Keras实现模型三种变体。...) 概要: 在本教程,您了解了如何在Keras深度学习库实现文本摘要编码器-解码器结构。

3.1K50

图解LeetCode——49. 字母异位词分组

一、题目给你一个字符串数组,请你将 字母异位词 组合在一起。可以按任意顺序返回结果列表。字母异位词 是由重新排列源单词字母得到一个新单词,所有源单词字母通常恰好只用一次。...那么,了解了字母异位词含义了之后,我们再来看这道题解题思路,这里我们主要需要解决两个问题:【问题1】获得同组字母异位词;【问题2】将不同字母异位词组合在一起;关于第一个问题解决办法,我们可以通过对一个字符串所有字符进行排序...,即通过char[] sc = str.toCharArray()和Arrays.sort(sc)获得有序sc,以上面的“eat”为例,所有的6个字母异位词排序后都为“aet”。...我们创建Map数据结构变量,以“aet”作为key,以List存储原始字符串为value,存储到Map结构。这样,当我们遍历完整个strs字符串数组之后,就完成了对每个字符串元素进行分组操作了。...以上就是本题具体解题思路,下面我们还是按照惯例,以输入strs = ["eat", "tea", "tan", "ate", "nat", "bat"]为例,看一下具体操作流程。

33320

教程 | 用数据玩点花样!如何构建skim-gram模型来训练和可视化词向量

在第一次迭代,最接近预测单词看起来非常随机。这很合理,因为所有词向量都是随机初始化。 ? 训练结束时,该模型已经能更好地找到单词之间关系。 ?...子采样 经常出现单词「the」、「of」和「for」,并没有给附近单词提供太多语境。如果丢弃一些,我们就可以消除数据部分噪声,实现更快训练和更好表示。...创建输入和目标 skip-gram 模型输入是每个单词(编码为整数),而目标是围绕该窗口单词。...我们把一个输入「ants」(蚂蚁)表示为独热向量。这个向量有 10000 个分量(每个分量都对应于词汇表一个单词),我们将单词「ants」对应分量设为「1」,所有其他分量都为 0。...网络输出也是一个单向量(也包含 10000 个分量)。 训练结束时,隐藏层将会有经过训练词向量。隐藏层大小相当于向量维数。在上面的例子,每个单词都有一个长度为 300 向量。

1.7K60

这可能是迄今为止最好一篇正则入门教程-上

这几乎是最简单正则表达式了,它可以精确匹配这样字符串:由两个字符组成,前一个字符是h,后一个是i。...不幸是,很多单词包含 hi 这两个连续字符,比如 him,history,high 等等。用 hi 来查找的话,这里边 hi 也会被找出来。....* 连在一起就意味着任意数量包含换行字符。 现在 \bhi\b.*\bLucy\b 意思就很明显了:先是一个单词hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词。...这两个代码在验证输入内容时非常有用,比如一个网站如果要求你填写QQ号必须为5位到12位数字时,可以使用:^\d{5,12}$。...因为使用了^和$,所以输入整个字符串都要用来和\d{5,12}来匹配,也就是说整个输入必须是5到12个数字,因此如果输入QQ号能匹配这个正则表达式的话,那就符合要求了。

92510

搜索引擎背后经典数据结构和算法

完成以上步骤,搜索引擎对网页处理就完了,那么用户输入关键词搜索引擎又是怎么给我们展示出结果呢。 四、查询 用户输入关键词后,首先肯定是要经过分词器处理。...从中可以看出 Trie 树具有以下性质: 根节点不包含字符,除根节点外每一个子节点都包含一个字符 从根节点到某一个节点,路径上经过字符连接起来,为该节点对应字符串 每个节点所有子节点包含字符互不相同...通常在实现时候,会在节点结构设置一个标志,用来标记该结点处是否构成一个单词(关键字)。...: 一般搜索引擎会维护一个词库,假设这个词库由所有搜索次数大于某个阈值( 1000)字符串组成,我们就可以用这个词库构建一颗 Trie 树,这样当用户输入字母时候,就可以以这个字母作为前缀去 Trie...树查找,以上文中提到 Trie 树为例,则我们输入「te」时,由于以「te」为前缀单词有 ["tea","ted","ted","ten"],则在搜索引擎搜索提示框中就可以展示这几个字符串以供用户选择

65910

LeetCode-面试题58-1-翻转单词顺序

# LeetCode-面试题58-1-翻转单词顺序 输入一个英文句子,翻转句子单词顺序,但单词内字符顺序不变。为简单起见,标点符号和普通字母一样处理。...hello" 解释: 输入字符串可以在前面或者后面包含多余空格,但是反转后字符不能包括。...示例3: 输入: "a good example" 输出: "example good a" 解释: 如果两个单词间有多余空格,将反转后单词空格减少到只含一个。...说明: 无空格字符构成一个单词输入字符串可以在前面或者后面包含多余空格,但是反转后字符不能包括。 如果两个单词间有多余空格,将反转后单词空格减少到只含一个。...(Java): 初始化两个指针从数组末尾开始 当遇到字符不是空格时,移动start指针,找到单词开头,然后利用substring方法截取单词 当遇到字符是空格时,继续移动start指针,找到下一个单词末尾

22720

正则表达式

^ 匹配输入字符串开始位置。如果设置了RegExp对象Multiline属性,^也匹配“\n”或“\r”之后位置。 $ 匹配输入字符串结束位置。...可以匹配“do”或“does”“do”。?等价于{0,1}。 {n} n是一个非负整数。匹配确定n次。例如,“o{2}”不能匹配“Bob”“o”,但是能匹配“food”两个o。...匹配所包含任意一个字符。例如,“[abc]”可以匹配“plain”“a”。 [^xyz] 负值字符集合。匹配未包含任意字符。例如,“[^abc]”可以匹配“plain”“p”。...空白行 \n\s*\r 或者 \n\n(editplus) 或者 ^[\s\S ]*\n QQ号码 [1-9]\d{4,} 不包含abc单词 \b((?!...对正则表达式有所了解之后,该如何在我们程序应用?所有环境下都能应用正则表达式吗?

1.5K20

机器学习必须熟悉算法之word2vector

假设语料库单词数量是N,则上图矩阵大小就是N*N,其中每一行就代表一个词向量表示。第一行0 2 1 0 0 0 0 是单词I向量表示。...我们今天学习skip gram算法可以成功克服以上三个缺陷。...这里我们需要停下来细细琢磨下,我们这样取单词对作为训练数据目的何在?...2、数字化表示单词对 上面我们获得了许多单词对作为训练数据,但是神经网络不能直接接收和输出字符串形式单词对,所以需要将单词对转化为数字形式。...这里有一点需要注意,我们说输出是该单词出现在输入单词周围概率大小,这个“周围”包含单词前面,也包含单词后面。

3.5K150

一个正则表达式测试(只可输入中文、字母和数字)

+:匹配前面的子表达式一次或者多次,“xu+”这个表达式就能够匹配“xuu”和“xu”,但不能够匹配“x”,这个就是和“*”区别。   ?:匹配前面的子表达式零次或者一次“xu?”...x|y:匹配x或y,“(xu|jian)guo”匹配“xuguo”或者“jianguo”。   [xyz]:字符集合,匹配所包含任意字符。“[abc]”可以匹配“apple”“a”。   ...\b:匹配一个单词边界,“guo\b”可以匹配“xujianguo”“guo”。   \B:匹配非单词边界,“jian\B”可以匹配“xujianguo”“jian”。   ...Input 属性包含了整个被查找字符串。Index 属性包含了整个被查找字符串中被匹配字符串位置。LastIndex 属性包含了匹配中最后一个字符下一个位置。...Input 属性包含整个被查找字符串。Index 属性包含了在整个被查找字符串匹配字符串位置。LastIndex 属性包含了最后一次匹配中最后一个字符下一个位置。

4.4K20

深度学习必须熟悉算法之word2vector(一)

假设语料库单词数量是N,则上图矩阵大小就是N*N,其中每一行就代表一个词向量表示。第一行 0 2 1 0 0 0 0 是单词I向量表示。...我们今天学习skip gram算法可以成功克服以上三个缺陷。它基本思想是首先将所有词语进行one-hot编码,输入只有一个隐藏层神经网络,定义好loss后进行训练。...这里我们需要停下来细细琢磨下,我们这样取单词对作为训练数据目的何在?...3数字化表示单词对 上面我们获得了许多单词对作为训练数据,但是神经网络不能直接接收和输出字符串形式单词对,所以需要将单词对转化为数字形式。...这里有一点需要注意,我们说输出是该单词出现在输入单词周围概率大小,这个“周围”包含单词前面,也包含单词后面。

54810

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券