Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >我发起的第一个 Python 小项目,欢迎参与!

我发起的第一个 Python 小项目,欢迎参与!

作者头像
double
发布于 2021-05-07 02:13:41
发布于 2021-05-07 02:13:41
39500
代码可运行
举报
文章被收录于专栏:算法channel算法channel
运行总次数:0
代码可运行

你好,我是zhenguo

把所学知识应用于实际问题,才能真正加深对它的认识和理解,这就是实践出真知。从此最基本点出发,我设计了一个小项目,蛮有意思,也有一定实际应用价值。

此小项目我会同步在github库 python-small-examples中,目前近6100个star,欢迎提交pull request,有机会成为此库的第13位贡献者。

https://github.com/jackzhenguo/python-small-examples

进行中Python小项目

上下文关键字(KWIC, Key Word In Context)是最常见的多行协调显示格式。

此小项目描述:输入一系列句子,给定一个给定单词,每个句子中至少会出现一次给定单词。目标输出,给定单词按照KWIC显示,KWIC显示的基本要求:待查询单词居中,前面pre序列右对齐,后面post序列左对齐,待查询单词前和后长度相等,若输入句子无法满足要求,用空格填充。

输入参数:输入句子sentences, 待查询单词selword, 滑动窗口长度window_len

举例,输入如下六个句子,给定单词secure,输出如下字符串:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
               pre keyword    post 

     welfare , and secure  the blessings of
     nations , and secured immortal glory with 
       , and shall secure  to you the 
    cherished . To secure  us against these 
     defense as to secure  our cities and 
          I can to secure  economy and fidelity 

请补充实现下面函数:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
def kwic(sentences: List[str], selword: str, window_len: int) -> str:
    """
    :type: sentences: input sentences
    :type: selword: selected word
    :type: window_len: window length
    """

更多KWIC显示参考如下:

http://dep.chs.nihon-u.ac.jp/english_lang/tukamoto/kwic_e.html

欢迎提交和互评解决方案

这个小项目今天正式启动,欢迎各位粉丝踊跃参加,fork我的python-small-examples库,提交一个解,然后pull request,我会及时回复,有机会成为此库的贡献者。

参与讨论,可以在这里留言:https://github.com/jackzhenguo/python-small-examples/issues

也欢迎在我的知识星球里讨论此小项目的解决方案,我也会同步并在星球里回复大家。

此项目的至少一个解决方案,会在两周内公众号里发布。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-04-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 程序员郭震zhenguo 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
我的第一个 Python 小项目,开放完整代码
这是4月29日,我发布的第一个Python小项目,文本句子基于关键词的KWIC显示,没看到粉丝朋友可以看看下面介绍,知道的,直接跳到文章的求解分析和代码部分。
double
2021/06/01
6250
我的第一个 Python 小项目,开放完整代码
新手如何发布第一个Python项目开源包?这里有一份详细指南
作者以 SciTime 项目(一个对算法训练时间进行估计的包)的发布为例,详细解释了发布的每个步骤。
机器之心
2019/06/14
8380
新手如何发布第一个Python项目开源包?这里有一份详细指南
我的第五个项目:实现一个文本定位器
查找某目录下所有文件,包含指定查找串的文件。注意,这里不仅仅匹配文件名,而是搜索文件的内容。
double
2022/01/26
3310
循环神经网络教程第二部分-用python,numpy,theano实现一个RNN
作者:徐志强 链接:https://zhuanlan.zhihu.com/p/22289383 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 在本部分,我们将会从头开始用python实现一个完整的循环神经网络,然后hui用Theano(一个可以在GPU上进行运算的库)对实现进行优化。我会跳过一些对理解循环神经网络不是很重要的代码片段,但完整的代码可以在这里找到。
bear_fish
2018/09/19
7250
循环神经网络教程第二部分-用python,numpy,theano实现一个RNN
Python 自然语言处理实用指南:第一、二部分
在本节中,您将在自然语言处理(NLP)的背景下了解 PyTorch 1.x 的基本概念。 您还将学习如何在计算机上安装 PyTorch 1.x,以及如何使用 CUDA 加快处理速度。
ApacheCN_飞龙
2023/04/27
1.4K0
这42个Python小例子,太走心~
除了简单地判断是否匹配之外,正则表达式还有提取子串的强大功能。用()表示的就是要提取的分组(group)。比如:^(\d{3})-(\d{3,8})$分别定义了两个组,可以直接从匹配的字符串中提取出区号和本地号码
double
2019/12/05
9980
建议收藏,22个Python迷你项目(附源码)
目标:创建一个命令行游戏,游戏者可以在石头、剪刀和布之间进行选择,与计算机PK。如果游戏者赢了,得分就会添加,直到结束游戏时,最终的分数会展示给游戏者。
小F
2021/03/01
9830
如何微调GPT-2生成高质量的歌词
生成预训Transformer2 (GPT-2),顾名思义,是基于Transformer 的。它使用注意力机制,这意味着它学会关注与上下文最相关的前一个单词,以便预测下一个单词。
deephub
2021/05/18
1.2K0
【敬初学者】Python基础学完了,该怎么知道自己学的怎么样呢?十个经典实战小项目附源码
初学者要想成功,一句话,大量的实操,大量的练,乍一看我的这个答案似乎有点敷衍,但是这确实是我接触Python以来,总结出的最有价值的经验,接下来分享我自己初学时用来练手的经典实战小项目,适合初学者敲的代码。
全栈程序员站长
2022/08/31
4490
【敬初学者】Python基础学完了,该怎么知道自己学的怎么样呢?十个经典实战小项目附源码
无需训练 RNN 或生成模型,快速编写一个 AI “讲故事”项目
这段日子里,我们都被隔离了,就特别想听故事。然而,我们并非对所有故事都感兴趣,有些人喜欢浪漫的故事,他们肯定不喜欢悬疑小说,而喜欢推理小说的人肯定对浪漫的爱情故事没兴趣。看看周围,还有谁比AI更擅长讲我们喜欢的故事呢?
用户1737318
2020/05/19
1.3K0
无需训练 RNN 或生成模型,快速编写一个 AI “讲故事”项目
Doc2vec预测IMDB评论情感
本文内容源自于国外2015年的一篇博客,中文翻译可以在伯乐在线看到。可以整体了解一些word2vec和doc2vec的使用方法,但是由于时间过去很久了,gensim的api也发生了变化,因此特意重新在源代码基础上做了修改,也回顾一下word2vec和doc2vec的使用 环境要求 python2.7或python3+ gensim numpy matplotlib 情感分析基本原理 情感分析(Sentiment analysis)是自然语言处理(NLP)方法中常见的应用,尤其是以提炼文本情绪内容为目的的分类
听城
2018/04/27
3.2K1
Doc2vec预测IMDB评论情感
Python 自然语言处理实用指南:第三部分
在本节中,我们将使用 PyTorch 中可用的各种自然语言处理(NLP)技术来构建各种实际 -使用 PyTorch 的世界应用。 情感分析,文本摘要,文本分类以及使用 PyTorch 构建聊天机器人应用是本节将介绍的一些任务。
ApacheCN_飞龙
2023/04/27
1.8K0
使用PyTorch建立你的第一个文本分类模型
我总是使用最先进的架构来在一些比赛提交模型结果。得益于PyTorch、Keras和TensorFlow等深度学习框架,实现最先进的体系结构变得非常容易。这些框架提供了一种简单的方法来实现复杂的模型体系结构和算法,而只需要很少的概念知识和代码技能。简而言之,它们是数据科学社区的一座金矿!
磐创AI
2020/03/04
2.2K0
Transformers 4.37 中文文档(一)
下表表示库中对这些模型的当前支持,它们是否有 Python 分词器(称为“slow”)。由🤗 Tokenizers 库支持的“fast”分词器,它们是否在 Jax(通过 Flax)、PyTorch 和/或 TensorFlow 中有支持。
ApacheCN_飞龙
2024/06/26
1.2K0
Transformers 4.37 中文文档(一)
教程 | 在Python和TensorFlow上构建Word2Vec词嵌入模型
选自adventuresinmachinelearning 机器之心编译 参与:李诗萌、刘晓坤 本文详细介绍了 word2vector 模型的模型架构,以及 TensorFlow 的实现过程,包括数据
机器之心
2018/05/09
1.8K0
教程 | 在Python和TensorFlow上构建Word2Vec词嵌入模型
一键式文本纠错工具,整合了BERT、ERNIE等多种模型,让您立即享受纠错的便利和效果
pycorrector: 中文文本纠错工具。支持中文音似、形似、语法错误纠正,python3开发。实现了Kenlm、ConvSeq2Seq、BERT、MacBERT、ELECTRA、ERNIE、Transformer等多种模型的文本纠错,并在SigHAN数据集评估各模型的效果。
汀丶人工智能
2023/08/13
4.7K0
一键式文本纠错工具,整合了BERT、ERNIE等多种模型,让您立即享受纠错的便利和效果
适用于NLP自然语言处理的Python:使用Facebook FastText库
在本文中,我们将研究FastText,它是用于单词嵌入和文本分类的另一个极其有用的模块。
拓端
2020/09/25
9870
用Python从头开始构建一个简单的聊天机器人(使用NLTK)
我相信你一定听说过Duolingo:一款流行的语言学习应用。它以其创新的外语教学风格而广受欢迎,其概念很简单:一天五到十分钟的互动训练就足以学习一门语言。
liuxuewen
2018/10/12
3.9K0
用Python从头开始构建一个简单的聊天机器人(使用NLTK)
实用的AI:使用OpenAI GPT2,Sentence BERT和Berkley选区解析器从任何内容自动生成对或错问题
在本文中,将介绍如何使用最新的AI算法自动生成“对或错”问题,例如您在学校教科书中看到的问题。
代码医生工作室
2020/04/02
9430
RNN示例项目:详解使用RNN撰写专利摘要
我第一次尝试研究RNN时,我试图先学习LSTM和GRU之类的理论。在看了几天线性代数方程之后(头疼的要死),我在Python深度学习中发生了以下这段话:
AiTechYun
2018/12/12
1.8K0
RNN示例项目:详解使用RNN撰写专利摘要
推荐阅读
相关推荐
我的第一个 Python 小项目,开放完整代码
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验