首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

开源日报 0823 | NLP 民工的乐园:中文 NLP 资源库的终极指南

文章中介绍了几个非常有用的开源项目,适用于不同领域的开发者和研究者。其中,NLP 民工的乐园是一个非常全面的中文 NLP 资源库,提供了丰富的语料库、词库、词法工具和预训练语言模型,适用于不同的 NLP 相关任务。Poetry 是一个简化 Python 包和依赖管理的工具,可以帮助开发者管理和安装 Python 项目的依赖,提供了简化的项目格式和多种安装方法。Quartz 是一个工具集,可以帮助用户将数字花园和笔记发布为网站,提供了文档和入门指南。Canadian-Tech-Internships-Summer-2024 是一个加拿大科技公司的实习机会列表,提供了不同公司的位置、申请时间和备注信息。Rivet 是一个管理游戏服务器、匹配和 DDoS 防护的开源项目,提供了易于使用的界面和丰富的功能,适用于游戏开发者。以上项目都有不同的特点和优势,可以帮助开发者提高工作效率和开发质量。

03

一种精确从文本中提取URL的思路及实现

在今年三四月份,我接受了一个需求:从文本中提取URL。这样的需求,可能算是非常小众的需求了。大概只有QQ、飞信、阿里旺旺等之类的即时通讯软件存在这样的需求。在研究这个之前,我测试了这些软件这块功能,发现它们这块的功能还是非常弱的。这类软件往往也是恶意URL传播的媒介,如果不能准确识别出URL,相应的URL安全检测也无从谈起。而且网上也有很多使用正则表达式的方法,可是我看了下,方法简单但是不够精确,对于要求不高的情况可以胜任,但是如果“坏人”想绕过这种提取也是很方便的。(转载请指明出处)下面也是我在公司内部做的一次分享的内容:

02
领券