首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

GPT2中文新闻标题生成

向AI转型的程序员都关注了这个号 机器学习AI算法工程   公众号:datayx 项目描述 本项目是一个带有超级详细中文注释的基于GPT2模型的新闻标题生成项目。...本项目通过Flask框架搭建了一个Web服务,将新闻摘要生成模型进行工程化,可以通过页面可视化地体验新闻标题生成效果。 本项目的代码详细讲解,可以自行阅读代码,也可查看代码注释介绍。...本项目提供的新闻标题模型是一个6层的小模型(其实是穷人没人卡,只能训练小模型),并且在训练该模型过程中,没有加载预训练的GPT2模型而是随机初始化的参数,并且训练轮数较少(5轮,还没收敛完),因此效果一般...处理后数据集详细信息,见数据集描述 全部 代码  ,预训练模型 获取方式: 关注微信公众号 datayx  然后回复 标题生成  即可获取

1.4K50

【爬虫实践】爬取官方新闻标题、正文、时间

此时,通常使用requests.get的方式即可获取到网页数据。 若两者不一致,网页是动态加载。此时需通过开发者后台查看本地向服务器发送的交互性数据(XHR)。...4、获取文章标题、内容与发布时间 通过上面的分析,已经可以通过post的方式获取各页目录的源代码,再次基础上,需要通过目录的链接,进入到每篇文章的页面进行,标题、正文、时间的提取。...5、寻找规律自动翻页 通过上面的操作,已经可以获取了一次加载的内容,即三页内容(27条新闻),下面将通过寻找规律进行多次加载。...month = t[5:7] day = t[8:10] data = "%s-%s-%s" % (year, month, day) return data # 获取一页中的所有链接...# print(item) link = split_link(item) Linklist.append(link) return Linklist # 获取单篇文章标题

92611
领券