首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

python通用论坛正文提取pytho

背景 参加泰迪杯数据挖掘竞赛,这次真的学习到了不少东西,最后差不多可以完成要求的内容,准确率也还行。...总共的代码,算上中间的过程处理也不超过500行,代码思想也还比较简单,主要是根据论坛的短文本特性和楼层之间内容的相似来完成的。...(通俗点说就是去噪去噪去噪,然后只留下相对有规律的日期,内容) 前期准备 软件和开发环境: Pycharm,Python2.7,Linux系统 用的主要Python包: jieba, requests...经过观察,所有的论坛中日期的形式只有5种(目前只看到5种,当然后期可以加上)。我们可以用正则匹配出日期所在的行,根据两个日期所在行数的中间所夹的就是评论内容和用户名来完成我们的评论内容提取。...才疏学浅,刚学了几个月python,代码难免有不合理的地方,望各位提出宝贵意见。 个人博客 8aoy1.cn

77610

校园论坛(Java)—— 考研学习模块

校园论坛(Java)—— 考研学习模块 1、写在前面 2、系统结构设计 2.1 各个页面之间的调用关系 2.2....学习专帖的展示页面 study.jsp:发表学习专帖 releaseStudyJudge.jsp:学习专帖标题判空操作 studyReply.jsp:查看回帖信息 MdeleteUserStudyServlet...:当前登录用户或管理员删除当前登录的学习专帖 UpdeleteStudyReplyByIdServlet:当前登录用户删除当前登录的学习专帖回帖 userlist.jsp:所有用户包括管理员自身的用户信息列表...3、考研学习模块设计 考研学习模块分为浏览、查看、发表、删除、回复帖子的功能。...3.2 发表帖子 发表考研学习帖子: 点击学习专区的「发表学习专帖」按钮进入发表页面,此处不同于普通帖子的是,学习专区的帖子新增了帖子封面壁纸的选择,完成帖子信息的填写之后,点击“发表”按钮即可发表成功

1.1K20

论坛报名 | DataFunCon:AI 平台框架论坛

7月26日,9:00-12:20,由腾讯大数据智能学习团队负责人陶阳宇先生担任出品人的DataFunCon:AI 平台/框架论坛将准时开启,感兴趣的小伙伴和小编一起来了解下吧: ?...出品人:陶阳宇 博士 腾讯大数据 | 智能学习团队负责人 陶阳宇,腾讯专家工程师,目前担任腾讯大数据智能学习团队负责人,支持腾讯广告推荐、金融支付、社交网络等业务场景的算法模型优化、训练与推理服务。...他拥有10余年机器学习、大数据、分布式系统领域从业经验,2009年获中国科技大学电子科技专业博士学位。...韩堃 博士 滴滴 | AI Labs Researcher 分享主题:DELTA 基于深度学习的语言技术平台 内容摘要:近年来,随着深度学习的高速发展,语音和自然语言处理有了越来越多的应用,而这些应用都离不开一套优秀的模型训练和部署框架...郭跃超 腾讯 | 应用研究员 分享主题:Angel深度学习在广告推荐训练系统中的实践 内容摘要:Angel是腾讯开源的分布式深度学习框架,支持数据并行、模型并行等多种大规模机器学习模型的训练和加速。

4K20

扫码

添加站长 进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

    运营活动

    活动名称
    广告关闭
    领券