前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >短实体,长句实体抽取

短实体,长句实体抽取

作者头像
机器学习AI算法工程
发布2020-09-14 10:22:02
1.8K0
发布2020-09-14 10:22:02
举报
Entity-extractor-by-binary-tagging

“半指针-半标注”方法实体的抽取器,基于苏神的三元组抽取方法改造,这里取消了三元组抽取模型中对s的抽取,直接抽取实体并做分类(相当于直接抽取p和o)。改造后的实体抽取方法不仅可以运用于短实体的抽取,也可以运用到长句实体的抽取。

基于DGCNN和概率图的"三元组"信息抽取模型

代码 以及运行教程 获取:

关注微信公众号 datayx 然后回复 实体 即可获取。

AI项目体验地址 https://loveai.tech

环境

  • python 3.6.7
  • transformers==3.0.2
  • torch==1.6.0

其他环境见requirements.txt

原理

运行

  • 按照data中的格式整理好数据
  • 运行main.py

结果

  • example_datasets1

这里的数据模式比较简单,比较容易达到验证集拟合状态

  • example_datasets2

当前模型这个人民日报的ner数据集效果不佳,需要近一步调参炼丹

测试

  • 选择测试模式,程序会读取训练过程中最好的模型

交互测试结果如下

  • example_datasets1
  • example_datasets2
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-09-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习AI算法工程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 代码 以及运行教程 获取:
  • 环境
  • 原理
  • 运行
  • 结果
  • 测试
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档