前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >不要再用arxiv链接了!为了让论文引用更规范,上交毕业生、南加州大学华人博士创建了一个小工具

不要再用arxiv链接了!为了让论文引用更规范,上交毕业生、南加州大学华人博士创建了一个小工具

作者头像
机器之心
发布2021-02-23 11:54:18
7360
发布2021-02-23 11:54:18
举报
文章被收录于专栏:机器之心机器之心

机器之心报道

作者:魔王

只需两步,将文献的 arXiv 信息转换为正式来源信息。

伴随着预印本平台 arXiv 的广泛使用,越来越多的研究者喜欢在写论文参考文献时直接使用 arXiv 信息。这看似非常方便,但也存在问题:这篇 arXiv 论文是否在 ACL、EMNLP、NAACL、ICLR 或 AAAI 等学术会议上发表过?

没错,在某些情况下,只引用 arXiv 信息显得不那么准确,这种不准确的文献条目甚至可能会违反某些会议的论文提交或 camera-ready 版本提交规则。

如何解决这一问题呢?最近,上交毕业生、南加州大学博士生林禹臣开发了一个简单的 Python 工具——Rebiber,它能够基于 ACL Anthology 和 DBLP 数据库自动解决这一问题。

项目地址:https://github.com/yuchenlin/rebiber

下图展示了 Rebiber 的使用示例:

在该示例中,文章的原始信息来自 Google Scholar,仅包括标题、作者、期刊(arXiv)、年份。而事实上该论文已被 EMNLP 2020 接收,原始信息显然不够准确。

经过 Rebiber 转换后,原始 arXiv 信息被转换为来自正式来源的准确信息,包括标题、作者、年月、出版商、数字对象识别码(doi)、网址等详细内容。

Rebiber 支持的会议包括 ACL Anthology 涵盖的会议,如 ACL、EMNLP、NAACL 及其 workshop,以及 DBLP 涵盖的会议,如 ICLR 2020。

目前,Rebiber 支持的会议列表如下所示:

使用者还可以手动添加 DBLP 包含的任意会议:只需从 DBLP 中下载会议 bib 文件至 data 文件夹,然后将其转换为 json 格式,再把路径添加至 bib_list.txt 即可。

如何使用?

这款工具的使用也很简单。

首先,运行以下命令行:

代码语言:javascript
复制
git clone https://github.com/yuchenlin/rebiber.git
pip install bibtexparser tqdm
cd rebiber

然后,将文献条目归一化为正式格式:

代码语言:javascript
复制
python normalize.py -i example_input.bib -o example_output.bib -l bib_list.txt

只需要简单的操作,就可以将 arXiv 信息转换为正式信息了。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-01-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器之心 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
NLP 服务
NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档