1. One Paper
Neural Models for Sequence Chunking
链接:
https://arxiv.org/abs/1701.04027
很多的 NLP 任务,比如浅层分析、slot filling、ner 等等都可以当成是序列标注任务,用经典的概率图模型、RNN 模型及其变种和两者的混合模型来处理,本文提出了用 seq2seq+pointer 的方法来解决这一经典问题,并且取得了不错的效果。关注序列标注的童鞋可以精读此文。本文工作来自IBM,被 AAAI2017 accepted。
2. One Code
PyTorch
PyTorch 的开发者提到 Pytorch 和 Torch 一样,都是基于共同的C库,速度同样很快,相比于 Torch,PyTorch 的主要优势在于 RNN、权重共享、内存使用方面,同时也保留了 Torch 接口灵活,速度快的优点。另外,引入 Python 以及 numpy 会让数据预处理更加方便,Torch 党可以告别 Python+HDF5+Torch 的模式了。
主页地址:
http://pytorch.org/
代码地址:
https://github.com/pytorch/pytorch
3. One Deep
微博上@王伟DL 老师对现有的句法分析研究思路进行了反思和剖析,当前的句法分析结果形式是否合理?现在的研究思路是否正确?采用何种分析结果会更加合适?这每一个问题的思考都是一次对自然语言处理发展的推动,转换思路,期待更大的突破!
原博文可见:
http://weibo.com/1829165501/EqOAOv2NS
4. One Picture
(图片引自微博@刘知远THU)
上图为清华大学刘知远老师推荐给本科生做研究的一些入门书籍和学术网站,其实很多的内容研究生也适用。
5. One Opinion
本周简单聊一聊对 Chatbot 的看法。对自然语言的理解是一个非常智能的事情,虽然 NLP 很多任务的 benchmark 已被深度学习席卷,但并不意味着现在的研究水平可以做到理解人类语言,甚至作出相应的决策。Chatbot 是一个综合性很强的任务,它要作为产品落地,在技术实现上仍有很多的关键问题有待突破,当然用一些简单粗暴不太美的方法也可以做一些 Chatbot 产品出来,努力的方向也只能是针对非常细分的小领域,在一定程度上用 Chatbot 帮助企业提高生产效率,节约成本,实现盈利,但作为试图改变现有人机交互模式的CUI(Conversation User Interface),仍有很长很长的路要走,真的不是一两年的事情。
本文为 AI100 原创,转载需获同意