前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >读书分享-统计自然语言处理

读书分享-统计自然语言处理

作者头像
数据处理与分析
发布2019-07-31 16:42:35
3250
发布2019-07-31 16:42:35
举报

周末愉快了吗?各位! 今天周一,来分享下我周末的学习成果!

同时也请大家做个见证,因为人都有惰性。像我平常以工作太忙为借口,已经有很长时间没有读过什么正经书了。所以我计划着,在大家的监督下,在我宝贝儿子与媳妇的支持下,以后每周末,我都会抽点时间来读点书。并把书中我认为有意思的部分摘下来,分享给各位!


1.我选择的书

这本书是我很久之前收集的,一直都没来得及看。当时收集这本书是为了更好的做地名地址相关的工作,而现在虽然换了城市,也有了新的工作,但地名地址依然是工作中的重心。虽然平常有很多的数据需要处理(咱做数据处理的,这就是基本任务了),但我认为其中的重点还是地名地址的相关的处理。所以,选择了这本书来学习,来掌握这方面的理论与方法,让自己的技术得到更好的成长!

2.自然语言处理(NLP)

虽然这本书是在讲自然语言的处理,但我觉得其中的理论与方法对命名实体识别(NER)也有益处,而地名地址中的地址描述,都与现实中的实体一一对应,所以,可以对书中的模型与思想进行扩展,以支持NER。总之,技术都是相通的嘛!

书摘
模型与方法

自然语言处理首先要有模型,针对自然语言的特点,模型应具备很好的鲁棒性和概括性。在数据的支持下,通过选区合适的模型与算法,可以让数据之间产生关联,达到神奇的效果。

做语言处理的基础

同机器学习类似,自然语言的处理需要大量的数据支撑,这些数据被称为语料库。要做好分词,需要大量的标注好的数据。这部分基础数据虽然不及模型与算法,但对于自然语言的处理工作而言,也像水电煤一般重要。

语言处理中的歧义消除

语言的复杂性就在于同样的词语在不同的语境下,往往有着不同的含义。

最小精力付出原理

这个原理与前一段看过的《嫌疑犯X的献身》中的厄多斯信徒:达摩石神理念基本一致,总有最优解。我认为,最小精力付出并不是说应该偷奸耍滑,相反的,应该付出更多的思考,寻求最优雅的解决方案!因为针对某一类具体问题的解决方案,可能会经常需要应用在工作中。所以在条件允许的情况下,应多思考,力求找出能力范围内的最优解。这样的话,虽然在短期内看来貌似付出了更多的精力,但是从长期来看,一个稳定的,完美的解决方案,会在个人的职业生涯中发挥出他的能量!

3.总结

工作也好几年了,在这期间也换过工作,也经历了很多。但我始终相信,只有不断的学习,掌握更多的专业知识,能够将理论结合实际,并努力将简单做到极致,才是一个合格的技术人!

以一句话结束这次的推送:不间断的学习,学的慢点不怕,勤能补拙;对未来充满希望,现实残酷点不怕,坚信努力的付出可以换来更美好的明天!

From A Giser!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-01-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据处理与分析 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1.我选择的书
  • 2.自然语言处理(NLP)
    • 书摘
      • 模型与方法
        • 做语言处理的基础
          • 最小精力付出原理
          • 3.总结
          相关产品与服务
          NLP 服务
          NLP 服务(Natural Language Process,NLP)深度整合了腾讯内部的 NLP 技术,提供多项智能文本处理和文本生成能力,包括词法分析、相似词召回、词相似度、句子相似度、文本润色、句子纠错、文本补全、句子生成等。满足各行业的文本智能需求。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档