英语与人工智能

各位读者,一段时间不见,有没有想念我?在过去的一个月,工作生活上的事情叠在一起,目前进入收尾阶段,我有了时间来写文章。最近没有什么重要考试,说说我在工作上的见闻以飨读者。

近来“让数字多跑腿,群众少跑腿”如火如荼,各个地方都在开展大数据、智能化办公。一些新模式让人耳目一新,比如在《人民的名义》中出现过的大屏,数据可视化动态化,实时更新重点突出;还有各种统计数字集合在一起,抽丝剥茧后反映经济和社会活动的现状,为决策分析提供依据。新模式能便利生活,还能全局总览且部分细究,蕴含巨大的价值。

但新模式因其改革性也会面临旧模式的桎梏,因此要打破、整理旧模式下的数据,从而使其符合新模式。数字、表格等一系列原有格式只需对应转化,而从未有过秩序的文本成为必须翻越的眼前大山。要想让文本有秩序,需要先让文本结构化,这关系到智能化水平和效率,因此要尽量以高效率方式进行。

非文学类文本的突破口在于规律。Python和NLP技术不仅能爬虫爬下来大量文本,还能根据文字位置、前后搭配等方法,从已有文本中抽取出对应的命名实体,并将其放置到对应的结构化表格中,为以后的统计和分析做基础。比如,脸书做过的舆情分析,根据关键字和时间收集用户发布的文字,再通过词性标注和句法分析找到表达感情的形容词等,分析其感情极性,判断大家对某人某事的看法是积极还是消极。这种方法在国内也有;能迅速、全面的把握群众情绪,为决策和措施提供科学依据。

除了对已有文字的拆分和处理,生成也是一大应用。比如美国发布的各种政策、公告、报告,一般结构很稳定,因此爬虫+句式对应+关键词翻译+文本生成发布,几乎可以全自动处理,同时还能将变化了的关键词集合成机构化表格,以备统计和分析。

那么是不是翻译必将失业?这个老话题最近总被提起。但是现状是,英汉的自动化流程并不顺利,因为目前没有大批量“略懂技术+精专语言”或者“略懂翻译+精专技术”的人。过去教育体系中没有培养,现在的职场生活中也还没有引导。因此,或许这是一条将所谓的落后产能、红牌专业的语言专业与新兴的、需求旺盛的IT、data结合的最佳方式。各位善于学习钻研的翻译人士、英语专业或许能施展所长、一展抱负。要知道一个有经验的NLPer的年薪比金融IT有过之而无不及呢。

乐观之余,留给翻译队的时间不多了。2016年清华开设计算语言学硕士专业;人大附中选派学生赴美参加语言奥林匹克;江苏等省在高中开设python课程;计算机二级增设python项目,以及美帝的无数geek。时间窗口或许正在缓缓关闭,还有后浪滚滚想把我拍在沙滩上。

“我35岁了,学不会别的”,这句话曾引起无数讨论。我想大多数人都不想自己沦落到这样的境地。主席教导我们:天下大乱,时机大好。如果十年前没有种下科技树,第二好的时机就是现在。

PS如果说实在不喜欢、学不会怎么办?可以走另一个方向,处理人——去创造独一无二的体验,用文字给自己开创一个国度,用故事给别人感同身受和有所启迪。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181206G0LWH100?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券