专栏首页量子位不会SQL?没关系,以后动动嘴就能查询数据库了 | 附论文

不会SQL?没关系,以后动动嘴就能查询数据库了 | 附论文

陈桦 编译整理 量子位 出品 | 公众号 QbitAI

在编程世界里,SQL非常简单。然而,这种语言仍有一定的学习难度,导致许多人无法与关系数据库进行交互。Salesforce的人工智能研究团队正着手探索,如何利用机器学习技术,给不了解SQL的人群打开一扇大门。

该团队近期发表论文《Seq2SQL:利用强化学习技术从自然语言生成结构化查询》。论文中提出的方法基于语句到语句模型,而这通常被用于机器翻译。利用强化学习系统,该团队将自然语言翻译成为数据库查询指令,并取得了很不错的结果。

论文作者是来自Salesforce研究院的Victor Zhong、Caiming Xiong、Richard Socher。

这个Seq2SQL模型由三部分组成。

在实践中,这意味着用户可以简单地提问,大学橄榄球联赛中哪支队伍最终获胜,而适当的数据库会告诉你,胜利者是密歇根大学。

参与该项目的Salesforce研究员Victor Zhong表示:“我们实际上并没有一种正确的方式来编写查询指令。如果用自然语言提出问题,那么可能会有两到三种方式来编写查询指令。我们使用强化学习技术,鼓励使用能获得同样结果的指令。”

你可以想象,在单词库很大的情况下,机器翻译问题会很快变得非常复杂。而通过限制可能翻译结果的数量,问题会变得相对简单。因此,Salesforce选择了将单词库限制为数据库标签使用的单词、问题中包含的单词,以及通常用在SQL查询中的单词。

推动SQL普及的想法并不新鲜。例如,近期被Tableau收购的创业公司ClearGraph就尝试用英语而非SQL语言来查询数据。

Victor Zhong表示:“某些模型在数据库自身之上执行。但如果你查询社会安全号码,那么这样做就可能就牵涉到隐私问题。”

除论文本身,Salesforce在这个领域的最大贡献在于,构建了WikiSQL数据集,协助模型的建立。最初的HTML表格取材于维基百科。这些表格成为了随机生成的SQL查询的基础。这些查询被用于生成问题,随后被提交给人工,通过亚马逊Mechanical Turk进行改写。在人工指导下,每个问题都会被验证两次。最终形成的数据集是这个领域最大的数据集。

论文下载

对这篇论文感兴趣的朋友,可以在量子位微信公众号(QbitAI)对话界面回复:“SQL”,就可以获得下载地址了~

本文分享自微信公众号 - 量子位(QbitAI)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2017-08-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • SQL—复制表结构及其数据

    1. 复制表结构及其数据: create table table_name_new as select * from table_name_old 2...

    学到老
  • 和开发同学讨论的一个技术问题(r8笔记第73天)

    今天下午的时候,有一位开发同事找我,说有一个技术问题想请教一下。 当然正如他所说,这个问题比较奇怪,而且已经影响了他的测试流程,他说有一个表查看对应的表空...

    jeanron100
  • CIO要谨防销售忽悠 选择ERP供应商如何才能做到万无一失?

    ERP系统可以在管理内外部资源,保持业务平稳运营上提供很大帮助,ERP平台还可能是累赘,让CIO为难是否应该付出必须的资金和工作。本指南将介绍如何克服ERP实...

    人称T客
  • 剖析Oracle中oerr命令(r8笔记第70天)

    Oralce中的命令非常丰富,oerr命令是一个不错的辅助工具,很多看起来没有眉目的错误代码,可以让DBA很快定位问题的缘由,我们根本不需要去记有哪些ORA错误...

    jeanron100
  • SQl 语句(常见) 新建,删除,修改表,新增字段,修改默认值

    SQl 语句(常见) 新建,删除,修改表结构 新建表: create table [表名] ( [自动编号字段] int IDENTITY (1,1) PRIM...

    学到老
  • 一次数据变更的审核过程(r8笔记第95天)

    今天正在做一个数据变更操作,突然一个开发的同学找到我,看起来比较着急的样子,说想让我做一个数据变更。 当然在这种时候,我正在做的数据变更操作已经被打断了...

    jeanron100
  • MySQL 报错:5.7版本sql_mode=only_full_group_by问题

    MySQL 5.7.9版本sql_mode=only_full_group_by问题 用到GROUP BY 语句查询时com.mysql.jdbc.except...

    学到老
  • SQL处理表结构的基本方法整理(创建表,关联表,复制表)

    复制表结构及数据到新表 CREATE TABLE 新表 SELECT * FROM 旧表 只复制表结构到新表 CREATE TABLE 新表 SELECT * ...

    学到老
  • 工信部下周发布可信云认证名单 或为政采前奏

    7月10日下午消息,阿里云透露,工信部将于下周发布可信云认证名单,阿里云已进入该名单。这是国内权威机构首次开展云计算领域的资质认证,也被认为是中国政府即将大规模...

    静一
  • IBM再下云计算大赌注

    苦苦寻求业绩增长的IBM似乎已经找到了方向。近日,IBM宣布收购NoSQL数据库公司Cloudant,此举可望让IBM控制NoSQL“数据库即服务”(DBaaS...

    静一

扫码关注云+社区

领取腾讯云代金券