奇点导读:
谷歌作为全球最大搜索引擎公司,发布过很多有趣项目。近日,谷歌又上线了一个名为“Semantic Experiences”(语义体验)的网站,包含了Talk to Books和“Semantris“两个项目,前者是一款基于人工智能的书籍搜索引擎,用户不用像以往的搜索方式,键入书名,作者等关键词,而是可以用书中的某个句子搜索到目标书籍,而后者是一个基于机器学习驱动的单词联想游戏。这两项功能是基于自然语言文本的理解,而语义理解正是人工智能技术发展的重要方向,谷歌希望通过这两个项目让普通人也能感受最新语义理解和自然语言处理技术的强大能力。此外,谷歌还发布了论文《Universal Sentence Encoder》,详细地介绍了这些示例所使用的模型。并提供了一个预训练语义 TensorFlow 模块。
以往我们在检索书籍时,通常会从书名、作者、主题等表面标签入手。而谷歌发布的「Talk to Books」可以为用户提供一种检索书籍的全新方法。用户只需要做一段相关描述,或是提一个相关的问题,那么 Talk to Books 可以在不依赖关键词匹配的情况下,从超过 10 万本书籍中检索所有句子,并根据句子层面的语义,找到能匹配用户陈述或问题的句子。从某种意义上来说,Talk to Books 是一种用户与书「交谈」的新模式,系统给出的回答也能帮助用户确定自己是否对相关主题感兴趣。
模型在正式发布前经历了超十亿次的对话训练,以打磨更好的用户体验——对用户的提问或陈述给出更加合适的回答。这一方式相比起普通的谷歌检索,可能会帮助用户找到一些更有趣的书籍,特别是在关键字搜索中并不会显示的一些结果。
不过,这一模型还有更多的改进空间,比如搜索范围局限在句子层面上,而不是段落,因此可能会产生「断章取义」的情况。另外,因为只看某一句子的匹配程度,这也可能导致某些众所周知的、「符合口味」的书并不会出现在检索结果的前列。谷歌团队此举,更多的是希望帮助人们以一种新的探索方式,发现不曾料想过的作者和书名,竟然会有读者感兴趣的内容。
地址:https://books.google.com/talktobooks
一个基于自然语言理解的游戏,通过输入模糊的描述词汇,消去屏幕中的单词
如图所示,用户输入「Photo」时,最顶部的「Camara」因为与输入单词的关联最为紧密,因此会更替排序调整到第一位「消掉」。这确实是一个锻炼联想能力的好机会,此外还有限时模式和不限时模式供用户体验。
一个是手速版(限时模式):Arcade,输入的单词和高亮的单词匹配时,高亮单词会到线之下,同时消除屏幕中所有单词,同时会不断掉落单词,单词触顶游戏结束。玩了很多次没有到1000分就是因为手速不够快/不认识单词,科科。
不限时模式:Blocks,输入单词或句子,匹配屏幕中相应的单词,消除相同颜色的色块,由于不限时,可以有足够的时间考虑消除哪个色块,并且用尽可能准确的语言描述对应的单词。
地址:https://research.google.com/semantris