网页搜索最初是用关键词索引查找的,但在欧洲语言中,有时态、语态、性别、同一个意思上下文拼写可能不同,因此严格按照关键词匹配,例如查找使用单数名词时,就可能找不到有复数名词的内容。所以什么时候应该用词干搜索,什么时候必须严格按照关键词的原型搜索?这不是简单的概率模型就可以估摸出来的,在大数据背景下,列举每一种情况,并且有针对性的做出不同的处理,成为可能。辛格博士和吴军博士找到一种方法,事先把多年来用户搜索的关键词搭配都整理出来,然后对每个关键词的搭配都做了特殊处理,实际上就是一种穷举法。
无人驾驶汽车在行驶过程中会遇到很多的不确定性,需要实时做出聪明的判断。对于已经去过的地方,Google已经收集了非常完备的信息,比如周围目标物的形状大小颜色,每条街道的宽窄,限速,不同时间交通情况,人流密度等,Google都事先处理好,备未来使用,所以汽车驾驶到每个地方,都迅速把这些数据拿出来做参考。过去的研究所做的是使用人的思维,每到一个地方临时识别,这样,计算机跑的再快,也来不及做深入运算,无法做出准确判断。自动驾驶汽车上装有十多个传感器,每秒钟进行几十次扫描。Google的自动驾驶汽车是通过移动互联网与Google的超级数据中心相连,虽然本身携带的是一台简单的服务器,即一个电脑,但是整体的数据量和计算能力远远超过其他大公司自动驾驶汽车上面携带的计算机。