我将唯一的用户代理存储在MySQL MyISAM表中,因此当我必须查看表中是否存在它时,我将检查文本字段旁边存储的md5散列。User-Agents id - INT hash - VARCHAR(32) // md5除了使用32位整数而不是文本哈希之外也许原始格式的md5会更快一些?这将需要一个二进制搜索。
我有两张桌子:products_tmp表的字段较少。但是products_tmp中的所有领域都是在产品中。在导入数据时,我填充了products_tmp表,之后我需要做3件事:
检查products_tmp中没有在产品中的新产品(get in )(完成)检查不在products_tmp中的旧产品(get in以便以后删除)检查其他产品的差异。这两个表都有一