文章作者:
崔洪丽,蓝灯鱼产品经理
李云梅, Zilliz 数据工程师
| 背景
蓝灯鱼智能科技 (www.lanternfish.cn) 是一家立足于知识产权领域的人工智能公司。专利检索工具是蓝灯鱼的一款代表性产品。专利文书的语言特点包括新颖性、特征性、法律规范性,是申请专利的重要依据。产品将通过 AI 的方式来理解这些文字中的逻辑、含义关系,并检索出来。
Milvus (milvu.io) 是一款开源的向量搜索引擎。其开源半年以来,全球已经有上百家企业或组织用户。Milvus 充分利用现代处理器的并行计算能力,可以在单台通用服务器上完成对十亿级数据的毫秒级搜索,助力用户高效完成对非结构化数据的检索。
Milvus
Milvus 支持使用多种 AI 模型向量化非结构化数据,并为向量数据提供搜索分析服务。它可处理的业务包括图像处理、机器视觉、自然语言处理、语音识别、推荐系统以及新药发现。具体实现方式是:
| 项目建设
在蓝灯鱼专利检索产品的建设过程中,主要分为四个过程,分别是数据提取、模型训练、向量查询、结构化数据展现。
| 产品需求特点
在实际应用中,用户只需要用几十字到三百字之间的术语来表达一段话的完整意思。蓝灯鱼 AI 模型负责将这段话转化成向量,Milvus 负责查询出与给定向量近似的 1000 条向量。之后,蓝灯鱼根据 Milvus 返回的近似分数和 id,在关系数据库中把结构化数据的信息全部取出并展现给用户。在其中主要技术特点有:
例如,输入一段专利的摘要: “一种利用石墨烯连续过滤吸附处理污水的工艺,其特征在于:它包括以下步骤:
a. 设置含填料及石墨烯材料的过滤吸附混合物层,所述过滤吸附混合物层用铁填料、锰填料和多层石墨烯以 2:1:2 的比例混合,或者采用铝填料、氧化锰填料、氧化铁填料、石墨烯改性材料以 1:0.5:1.5:1 的比例混合;
b. 输入污水,污水经过过滤吸附混合物层;
c. 过滤吸附混合物层的石墨烯材料过滤、吸附污水中的污染物,石墨烯材料结合金属填料和/或金属氧化物填料进行微电解反应;
d. 出水;所述石墨烯材料为多层石墨烯、石墨烯改性材料中的一种或者两种的混合物;所述污水的 pH 值为4~6。”
机器需要理解这段话中以下几个要点:
| 项目展示
下图是用户使用蓝灯鱼 AI 专利检索工具的结果展示。从例子中可以看到,检索结果会把本领域相关的专利即太阳能海水淡化装置检索出来。同时可以看到,我们给定的语句指出了太阳能海水淡化装置使用了集热蒸发器和海水冷凝器等特点,检索结果能够把本领域内技术特点相近的专利检索出来且排在前面。
通过上述的专利检索,用户可以迅速查到与要申请的专利近似的相关信息,判断这个专利是否会被驳回,以提高申请成功率。另外,通过语义近似检索也可以了解拥有相同技术的的竞争对手。
| 结语
蓝灯鱼专利检索的难点主要有:
蓝灯鱼希望通过开源界的优秀工具服务于垂直行业,把科技力量应用于行业内各个领域。同时希望 Bert、Milvus 等开源项目能够持续创新地发展。
扫描二维码体验蓝灯鱼专利检索小程序: