【欢迎转阅】
为了切实帮助审查员高效能审查,机械部将于2018年07月31日举办2018年第二次检索论坛,为分享成果,发布《基于大数据分析的S系统检索策略》和《机械部技术细节检索规范》。
根据部门安排,现将《基于大数据分析的S系统检索策略》刊发!
一
常规检索思路
先查准,争取快速找到对比文件
后查全,作全面检索,争取找到对比文件
查准方法:发明点 and 技术分支 或 单独使用涉及发明点的技术分支;
技术分支通常用准确CPC、FI、FT或IC表达;
常见的表达式:发明点 and CPC/FI/FT/IC
查全方法:技术领域and发明点 技术领域通常使用IC表达;
表达方式为:关键词 and 扩展IC。
二
面临的问题
AB或分类号等字段标引不全,容易产生漏检。
三
CNABS/VEN数据库
检索策略
检索时常使用CNABS数据库检索中文专利数据,使用VEN数据库检索外文专利数据。因此,以下着重对上述两个数据库进行分析。
(一)CNABS数据库
1.数据收录范围
CNABS数据库收录了1985年至今全部发明、实用新型和外观设计的中国专利文献数据,公开和授权文本作为同一条记录显示。
2.各字段标引率
注释:发明的CPC标引集中在2013-2017(申请日),各年标引率分别为15%、26%、45%、100%和100%,实用新型的CPC和FT标引率为0。
3.检索策略
(1)有比较准确的CPC和FT分类号的领域,可以首先尝试使用:
发明点 and CPC
或
发明点 and FT,以提高检索效率(查准);
(2)没有比较准确的CPC和FT分类号的领域,采用“发明点 and IC”(查全)。
(二)VEN数据库
1.数据库特点
VEN数据库是DWPI数据库和SIPOABS数据库的综合,发挥了各自数据的优势,字段包含两类,一类是共有字段,二是独有字段。对共有字段,VEN有两种方式处理,一是叠加,二是合并去重,叠加的字段包括:号码类:PN、AP、PR,文本类:PA、IN、TI、KW、AB;合并去重字段包括:分类号类:IC、EC、CPC、UC、FI、FT,日期类:PD;独立字段类,仍然保持各自独立。
2.数据收录范围
3.主要字段标引率
检索策略:
1.对于具有非常准确的CPC的情况,检索步骤如下:
发明点 and CPC(对具有CPC和AB字段的数据进行精确检索);
CPC NOT AB=YES(对有CPC字段,没有AB字段的数据进行补充检索);
(IC AND发明点) not cpc=yes(对没有CPC字段的数据);
IC NOT (AB=YES OR CPC=YES)(兜底检索)
2.对于没有明确CPC的情况,检索步骤如下:
发明点 and IC;
IC(较为准确的分类号) NOT AB=YES (对有IC字段,没有AB字段的数据进行补充检索)。
四
世界主要局
数据检索策略
本部分主要研究如何查全、查准世界主要专利局数据。
(一) EP
1.数据收录范围
SIPOABS和DWPI数据库均收录了欧专局成立(1978)至今的发明专利文献数据。
2.各字段标引率
3.检索策略
使用的数据库:VEN
检索方法:采用“发明点 and CPC”,能够覆盖100%的欧专局数据。
(二) US
1.数据收录范围
SIPOABS收录了1837年至今美局的发明、植物和外观专利专利文献数据,DWPI收录了1976年至今美局的发明专利文献数据。
2.各字段标引分布
VEN数据库中AB字段标引率低主要受1976年之前的数据影响。
3.检索策略
使用的数据库:VEN
检索步骤如下:
(1)“发明点 and CPC”;
(2)CPC NOT AB=YES(对没有AB字段的数据进行补充检索,主要针对1976年之前的数据)。
(三) JP
1.数据收录范围
SIPOABS收录了1973年至今日局的发明、实用新型和外观设计专利文献数据,DWPI收录了1973年至今日局的发明专利文献数据。
2.各字段标引分布
VEN数据库中AB字段标引率低主要受SIPOABS数据库中AB标引率,VEN数据库中日本实用新型的摘要标引率仅为0.1%。
3 .检索策略
使用的数据库:VEN
检索步骤如下:
(1)对于具有准确CPC或FI的情况
关键词 and FI/CPC;
(2)对于具有准确FT的情况
关键词 and FT 或 FTAND FT
(3)没有准确CPC/FT/FI的情况
关键词 and IC
(4)补充检索
IC NOT AB=YES(对实用新型和没有摘要的发明进行检索)。
(四) KR
1.数据收录范围
SIPOABS收录了1979年至今韩局的发明专利文献数据、实用新型数据。DWPI收录了1987年至今韩局的发明专利文献数据、实用新型数据。
2.各字段标引分布
3.检索策略
使用的数据库:VEN
检索步骤如下:
(1)对于具有准确CPC的情况
关键词 and CPC;
CPC NOT AB=YES (对没有AB字段的数据进行补充检索)。
(2)没有准确CPC的情况
关键词 and IC
(3)补充检索
IC NOT AB=YES (对没有AB字段的数据进行补充检索)。
(五) DE
1.数据收录范围
SIPOABS数据库收录了1920年至今德局的发明专利文献数据、实用新型专利文献数据;DWPI数据库收录了1970年至今德局的发明专利文献数据。
2.各字段标引分布
3.检索策略
CPC AND 关键词(查准)
CPC NOT AB=YES(补充没有摘要的数据)
IC NOT CPC=YES(兜底检索)。
小结
如下附图为主要专利局专利文献的CPC、AB、IC*AB、CPC*AB标引率分布,供参考。
1、CPC标引率分布
2.AB标引率分布
3.IC*AB标引率分布
4. CPC*AB标引率分布
机械部检索规范推广工作小组
业务指导:房华龙
组员:杨喜飞 李祥亮 吴落 方照蕊
日期:2018年07月
编辑:武茂蒙
领取专属 10元无门槛券
私享最新 技术干货