首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

JavaScript·正则匹配汉字

正则匹配汉字 在此之前,项目中使用正则匹配汉字表达式都是 /[\u4e00-\u9fa5]/,虽然常用,但是一直未深究其所以然。...两者不是一类事物, 是无法进行对比正则匹配汉字 介绍完字符集和字符编码之后,回到正题,我们已经知道「汉字」是汉文基本单元,但这里汉字」具体指代哪些字符集呢?...如果把它们全部列举出来写成正则表达式,那么就是技术上完整匹配汉字正则表达式了。...我们一开始所提到正则表达式 /[\u4e00-\u9fa5]/ 匹配区域对应是 Unicode 1.0.1 就收录进来中日韩统一表意文字区块,在 Unicode 3.0 以前,这个正则表达式确实给出了所有汉字编码...在这 20 年间,Unicode 添加了许多汉字。这些新增汉字并不在上面这个正则表达式匹配区域中,所以我们正则也需要与时俱进匹配最新 Unicode 标准。

3.8K40

js特殊符号正则表达式_js正则表达式判断特殊字符

JavaScript正则表达式功能: 搜索、替换、判断 JavaScript正则表达式格式: /正则表达式主体/修饰符 JavaScript正则表达式主体内容: JavaScript正则表达式中修饰符使用...JavaScript正则表达式中方括号使用: 将一些规则连在一起匹配一个字符 方括号: 表达式 描述 [abc] 查找方括号之间任何字符。 [^abc] 查找任何不在方括号之间字符。...JavaScript正则表达式中元字符使用 需要使用转移符号,可以方便使用,可以认为是对方括号使用简化: 元字符: 元字符 描述 . 查找单个字符,除了换行和行结束符。 \w 查找单词字符。...JavaScript中正则表达式应用场景: 搜索功能(字符串方法) search() 方法参数为字符串或者是正则表达式 返回结果为匹配成功索引值,如果没有,返回-1 替换功能(字符串方法) replace...() 方法有两个参数,第一个用于匹配,第二个用于替换 第一个参数可以是字符串或者是正则表达式 第二个只能是字符串 判断功能(正则表达式方法) test() 参数只有一个,为判断字符串,返回值表示是否匹配

8.7K20

js爬虫,正则

大概看了下,是js加载,而且数据在js函数中,很有意思,就分享出来给大家一起看看! 抓取目标 ?...今天我们目标是上图红框部分,首先我们确定这部分内容不在网页源代码中,属于js加载部分,点击翻页后也没有json数据传输! ?...但是发现有个js请求,点击请求,是一行js函数代码,我们将其复制到json视图查看器中,然后格式化一下,看看结果 ? ?...只是其内容,需要在进行处理一下,我们写到代码中看看 开始写代码 先导入库,因为最终需要从字符串中截取部分,所以用requests库获取请求,正则re匹配内容即可。然后我们先匹配出上述3项 ?...解码用了eval函数,内容为u“ + unicode编码内容 + “形式即可解码! 这样,就取出了本页所有新闻和URL相关内容,在外层加上循环,即可抓取所有的新闻页,任务完成!

7.6K20

js正则小结

1,\ 斜杠用于转义,在js正则里,只有一些元字符(*,?,.等)和\本身需要转义,其他不需要转义,如果其他字符前面使用了\,可能会产生负面影响,比如\b,\t这些有特殊含义转义。...此外,在js正则中,\还有一个用处在于使用new RegExp()形式创建正则对象时,比如new RegExp('a\*a'),其中*是乘以意思,js引擎在解析该正则表达式字符串时,会消耗掉这个斜杠,...2 ^ 该元字符比较简单,就是表示该正则是从字符串首字符开始匹配,有一个地方需要注意是,如果该正则表达式加了m标记时,匹配到了行分隔符时候就会结束。然后会在下一行继续匹配。...'d\nd'.match(/^d/g) => ['d'], 'd\nd'.match(/^d/mg) => ["d", "d"] 3 $ 该元字符和^一样,当含义$正则匹配一个字符串时,他不是直接判断该字符串结尾....$2 = y,每次正则执行完后,捕获分组或挂载到RegExp对象上,并且清除上次执行结果。 $&是一个特殊变量,他代表是整个正则表达式匹配到结果。也就是xy。 7 (?

7.6K50
领券