腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
算法修养
专栏成员
举报
674
文章
399597
阅读量
49
订阅数
订阅专栏
申请加入专栏
全部文章(674)
编程算法(343)
数据结构(231)
其他(97)
c++(27)
数组(17)
二叉树(16)
动态规划(14)
人工智能(13)
java(12)
ios(11)
dfs(11)
.net(9)
dp(8)
github(7)
字符串(7)
https(6)
binary(6)
遍历(6)
递归(6)
排序(6)
效率(6)
git(5)
lucene/solr(5)
容器镜像服务(5)
http(4)
容器(4)
add(4)
hash(4)
integer(4)
二进制(4)
php(3)
asp.net(3)
ajax(3)
analyzer(3)
nginx(3)
缓存(3)
digits(3)
height(3)
int(3)
ode(3)
搜索(3)
对象存储(2)
python(2)
javascript(2)
数据库(2)
搜索引擎(2)
开源(2)
分布式(2)
正则表达式(2)
class(2)
double(2)
excel(2)
for循环(2)
matrix(2)
numbers(2)
public(2)
size(2)
string(2)
sum(2)
tree(2)
博客(2)
数据(2)
算法(2)
指针(2)
lua(1)
regex(1)
node.js(1)
xml(1)
css(1)
json(1)
云数据库 SQL Server(1)
memcached(1)
sql(1)
flask(1)
ide(1)
api(1)
struts(1)
tomcat(1)
全文检索(1)
linux(1)
ubuntu(1)
apache(1)
压力测试(1)
网络安全(1)
ssh(1)
openstack(1)
asp(1)
单元测试(1)
数据处理(1)
windows(1)
nat(1)
postcss(1)
area(1)
bit(1)
break(1)
count(1)
data(1)
dictionary(1)
element(1)
expression(1)
factorial(1)
frequency(1)
grid(1)
hashtable(1)
input(1)
insert(1)
iterator(1)
limit(1)
list(1)
map(1)
next(1)
nlog(1)
nodes(1)
output(1)
pascal(1)
sudoku(1)
summary(1)
target(1)
void(1)
word(1)
变量(1)
编码(1)
继承(1)
基础(1)
集合(1)
接口(1)
链表(1)
统计(1)
序列化(1)
压缩(1)
原理(1)
重构(1)
搜索文章
搜索
搜索
关闭
实际体验Span<T> 的惊人表现
regex
javascript
正则表达式
编程算法
.net
最近做了一个过滤代码块功能的接口。就是获取一些博客文章做文本处理,然后这些博客文章的代码块太多了,很多重复的代码关键词如果被拿过来处理,那么会对文本的特征表示已经特征选择会有很大的影响。所以需要将这些代码块的部分给过滤掉。过滤起来很简单,就是找代码块的html 标记,然后将html标记之间的内容给删除就可以了。代码块的html标记一般都是<pre></pre>
ShenduCC
2019-04-17
3.9K
0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档