XSLT 2.0:如果仅以标点符号分隔，则合并同级节点 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

XPath语法_java中path的作用

XPath是W3C的一个标准。它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计。目前有XPath1.0和XPath2.0两个版本。其中Xpath1.0是1999年成为W3C标准，而XPath2.0标准的确立是在2007年。W3C关于XPath的英文详细文档请见：http://www.w3.org/TR/xpath20/ 。

02

js 符号转换 html代码

JS编码解码一、定义和用法 encodeURI() 函数可把字符串作为 URI 进行编码。

02

您找到你想要的搜索结果了吗？

是的

没有找到

JS编码解码

一、定义和用法 encodeURI() 函数可把字符串作为 URI 进行编码。语法 encodeURI(URIstring) 参数描述 URIstring 必需。一个字符串，含有 URI 或其他要编码的文本。返回值 URIstring 的副本，其中的某些字符将被十六进制的转义序列进行替换。说明该方法不会对 ASCII 字母和数字进行编码，也不会对这些 ASCII 标点符号进行编码： - _ . ! ~ * ' ( ) 。该方法的目的是对 URI 进行完整的编码，因此对以下在 URI 中

06

Author name disambiguation using a graph model with node splitting and merging based on bibliographi

论文： https://link.springer.com/article/10.1007/s11192-014-1289-4

04

批处理--delims分割字符串

02

【C语言简单说】三：整数变量和输出扩展(2)

尼玛。。。简直蛋了个翔。。。没保存，，，， ( E___E ) 念昏了头注：注意我们每一行代码后面的分号表示我们一句代码的结束，就像我们在写文字的时候的标点符号，一个句号表示一句话的结尾。

02

你看不懂的JavaScript（Non alphanumeric JavaScript）

前端工程师们注意啦，尤其是做网站安全的工程师。想必XSS都耳熟能详了吧，即使不知道这具体是什么，也听过它，它可是和DDoS齐名的攻击手段。

02

通过两个简单的教程来提高你的 awk 技能

awk 是 Unix 和 Linux 用户工具箱中最古老的工具之一。awk 由 Alfred Aho、Peter Weinberger 和 Brian Kernighan（即工具名称中的 A、W 和 K）在 20 世纪 70 年代创建，用于复杂的文本流处理。它是流编辑器 sed 的配套工具，后者是为逐行处理文本文件而设计的。awk 支持更复杂的结构化程序，是一门完整的编程语言。

02

escape() VS encodeURI() VS encodeURIComponent()的区别

JavaScript中有三个可以对字符串编码的函数，分别是： escape,encodeURI,encodeURIComponent，相应3个解码函数：unescape,decodeURI,decodeURIComponent 。

01

Python处理中文标点符号

中文文本中可能出现的标点符号来源比较复杂，通过匹配等手段对他们处理的时候需要格外小心，防止遗漏。以下为在下处理中文标点的时候采用的两种方法: 中文标点集合比较常见标点有这些： 1 ！？｡＂＃＄％＆＇（）＊＋，－／：；＜＝＞＠［＼］＾＿｀｛｜｝～｟｠｢｣､、〃》「」『』【】〔〕〖〗〘〙〚〛〜〝〞〟〰〾〿–—‘’‛“”„‟…‧﹏. 调用zhon包的zhon.hanzi.punctuation函数即可得到这些中文标点。如果想用英文的标点，则可调用string包的string.punctuation函数可得到

04

提升awk技能的两个教程【译】

原文：https://opensource.com/article/19/10/advanced-awk

01

encodeURIComponent()函数在url传参中的作用和使用方法

在使用 URL 传参的时候，如果参数中有空格等特殊字符，浏览器可能只会读取到空格面前的内容，导部分致数据丢失。

02

LeetCode 2047. 句子中的有效单词数

句子仅由小写字母（'a' 到 'z'）、数字（'0' 到 '9'）、连字符（'-'）、标点符号（'!'、'.' 和 ','）以及空格（' '）组成。每个句子可以根据空格分解成一个或者多个 token ，这些 token 之间由一个或者多个空格 ’ ’ 分隔。

01

长篇大论中抓取精华，语音实时生成知识图谱，这个系统可谓是首个

在这个信息飞速发展的时代，数据呈爆炸式增长。而互联网信息的多元性、异构性、结构松散等特点，给人们有效获取信息和知识带来了挑战。

03

【国内首家】第一个基于语音生成实时知识图谱的系统来啦！！！

在这个信息飞速发展的时代，数据呈爆炸式增长。而互联网信息的多元性、异构性、结构松散等特点，给人们有效获取信息和知识带来了挑战。

01

Linux 命令行文本操作快捷键

可能有些人不知道，Linux命令行也有一些方便文本操作的快捷键，如跳到行首的快捷键是Ctrl-a,，跳到行尾的快捷键是Ctrl-e,删除光标所在处的字符的快捷键是Ctrl-d。虽然这些快捷键很多时候都可以被小键盘的左右移动键、Home和End键替代，但是对于比较长的命令的修改，快捷键的操作还是比较快的。因为我平时用Vim比较多，而Linux命令行绑定的是Emacs的快捷键方式，虽然可以通过在命令行执行set -o vi修改为Vim的快捷键方式，但是这样会影响常用的像Ctrl-p，Ctrl-n等操作，因此我还是打算将这些难记的文本操作快捷键总结下来，让自己多练习，以后能更熟练地使用。注意这里我只列了文本操作的快捷键，像别的历史命令查询Ctrl-r和清屏操作Ctrl-l等快捷操作，大家可以参考我写的这篇博客。

02

再谈如何写好技术文档？

参加工作时间久一点的工程师应该有这样一个体会：自己平时代码写得再多再好，可一旦要用文档去描述或者表达某一个事情或者问题时，都感觉非常困难，无从下手，不知道自己该写什么不该写什么；或者费了九牛二虎之力写出来的东西没法满足要求，需要再三去修改调整。这其中的主要原因我归纳有两点：

02

技术文档规范

全角中文字符与半角阿拉伯数字之间，有没有半角空格都可，但必须保证风格统一，不能两种风格混杂。

04

谷歌新作：AI 检测文件内容类型，5ms 即可完成 | 开源日报 No.192

minbpe 是用于 LLM 分词中常用的字节对编码（BPE）算法的最小、干净代码。

01

Golang中的RegExp正则表达式用法指南

------------------------------------------------------------ Golang中的正则表达式 ------------------------------------------------------------ 用法： ------------------------------ 单一： . 匹配任意一个字符，如果设置 s = true，则可以匹配换行符 [字符类]

03

怎么才能写好技术文档？这是我的全部经验

点击上方“芋道源码”，选择“设为星标” 管她前浪，还是后浪？能浪的浪，才是好浪！每天 10:33 更新文章，每天掉亿点点头发... 源码精品专栏原创 | Java 2021 超神之路，很肝~ 中文详细注释的开源项目 RPC 框架 Dubbo 源码解析网络应用框架 Netty 源码解析消息中间件 RocketMQ 源码解析数据库中间件 Sharding-JDBC 和 MyCAT 源码解析作业调度中间件 Elastic-Job 源码解析分布式事务中间件 TCC-Transaction

01

XML文档节点导航与选择指南

XPath使用路径表达式来选择XML文档中的节点或节点集。这些路径表达式类似于在传统计算机文件系统中使用的路径表达式。

00

17:文字排版

17:文字排版查看提交统计提问总时间限制: 1000ms 内存限制: 65536kB描述给一段英文短文，单词之间以空格分隔（每个单词包括其前后紧邻的标点符号）。请将短文重新排版，要求如下：每行不超过80个字符；每个单词居于同一行上；在同一行的单词之间以一个空格分隔；行首和行尾都没有空格。输入第一行是一个整数n，表示英文短文中单词的数目. 其后是n个以空格分隔的英文单词（单词包括其前后紧邻的标点符号，且每个单词长度都不大于40个字母）。输出排版后的多行文本，每行文本字符数最多80个字符，

07

词汇结构

M文档是 Unicode 字符的有序序列。M 允许在 M 文档的不同部分使用不同类别的 Unicode 字符。有关 Unicode 字符类的信息，请参阅The Unicode Standard, Version 3.0 , section 4.5。

01

消息队列面试解析 - 传输协议

传输协议就是应用程序之间对话的语言。设计传输协议，并没有太多规范和要求，只要是通信双方的应用程序都能正确处理这个协议，并且没有歧义即可。

01

一些开发规则

(若有 issue / pull request 一律需附上编号) {type}:{subject (并在50个字内)} #{issue/pull request}

01

【2020HBU天梯赛训练】7-24 估值一亿的AI核心代码【自己未独立完成】

输入首先在第一行给出不超过 10 的正整数 N，随后 N 行，每行给出一句不超过 1000 个字符的、以回车结尾的用户的对话，对话为非空字符串，仅包括字母、数字、空格、可见的半角标点符号。

01

神经机器翻译数据集WMT预处理流程简介

神经机器翻译（Neural Machine Translation，NMT）借助深度神经网络对不同语言的文本进行翻译，本文主要介绍机器翻译数据集WMT16 en-de的预处理过程。

02

SQL命令 CREATE VIEW（一）

CREATE VIEW命令定义视图的内容。定义视图的SELECT语句可以引用多个表，也可以引用其他视图。

02

linux day2:文本查看、操作、统计命令

-n:按照数值从小到大进行排序 -V:字符串中含有数值时，按照数值从小到大排序 -r:逆向排序

01

Linux基础 03 文件查看、操作、统计命令

世界上最遥远的距离就是我在空格前，你在空格后呜呜呜呜~今天学习比较琐碎的文件查看、操作、统计的命令，一共11个！常记常新！

01

字符、字符串和文本的处理之Char类型

.Net Framework中处理字符和字符串的主要有以下这么几个类: (1)、System.Char类一基础字符串处理类 (2)、System.String类一处理不可变的字符串(一经创建,字符

02

从句子里提取出基因名称

"To ascertain whether a pre-existing subset of endoderm progenitors were responsible for generating endoderm cells in EZH2-/- cultures, we used flow cytometry to separate KIT+/CXCR4+ (endoderm primed) and KIT-/CXCR4- (not endoderm primed) EZH2-/- populations and subjected the cells to endoderm differentiation"

03

微调Whisper语音识别模型和加速推理

OpenAI在开源了号称其英文语音辨识能力已达到人类水准的Whisper项目，且它亦支持其它98种语言的自动语音辨识。Whisper所提供的自动语音识与翻译任务，它们能将各种语言的语音变成文本，也能将这些文本翻译成英文。本项目主要的目的是为了对Whisper模型使用Lora进行微调，目前开源了好几个模型，具体可以在openai查看，下面列出了常用的几个模型。另外项目最后还对语音识别加速推理，使用了CTranslate2加速推理，提示一下，加速推理支持直接使用Whisper原模型转换，并不一定需要微调。

02

python初学之一

一、实现一个函数isDuplicate(s),接受一个字符串，判断这个符串是否含有重复的字符，如果有的话函数返回True，没有的话返回False

02

Python中的zhon入门

在处理文本数据时，经常会遇到需要进行字符检测、过滤、分割等操作。而在处理中文文本时，更需要考虑到中文标点的问题。zhon是一个Python库，提供了对中文标点的支持，能够方便地进行相关的操作。本文将介绍zhon库的基本用法，帮助读者快速入门。

03

不坑盒子 - Office和Wps 从此告别繁杂的word操作

这是我昨天晚上刷视频发现的一款word实用工具，很多朋友和我一样，在工作过程中需要对Word文档进行编辑处理，如果想让Word排版更有效率可以试试这款不坑盒子软件，这是一个非常好用的插件工具，专门应用在Word文档中，支持Office跟WPS，用户可以借助工具快速实现排版操作，还支持仿手写功能，简单实用。

03

（一）python3 只需3小时带你轻松入门—— 编程尝试

什么是函数？在编程中，函数和通常数学中的函数概念并不完全相同；编程中的函数更接近于一个写好的工具，在开发某些功能时，所需要到该函数，就把该函数拿过来使用。

01

为什么中文分词比英文分词更难？有哪些常用算法？（附代码）

自然语言处理是使用计算机科学与人工智能技术分析和理解人类语言的一门学科。在人工智能的诸多范畴中，自然语言的理解以其复杂性、多义性成为难度最大也是最有价值的领域之一。

01

天梯赛-L1-064 估值一亿的AI核心代码（20 分)--2019全国CCCC天梯赛L1题解

本文原创首发CSDN，链接 https://blog.csdn.net/qq_41464123/article/details/88926928 ，作者博客https://blog.csdn.net/qq_41464123 ，转载请带上本段文字，尤其是脚本之家、码神岛等平台，谢谢配合。

02

pyhanlp 两种依存句法分类器

HanLP中的基于神经网络的高性能依存句法分析器参考的是14年Chen&Manning的论文（A Fast and Accurate Dependency Parser using Neural Networks），这里还有一个发在了Github的实现程序，其实现语言为Python。除此之外，你还可以参考ljj123zz 的CSDN 一篇博客：blog.csdn.net/ljj123zz/article/details/78834838

04

为什么Python类语法应该不同?

如果您已经使用了任何编程语言很长一段时间，您就会发现您想要的东西跟它原有的是不同的。Python对我来说是真的是这样。如果可以的话，对于Python中很多的我想要改的东西，我有很多的想法。现在我向您讲述其中一个：类定义的语法。

01

SQL 的查询语句

说到查询，我们要回答两个问题：1.查询什么？2.从哪查询？我们可以使用 SQL 的 SELECT 子句来表达要查询什么。使用 FROM 子句来表达从哪查询。

03

学习正则表达式 - 提取和替换 XML 标签

使用 lorem.dita 作为示例 XML 文档，通过正则表达式提取出该文档中的所有 XML 标签，并转换为简单的 XSLT 样式表。可以在 Github 中找到 lorem.dita 文件，地址是https://github.com/michaeljamesfitzgerald/Introducing-Regular-Expressions。为了节省篇幅，节选部分文本作为测试数据。

02

Matlab系列之运算符和标点符号的功能介绍

。就不多讲太多废话了，开始分享今天的内容，对MATLAB的运算符做个介绍，然后再对标点符号进行功能说明。

01

每日一问_01_Python统计文件中每个单词出现的次数

这种任务常见于文本处理、数据分析和文本挖掘领域。通过统计单词出现的次数，可以分析文本的关键词、词频分布等信息，有助于对文本数据进行更深入的分析。

04

webStorm 3.0配置使用主题背景色等

http://www.cnblogs.com/jikey/archive/2012/01/16/2323590.html

01

Unicode中的空格字符一览（翻译）

本文列出了 Unicode 中的各种空格字符。有关说明, 还请参阅 Unicode 标准中的第6章书写系统和标点符号还有Unicode标准中的一般标点符号的区段描述。本文还列出了3个宽度为0的字符, 故可称其为零宽度空格。

00

36. R 数据整理（八： stringr 处理字符串数据）

作为同属于tidyverse 大家庭的一份子，stringr 也为R 的一般字符串处理，献上了一份自己的力量！

03

Url参数中出现+、空格、=、%、&、#等字符的解决办法

Url出现了有+，空格，/，?，%，#，&，=等特殊符号的时候，可能在服务器端无法获得正确的参数值，抑或是造成不能正常下载文件(作为Download Url时候)，如何是好？解决办法：就是需要将这些字

07

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭