有没有人知道可以将Wiki格式的文本作为输入并生成实体树的解析器,就像XML解析器生成实体树一样?为了澄清,我正在寻找一些可以接受文本的内容,比如:
-Intro-
Textual stuff in ''italics''
--Subhead--
Yet more text
并生成一个以Intro为根的树,其中有三个子节点,其中一个(子标题)本身就有一个子节点。我正在寻找能够理解中描述的“简单”维基格式的东西。
我知道有几个用于Wiki文本的词法分析器,但没有树解析器。我在找一些开源的,用C或C++写的东西。
我有很多文本文件需要转换成.xml,以便能够更有效地工作(我应该做几个语言模型来分析英语方言)。
这些文件是这样的:
<I> <IFL-IDN W2C-001 #1:1> <#> <h> <bold> Some Statement that I can edit </bold> <bold> followed by another </bold> </h>
<IFL-IDN W2C-001 #2:1> <p> <#> more and mor
我有一种新的小型编程语言的源代码;
method M(n: int) returns (r: int)
ensures r == n;
{
var i := 0;
while (i < n)
{
i := i + 1;
}
r := i;
}
我想使用Java读取这段代码的源文件(只是一个没有任何依赖关系的文件),并为函数名、输入参数、返回类型、关键字确保等创建XML。
为了做到这一点,我需要分析给定的源代码,可能会创建一种树结构来查看分层视图。(至少我是这么想的)
有没有什么框架可以帮助我自定义关键字,以便分析这种材料并从中生成XML,或者我应该逐行阅
我正在尝试使用lxml来帮助我解析一些XML文件并将其输出。但是,XML文件中有一些特殊字符。我不想替换它,因为它太复杂了,无法摆脱它。另外,我不能强迫其他人生成格式良好的XML。
Python有没有办法让我用lxml处理格式不正确的XML?
我可以正确地读懂它:
parser = etree.XMLParser(recover=True)
root = etree.parse(sys.argv[1],parser=parser)
但是当我想打印元素文本时,它只能打印内容,直到出现特殊字符。
for element in root.iter("content"):
我正在尝试实现谷歌结账与通知Api,因为我想获得并存储在我自己的数据库中的订单信息。谷歌结账是实现,下订单和付款完成,但我无法从谷歌结账的通知。我已经尝试了Google Checkout的商家帐户中的所有设置,在中声明,并完成上述文章中列出的代码,但仍然无法获得通知。在我的Merchant账号的集成控制台中得到的错误是:
我们在尝试访问上的服务器时遇到错误--我们得到的错误是
Send failed with code: 500. Response body was: <html> <head> <title>Data at the root level