我被指派让一个程序自动读取用户的infopath表单并将输入插入到数据库中。此表单包含插入带有相关信息的".xlsx“文件的可能性。当我研究从表单生成的XML文件时,Excel元素如下所示(如果我的研究是正确的,则使用base64编码):
<AttachedExcelFile>x0lGQRQAAA...[9kb of dat
几个月以来,我一直试图规范证交会的文件。然而,我已经意识到,美国-gaap标签每年都有不同的含义。
因此,我现在的目标是从每个us子术语的cal.xml文件中提取父项。举个例子, of the AAPL 2011-09-24:子术语"AccountsPayableCurrent“的母词似乎是"LiabilitiesCurrent”。我想使用pandas.read_xml函数。df