如何更正.NET中“混合”类型的XML序列化和反序列化?

内容来源于 Stack Overflow,并遵循CC BY-SA 3.0许可协议进行翻译与使用

  • 回答 (2)
  • 关注 (0)
  • 查看 (45)

我目前的任务涉及编写一个用于处理HL7 CDA文件的类库。 这些HL7 CDA文件是具有定义的XML模式的XML文件,因此我使用xsd.exe为XML序列化和反序列化生成.NET类。

XML Schema包含各种类型,其中包含mixed =“true”属性,指定此类型的XML节点可能包含与其他XML节点混合的普通文本。其中一种类型 的XML模式的相关部分如下所示:

<xs:complexType name="StrucDoc.Paragraph" mixed="true">
    <xs:sequence>
        <xs:element name="caption" type="StrucDoc.Caption" minOccurs="0"/>
        <xs:choice minOccurs="0" maxOccurs="unbounded">
            <xs:element name="br" type="StrucDoc.Br"/>
            <xs:element name="sub" type="StrucDoc.Sub"/>
            <xs:element name="sup" type="StrucDoc.Sup"/>
            <!-- ...other possible nodes... -->
        </xs:choice>
    </xs:sequence>
    <xs:attribute name="ID" type="xs:ID"/>
    <!-- ...other attributes... -->
</xs:complexType>

这种类型的生成代码如下所示:

/// <remarks/>
[System.CodeDom.Compiler.GeneratedCodeAttribute("xsd", "2.0.50727.3038")]
[System.SerializableAttribute()]
[System.Diagnostics.DebuggerStepThroughAttribute()]
[System.ComponentModel.DesignerCategoryAttribute("code")]
[System.Xml.Serialization.XmlTypeAttribute(TypeName="StrucDoc.Paragraph", Namespace="urn:hl7-org:v3")]
public partial class StrucDocParagraph {

    private StrucDocCaption captionField;

    private object[] itemsField;

    private string[] textField;

    private string idField;

    // ...fields for other attributes...

    /// <remarks/>
    public StrucDocCaption caption {
        get {
            return this.captionField;
        }
        set {
            this.captionField = value;
        }
    }

    /// <remarks/>
    [System.Xml.Serialization.XmlElementAttribute("br", typeof(StrucDocBr))]
    [System.Xml.Serialization.XmlElementAttribute("sub", typeof(StrucDocSub))]
    [System.Xml.Serialization.XmlElementAttribute("sup", typeof(StrucDocSup))]
    // ...other possible nodes...
    public object[] Items {
        get {
            return this.itemsField;
        }
        set {
            this.itemsField = value;
        }
    }

    /// <remarks/>
    [System.Xml.Serialization.XmlTextAttribute()]
    public string[] Text {
        get {
            return this.textField;
        }
        set {
            this.textField = value;
        }
    }

    /// <remarks/>
    [System.Xml.Serialization.XmlAttributeAttribute(DataType="ID")]
    public string ID {
        get {
            return this.idField;
        }
        set {
            this.idField = value;
        }
    }

    // ...properties for other attributes...
}

如果我反序列化一个XML元素,其中的段落节点如下所示:

<paragraph>first line<br /><br />third line</paragraph>

结果是,项目和文本阵列读这样的:

itemsField = new object[]
{
    new StrucDocBr(),
    new StrucDocBr(),
};
textField = new string[]
{
    "first line",
    "third line",
};

从这里,没有办法确定文本和其他节点的确切顺序。

如果我再次序列化,结果看起来像这样:

<paragraph>
    <br />
    <br />first linethird line
</paragraph>

默认序列化程序只是先序列化项目然后再序列化文本。

我尝试IXmlSerializable在StrucDocParagraph类上实现,以便我可以控制内容的反序列化和序列化,但是它相当复杂,因为涉及的类太多,而且我还没有找到解决方案,因为我不知道这些努力回报。

有没有解决这个问题的简单方法,或者甚至可以通过自定义序列化来实现IXmlSerializable?或者我应该使用XmlDocument还是XmlReader/ XmlWriter处理这些文档?

提问于
用户回答回答于

为了解决这个问题,我不得不修改生成的类:

  1. 移动XmlTextAttributeText属性的Items属性及其参数Type = typeof(string)
  2. 删除该Text属性
  3. 删除该textField字段

结果生成的代码(修改)如下所示:

/// <remarks/>
[System.CodeDom.Compiler.GeneratedCodeAttribute("xsd", "2.0.50727.3038")]
[System.SerializableAttribute()]
[System.Diagnostics.DebuggerStepThroughAttribute()]
[System.ComponentModel.DesignerCategoryAttribute("code")]
[System.Xml.Serialization.XmlTypeAttribute(TypeName="StrucDoc.Paragraph", Namespace="urn:hl7-org:v3")]
public partial class StrucDocParagraph {

    private StrucDocCaption captionField;

    private object[] itemsField;

    private string idField;

    // ...fields for other attributes...

    /// <remarks/>
    public StrucDocCaption caption {
        get {
            return this.captionField;
        }
        set {
            this.captionField = value;
        }
    }

    /// <remarks/>
    [System.Xml.Serialization.XmlElementAttribute("br", typeof(StrucDocBr))]
    [System.Xml.Serialization.XmlElementAttribute("sub", typeof(StrucDocSub))]
    [System.Xml.Serialization.XmlElementAttribute("sup", typeof(StrucDocSup))]
    // ...other possible nodes...
    [System.Xml.Serialization.XmlTextAttribute(typeof(string))]
    public object[] Items {
        get {
            return this.itemsField;
        }
        set {
            this.itemsField = value;
        }
    }

    /// <remarks/>
    [System.Xml.Serialization.XmlAttributeAttribute(DataType="ID")]
    public string ID {
        get {
            return this.idField;
        }
        set {
            this.idField = value;
        }
    }

    // ...properties for other attributes...
}

现在如果我反序列化一个XML元素,其中的段落节点如下所示:

<paragraph>first line<br /><br />third line</paragraph>

结果是该项目数组这样写的:

itemsField = new object[]
{
    "first line",
    new StrucDocBr(),
    new StrucDocBr(),
    "third line",
};

正是我需要的,项目的顺序和内容是正确的

如果我再次序列化,结果再次正确:

<paragraph>first line<br /><br />third line</paragraph>

Guillaume的回答是什么使我朝着正确的方向发展,我也认为这一定是可能的。然后在MSDN文档中XmlTextAttribute有这样的内容

可以将XmlTextAttribute应用于返回字符串数组的字段或属性。您也可以将该属性应用于Object类型的数组,但必须将Type属性设置为字符串。在这种情况下,插入到数组中的任何字符串都将被序列化为XML文本。

所以序列化和反序列化工作现在正确,但我不知道是否还有其他副作用。也许无法用xsd.exe从这些类生成模式,但我不需要那样。

用户回答回答于

我遇到了同样的问题,并遇到了更改xsd.exe生成的.cs的解决方案。虽然它确实起作用,但我并不习惯更改生成的代码,因为我需要记得在重新生成类时随时执行它。它还导致了一些笨拙的代码,它必须测试并转换为XmlNode []以用于mailto元素。

我的解决方案是重新思考xsd。我放弃了混合类型的使用,并且基本上定义了我自己的混合类型。

我有这个

XML: <text>some text <mailto>me@email.com</mailto>some more text</text>

<xs:complexType name="text" mixed="true">
    <xs:sequence>
      <xs:element minOccurs="0" maxOccurs="unbounded" name="mailto" type="xs:string" />
    </xs:sequence>
  </xs:complexType>

改为

XML: <mytext><text>some text </text><mailto>me@email.com</mailto><text>some more text</text></mytext>

<xs:complexType name="mytext">
    <xs:sequence>
      <xs:choice minOccurs="0" maxOccurs="unbounded">
        <xs:element name="text">
          <xs:complexType>
            <xs:simpleContent>
              <xs:extension base="xs:string" />
            </xs:simpleContent>
          </xs:complexType>
        </xs:element>
        <xs:element name="mailto">
          <xs:complexType>
            <xs:simpleContent>
              <xs:extension base="xs:string" />
            </xs:simpleContent>
          </xs:complexType>
        </xs:element>
      </xs:choice>
    </xs:sequence>
  </xs:complexType>

我生成的代码现在给我一个myText类:

public partial class myText{

    private object[] itemsField;

    /// <remarks/>
    [System.Xml.Serialization.XmlElementAttribute("mailto", typeof(myTextTextMailto))]
    [System.Xml.Serialization.XmlElementAttribute("text", typeof(myTextText))]
    public object[] Items {
        get {
            return this.itemsField;
        }
        set {
            this.itemsField = value;
        }
    }
}

元素的顺序现在保存在serilization / deserialisation中,但是我必须测试/ cast到/针对类型myTextTextMailto和程序myTextText

扫码关注云+社区