首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在Azure Data Factory V1/V2中将具有BOM的UTF-8编码文件转换为没有BOM的UTF-8编码文件?

如何在Azure Data Factory V1/V2中将具有BOM的UTF-8编码文件转换为没有BOM的UTF-8编码文件?
EN

Stack Overflow用户
提问于 2018-08-03 19:28:05
回答 2查看 1.3K关注 0票数 4

我目前有一个V2数据工厂,它将带有物料清单的UTF8编码文件复制到存储位置,我想将物料清单作为标准复制活动的一部分删除。

有没有办法做到这一点?

EN

回答 2

Stack Overflow用户

发布于 2018-08-09 23:36:57

事实证明,这实际上很容易做到。在输出数据集中,如果我们不指定编码数据,那么工厂将默认使用UTF-8,而不添加BOM。以下数据集说明了这一原则:

这是我的输入数据集:

{ "name": "InputBlobs", "properties": { "linkedServiceName": { "referenceName": "AzureStorageLinkedService", "type": "LinkedServiceReference" }, "type": "AzureBlob", "typeProperties": { "format": { "type": "TextFormat", "columnDelimiter": "|", "rowDelimiter": "", "nullValue": "\\N", "encodingName": "UTF-16", "treatEmptyAsNull": true, "skipLineCount": 0, "firstRowAsHeader": false }, "fileName": "", "folderPath": "folder_path" } }, "type": "Microsoft.DataFactory/factories/datasets" }

以下是我的输出数据集:

{ "name": "OutputBlobs", "properties": { "linkedServiceName": { "referenceName": "AzureStorageLinkedService", "type": "LinkedServiceReference" }, "type": "AzureBlob", "typeProperties": { "format": { "type": "TextFormat", "columnDelimiter": "|", "rowDelimiter": "", "nullValue": "\\N", "treatEmptyAsNull": true, "skipLineCount": 0, "firstRowAsHeader": false }, "fileName": "", "folderPath": "another_folder_path" } }, "type": "Microsoft.DataFactory/factories/datasets" }

票数 1
EN

Stack Overflow用户

发布于 2018-08-07 16:29:04

根据我的经验,没有这样的中间件处理机制可以让您在Azure Data Factory Copy activity中删除bom header

但是,我提供了一个变通方法,当文件移到blob存储中时,您可以使用Blob Trigger Azure Function来执行业务逻辑代码。

移除bom示例代码:

代码语言:javascript
运行
复制
public static string RemoveBom(String desc, Encoding encode)
{
    string bomString = encode.GetString(encode.GetPreamble());
    if (!string.IsNullOrEmpty(bomString) && desc.StartsWith(bomString))
    {
        desc = desc.Remove(0, bomString.Length);
    }
    return desc;
}

希望能对你有所帮助。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51671622

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档