AI 创作日记 | 提示工程进阶，让DeepSeek输出结构化数据语法的探索

原创

叶一一

发布于 2025-03-19 13:57:59

3500

代码可运行

文章被收录于专栏：AI 创作日记AI 创作日记

运行总次数：0

代码可运行

一、引言

在当今数字化浪潮的推动下，新零售企业正经历着前所未有的变革。海量的数据成为了企业发展的核心驱动力，如何从这些数据中提取有价值的信息，成为了企业提升竞争力的关键。自然语言处理（NLP）技术的发展为这一问题提供了有效的解决方案，而大语言模型如 DeepSeek 更是展现出了强大的语言理解和生成能力。

然而，在实际应用中，仅仅让 DeepSeek 输出自然语言文本往往无法满足新零售企业的需求。企业更希望能够获取结构化的数据，例如商品信息、订单详情、客户反馈等，以便进行后续的数据分析和业务决策。提示工程作为一种引导大语言模型输出特定格式数据的技术，成为了实现这一目标的关键。

本文将深入探讨提示工程的进阶技巧，介绍让 DeepSeek 输出结构化数据的魔法语法，并结合新零售企业的实际业务场景进行详细阐述。

二、结构化数据的新零售价值

2.1 对结构化数据的需求

2.1.1 商品管理

在新零售企业中，商品管理是一项核心业务。企业需要对商品的基本信息（如名称、价格、规格、库存等）、销售数据（如销量、销售额、销售趋势等）进行实时监控和分析。结构化的商品数据可以帮助企业更好地进行商品分类、定价、促销等决策，提高商品管理的效率和精准度。

2.1.2 订单处理

订单处理涉及到订单的创建、支付、发货、配送等多个环节。企业需要获取订单的详细信息，包括订单编号、客户信息、商品明细、订单状态等，以便及时处理订单、跟踪物流、提供售后服务。结构化的订单数据可以实现订单信息的自动化处理和流转，提高订单处理的速度和准确性。

2.1.3 客户分析

了解客户的需求和行为是新零售企业开展精准营销的基础。企业需要收集客户的基本信息（如姓名、年龄、性别、地域等）、购买历史、浏览记录、评价反馈等数据，并进行分析和挖掘。结构化的客户数据可以帮助企业构建客户画像，实现个性化推荐、精准营销，提高客户满意度和忠诚度。

2.1.4 供应链管理

供应链管理涉及到供应商选择、采购、生产、物流等多个环节。企业需要获取供应链各环节的相关数据，如供应商信息、采购数量、生产进度、物流状态等，以便优化供应链流程、降低成本、提高供应效率。结构化的供应链数据可以实现供应链信息的实时共享和协同，提高供应链的透明度和灵活性。

2.2 技术挑战

三、提示工程基础

提示工程是指通过设计合适的输入提示，引导大语言模型输出满足特定需求的文本。在提示工程中，提示的设计至关重要，它直接影响到模型的输出结果。一个好的提示应该清晰、明确、简洁，能够准确传达用户的需求。常见的提示设计技巧包括：

明确任务描述：在提示中明确指出需要模型完成的任务，例如“提取商品信息”、“生成订单报告”等。
提供示例：为模型提供一些示例数据，帮助模型更好地理解输出的格式和要求。
使用约束条件：在提示中使用一些约束条件，如数据类型、长度限制等，确保模型输出的数据符合要求。

四、让 DeepSeek 输出结构化数据

4.1 结构化数据生成流程

4.2 结构化数据生成语句

4.2.1 JSON 格式输出

JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，具有简洁、易读、易于解析的特点，广泛应用于数据传输和存储。通过在提示中指定输出为 JSON 格式，可以让 DeepSeek 输出结构化的数据。

代码示例：

# 让 DeepSeek 输出 JSON 格式的商品信息
prompt = """
请提取以下文本中的商品信息，并以 JSON 格式输出：
“这款苹果手机，售价 5999 元，内存 128GB，颜色为黑色。”

{
"name": "苹果手机",
"price": 5999,
"memory": "128GB",
"color": "黑色"
}
"""

# 调用 DeepSeek 模型
output = deepseek_api(prompt)

# 解析输出结果
try:
    result = json.loads(output)
    print(result)
except json.JSONDecodeError:
    print("输出结果不是有效的 JSON 格式。")

代码说明：

prompt 是输入给 DeepSeek 模型的提示，其中包含了任务描述（提取商品信息并以 JSON 格式输出）和示例数据。
deepseek_api 是调用 DeepSeek 模型的函数，用于获取模型的输出结果。
json.loads 函数用于将输出结果解析为 JSON 对象，如果解析失败，则输出错误信息。

4.2.2 CSV 格式输出

CSV（Comma-Separated Values）是一种常见的文本文件格式，用于存储表格数据。通过在提示中指定输出为 CSV 格式，可以让 DeepSeek 输出结构化的表格数据。

代码示例：

# 让 DeepSeek 输出 CSV 格式的订单信息
prompt = """
请提取以下文本中的订单信息，并以 CSV 格式输出，表头为“订单编号,客户姓名,商品名称,数量,价格”：
“订单编号：001，客户姓名：张三，购买了 2 件 T 恤，每件价格 50 元。”

订单编号,客户姓名,商品名称,数量,价格
001,张三,T 恤,2,50
"""

# 调用 DeepSeek 模型
output = deepseek_api(prompt)

# 解析输出结果
lines = output.strip().split('\n')
header = lines[0].split(',')
data = [line.split(',') for line in lines[1:]]
print("表头：", header)
print("数据：", data)

代码说明：

prompt 是输入给 DeepSeek 模型的提示，其中包含了任务描述（提取订单信息并以 CSV 格式输出）、表头信息和示例数据。
deepseek_api 是调用 DeepSeek 模型的函数，用于获取模型的输出结果。
通过 split 函数将输出结果按行和逗号进行分割，分别提取表头和数据。

4.2.3 XML 格式输出

XML（eXtensible Markup Language）是一种可扩展的标记语言，用于存储和传输数据。通过在提示中指定输出为 XML 格式，可以让 DeepSeek 输出结构化的层次数据。

代码示例：

# 让 DeepSeek 输出 XML 格式的客户反馈信息
prompt = """
请提取以下文本中的客户反馈信息，并以 XML 格式输出：
“客户反馈这款产品的质量很好，但是价格有点高。”

<feedback>
    <product>产品</product>
    <comment>质量很好，但是价格有点高</comment>
</feedback>
"""

# 调用 DeepSeek 模型
output = deepseek_api(prompt)

# 解析输出结果
try:
    root = ET.fromstring(output)
    product = root.find('product').text
    comment = root.find('comment').text
    print("产品：", product)
    print("反馈：", comment)
except ET.ParseError:
    print("输出结果不是有效的 XML 格式。")

代码说明：

prompt 是输入给 DeepSeek 模型的提示，其中包含了任务描述（提取客户反馈信息并以 XML 格式输出）和示例数据。
deepseek_api 是调用 DeepSeek 模型的函数，用于获取模型的输出结果。
ET.fromstring 函数用于将输出结果解析为 XML 树，如果解析失败，则输出错误信息。通过 find 方法可以提取 XML 树中的节点信息。

五、新零售企业实际业务场景应用案例

5.1 商品信息提取

在新零售企业的商品管理系统中，需要从各种渠道收集商品信息，如商品描述、产品说明书等。通过使用提示工程的魔法语法，可以让 DeepSeek 自动提取商品的关键信息，并以结构化的格式输出。

示例场景

假设企业收到了一份商品描述：“这款智能手表，品牌是华为，型号为 GT3，售价 1299 元，支持心率监测和睡眠监测功能。”

提示设计

请提取以下文本中的商品信息，并以 JSON 格式输出：
“这款智能手表，品牌是华为，型号为 GT5，售价 2088 元，支持情绪健康和睡眠监测功能。”
{
  "name": "智能手表",
  "brand": "华为",
  "model": "GT5",
  "price": 2088,
  "features": ["情绪健康", "睡眠监测"]
}

输出结果

{
  "name": "智能手表",
  "brand": "华为",
  "model": "GT5",
  "price": 2088,
  "features": ["情绪健康", "睡眠监测"]
}

5.2 订单信息处理

在新零售企业的订单处理系统中，需要对订单信息进行实时处理和分析。通过使用提示工程的魔法语法，可以让 DeepSeek 自动提取订单的关键信息，并以结构化的格式输出，方便后续的处理和存储。

示例场景

假设企业收到了一份订单信息：“订单编号：002，客户姓名：李四，购买了 3 双运动鞋，每双价格 300 元，收货地址为北京市朝阳区。”

提示设计

请提取以下文本中的订单信息，并以 CSV 格式输出，表头为“订单编号,客户姓名,商品名称,数量,单价,收货地址”：
“订单编号：002，客户姓名：李四，购买了 3 双运动鞋，每双价格 300 元，收货地址为北京市朝阳区。”

订单编号,客户姓名,商品名称,数量,单价,收货地址
002,李四,运动鞋,3,300,北京市朝阳区

输出结果

订单编号,客户姓名,商品名称,数量,单价,收货地址
002,李四,运动鞋,3,300,北京市朝阳区

5.3 客户反馈分析

在新零售企业的客户服务系统中，需要对客户的反馈信息进行分析和处理。通过使用提示工程的魔法语法，可以让 DeepSeek 自动提取客户反馈的关键信息，并以结构化的格式输出，方便企业了解客户的需求和意见。

示例场景

假设企业收到了一条客户反馈：“我买的这件衣服颜色很正，但是尺码有点小，希望能换大一号。”

提示设计

请提取以下文本中的客户反馈信息，并以 XML 格式输出：
“我买的这件衣服颜色很正，但是尺码有点小，希望能换大一号。”

<feedback>
    <product>衣服</product>
    <positive>颜色很正</positive>
    <negative>尺码有点小</negative>
    <request>换大一号</request>
</feedback>

输出结果

<feedback>
    <product>衣服</product>
    <positive>颜色很正</positive>
    <negative>尺码有点小</negative>
    <request>换大一号</request>
</feedback>

六、提示工程进阶技巧

6.1 多轮对话优化

在实际应用中，有时需要通过多轮对话来获取更准确的结构化数据。例如，当模型输出的结果不符合要求时，可以通过追问的方式让模型进行修正。

代码示例：

# 多轮对话优化
prompt = """
请提取以下文本中的商品信息，并以 JSON 格式输出：
“这款平板电脑，价格大概 2000 元左右。”

{
"name": "平板电脑",
"price": 2000
}
"""

# 第一轮对话
output = deepseek_api(prompt)

try:
    result = json.loads(output)
    if "price" not in result:
        # 追问
        follow_up_prompt = f"你输出的结果中缺少价格信息，请重新提取并以 JSON 格式输出。原文本：“这款平板电脑，价格大概 2000 元左右。”"
        output = deepseek_api(follow_up_prompt)
        result = json.loads(output)
    print(result)
except json.JSONDecodeError:
    print("输出结果不是有效的 JSON 格式。")

代码说明：

首先进行第一轮对话，获取模型的输出结果。
如果输出结果中缺少关键信息（如价格），则进行追问，重新获取模型的输出结果。
最后将输出结果解析为 JSON 对象并输出。

6.2 上下文信息利用

在提示中提供更多的上下文信息可以帮助模型更好地理解任务和输出更准确的结果。例如，在提取商品信息时，可以提供商品的类别、品牌等上下文信息。

代码示例：

# 上下文信息利用
context = "这是一款华为品牌的电子产品。"
text = "这款产品售价 3999 元。"
prompt = f"""
根据上下文信息，提取以下文本中的商品信息，并以 JSON 格式输出：
上下文：{context}
文本：{text}

{
"name": "电子产品",
"brand": "华为",
"price": 3999
}
"""

# 调用 DeepSeek 模型
output = deepseek_api(prompt)

# 解析输出结果
try:
    result = json.loads(output)
    print(result)
except json.JSONDecodeError:
    print("输出结果不是有效的 JSON 格式。")

代码说明：

context 是提供的上下文信息，text 是需要提取信息的文本。
在提示中同时提供上下文信息和文本，让模型根据上下文信息进行更准确的信息提取。
最后将输出结果解析为 JSON 对象并输出。

6.3 错误处理与反馈

在实际应用中，模型可能会输出不符合要求的结果。因此，需要对模型的输出进行错误处理，并将反馈信息提供给模型，帮助模型进行学习和改进。

代码示例：

# 错误处理与反馈
prompt = """
请提取以下文本中的商品信息，并以 JSON 格式输出：
“这款相机，价格 4999 元。”

{
"name": "相机",
"price": 4999
}
"""

# 调用 DeepSeek 模型
output = deepseek_api(prompt)

try:
    result = json.loads(output)
    if "name" not in result or "price" not in result:
        # 反馈错误信息
        feedback = f"你输出的结果缺少必要信息，请重新提取并以 JSON 格式输出。原文本：“这款相机，价格 4999 元。”"
        prompt = feedback
        output = deepseek_api(prompt)
        result = json.loads(output)
    print(result)
except json.JSONDecodeError:
    print("输出结果不是有效的 JSON 格式。")

代码说明：

首先进行正常的信息提取操作，获取模型的输出结果。
如果输出结果缺少必要信息，则将错误反馈信息作为新的提示输入给模型，让模型重新进行信息提取。
最后将输出结果解析为 JSON 对象并输出。

七、结语

本文深入探讨了提示工程的进阶技巧，介绍了让 DeepSeek 输出结构化数据的流程及语法，语法包括 JSON、CSV 和 XML 格式输出。通过结合新零售企业的实际业务场景，展示了如何利用这些魔法语法解决商品信息提取、订单信息处理、客户反馈分析等问题。同时，还介绍了提示工程的进阶技巧，如多轮对话优化、上下文信息利用和错误处理与反馈，帮助读者更好地应用提示工程技术。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

腾讯技术创作特训营S12#AI进化论

项目实战

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

登录后参与评论

0 条评论

热度