专栏首页汪宇杰博客译 | .NET Core 3.0 对诊断的改进

译 | .NET Core 3.0 对诊断的改进

原文:Sourabh Shirhatti

翻译:Edi Wang

在 .NET Core 3.0 中,我们将引入一套工具,这些工具利用 .NET 运行时中的新功能,使诊断和解决性能问题变得更加容易。

这些运行时功能可帮助您回答一些常见的诊断问题:

  • 我的应用程序是否正常?
  • 为什么我的应用程序有异常行为?
  • 为什么我的应用程序崩溃?

我的应用程序是否正常?

通常,应用程序可能会缓慢地开始泄漏内存,并最终导致内存不足异常。其他时候,某些有问题的代码路径可能会导致 CPU 利用率激增。这些只是您可以主动根据 Metrics(指标)识别出的一类问题。

Metrics(指标)

指标是时间间隔内数据度量的表示形式。指标(或时间序列)数据允许您在高级别上观察系统的状态。与 Windows 上的 .NET Framework不同,.NET Core不会产生 perf 计数器。相反,我们引入了一种通过EventCounter API 在 .NET Core 中发出指标的新方法。

EventCounter提供了对 Windows perf 计数器的改进,因为这些计数器现在可用于支持 .NET Core 的所有操作系统。此外,与 perf 计数器不同,它们也可用于低特权环境 (如 xcopy 部署) 。遗憾的是,缺少性能监视器 (perfmon) 这样的工具,因此很难实时使用这些指标。

dotnet-counters

在 3.0-preview5 中,我们将引入一种新的命令行工具,用于实时观察 .NET Core应用程序发出的指标。

您可以通过运行以下命令来安装此 .NET 全局工具。

dotnet tool install --global dotnet-counters --version 1.0.3-preview5.19251.2

在下面的示例中,我们看到当我们将负载生成器指向 Web 应用程序时,应用程序的 CPU 利用率和工作集内存跳转。

(译者注:由于平台限制,无法嵌入视频,请阅读原文查看以上工具的屏幕录像)

有关如何使用此工具的详细说明,请查看 dotnet-counter readme (https://github.com/dotnet/diagnostics/blob/master/documentation/dotnet-counters-instructions.md)。

有关dotnet-counter的已知限制,请查看 GitHub 上的未解决的问题(https://github.com/dotnet/diagnostics/issues?q=is%3Aopen+is%3Aissue+label%3Adotnet-counters)。

为什么我的应用程序有异常行为?

虽然指标有助于识别异常行为的发生,但它们对出错的原因几乎无法了解。要回答应用程序为何出现异常行为的问题,您需要通过跟踪(traces)收集其他信息。例如,通过跟踪收集的 CPU 配置文件可以帮助您识别代码中的热点路径。

Tracing (跟踪)

跟踪是不可变离散事件的时戳记录。跟踪包含本地上下文,允许您更好地推断系统的命运。传统上,.NET Framework (以及ASP.NET等框架)通过 Windows 事件跟踪 (ETW) 发出有关其内部的诊断跟踪。在 .NET Core中,这些跟踪写入了 Windows 上的 ETW 和 Linux 上的 LTTng。

dotnet-trace

在 3.0-preview5 中,每个 .NET Core 应用程序都会打开一个名为 EventPipe 的双工管道(Windows 上的Unix域套接字*nix/named管道),它可以在其上发出事件。当我们仍在研究控制器协议时,dotnet-trace实现了此协议的预览版本。

您可以通过运行以下命令来安装此 .NET 全局工具:

dotnet tool install --global dotnet-trace--version 1.0.3-preview5.19251.2

(译者注:由于平台限制,无法嵌入视频,请阅读原文查看以上工具的屏幕录像)

在上面的示例中,我使用启用 CPU 探查器事件和 .NET 运行时事件的默认配置文件运行 dotnet-trace。

除了默认事件之外,还可以根据尝试执行的调查启用其他提供程序。

因为运行了 dotnet-trace,您会得到一个 .netperf 文件。此文件包含运行时事件和可按视图可视化的采样 CPU 堆栈。Visual Studio (16.1) 的下一次更新还将添加对这些跟踪可视化的支持。

如果在捕获跟踪时在 OS X 或 Linux 上运行,则可以选择将这些 .netperf 文件转换为 .speedscope.json 文件,这些文件可以通过 Speedscope.app 进行可视化。

您可以通过运行以下命令来转换现有跟踪文件:

dotnet trace convert <input-netperf-file>

下面的冰柱图可视化了我们刚刚在speedscope里捕获的追踪:

有关如何使用此工具的详细说明,请查看 dotnet-trace readme(https://github.com/dotnet/diagnostics/blob/master/documentation/dotnet-trace-instructions.md)。有关dotnet-trace的已知限制,请查看 GitHub 上的未解决问题(https://github.com/dotnet/diagnostics/issues?q=is%3Aopen+is%3Aissue+label%3Adotnet-trace)。

为什么我的应用程序会爆?

在某些情况下,仅通过跟踪进程就无法确定导致异常行为的原因。如果进程崩溃或可能需要更多信息(如访问整个流程堆)的情况,则进程转储可能更适合分析。

转储分析(Dump Analysis)

转储是进程意外终止时通常捕获的进程的工作虚拟内存状态的记录。诊断核心转储文件通常用于识别应用程序崩溃或意外行为的原因。

传统上,您依靠操作系统在应用程序崩溃(例如Windows 错误报告)时捕获转储,或者使用 procdump 等工具在满足某些触发条件时捕获转储。

到目前为止,在 Linux 上使用 .NET 捕获转储的挑战是使用 gcore 或调试器捕获转储,导致转储非常大,因为现有工具不知道在 .NET Core 进程中要修剪哪些虚拟内存页。

此外,即使收集了这些转储,也难以分析这些转储,因为它需要获取调试器并将其配置为加载 sos,这是 .NET 的调试器扩展。

dotnet-dump

3.0.0-preview5中,我们引入了一个新的工具,允许您捕获和分析 Windows 和 Linux 上的进程转储。

dotnet-dump 仍处于活跃开发状态,下表显示了当前在哪些操作系统上支持的功能。

您可以通过运行以下命令来安装此 .NET 全局工具:

dotnet tool install --global dotnet-dump --version 1.0.3-preview5.19251.2

安装 dotnet-dump后,可以通过运行以下命令来捕获进程转储:

sudo $HOME/.dotnet/tools/dotnet-dump collect -p <pid>

在 Linux 上,可以通过运行以下命令加载生成的转储来分析生成的转储:

dotnet dump analyze <dump-name>

在下面的示例中,我尝试通过遍历堆来确定已崩溃转储ASP.NET Core托管环境。

(译者注:由于平台限制,无法嵌入视频,请阅读原文查看以上工具的屏幕录像)

结尾

感谢您在 .NET Core 3.0 中尝试新的诊断工具。请继续向我们提供反馈,无论是在评论中还是在 GitHub 上。我们正在认真倾听,并将继续根据您的反馈进行更改。

本文分享自微信公众号 - 汪宇杰博客(ediwangblog),作者:汪宇杰

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-06-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • UWP应用中自定义亚克力材质

    Windows 10 秋季更新(Build 16299)中引入了亚克力材质,这是一种类似于Windows 7窗口磨砂玻璃效果的Brush。

    Edi Wang
  • 使用 Azure 部署 Ontology 区块链开发测试服务器

    学习区块链开发首先需要一个开发测试环境,然而像我这样的只会拖控件和点鼠标的 .NET 程序员想要配一个完全陌生的 ont 区块链测试环境肯定会996进ICU。好...

    Edi Wang
  • 微软热门开源项目及代码库地址

    非常流行的跨平台代码编辑器,提供全面的编辑和调试支持、可扩展性模型以及与现有工具的轻量级集成。

    Edi Wang
  • sklearn调包侠之PCA降维

    PCA(主成分分析),它是一种维度约减算法,即把高维度数据在损失最小的情况下转换为低纬度数据的算法。

    罗罗攀
  • 腾讯优图贾佳亚:重点探索自动驾驶;AI语言可提升空间太大

    作为腾讯优图实验室负责人、杰出科学家,贾佳亚在腾讯全球数字生态大会上,介绍了一系列最新成绩和思考。

    量子位
  • Tars-C++ 揭秘篇:文件描述符处理“套路”

    本章总结Tars中对文件描述符进行操作时的一些“套路”的做法,偏重异常时候的处理。这些处理方式在任何RPC框架中都是值得考虑的

    路小饭
  • 高性能网络通信框架Netty-Netty客户端底层与Java NIO对应关系

    在讲解Netty客户端程序时候我们提到指定NioSocketChannel用于创建客户端NIO套接字通道的实例,下面我们来看NioSocketChannel是如...

    加多
  • 利用ms17_010开启3389端口

    当nmap或其他工具发现目标及上有445端口开启,可以考虑检测是否存在永恒之蓝,使用msf中的永恒之蓝检测模块

    字节脉搏实验室
  • 10个实用的但偏执的Java编程技术

    在沉浸于编码一段时间以后(比如说我已经投入近20年左右的时间在程序上了),你会渐渐对这些东西习以为常。因为,你知道的……任何事情有可能出错,没错,的确如此。 这...

    程序员互动联盟
  • 一周极客热文:微软将推新编程语言M#:系统编程级别的C#

    据国外媒体VB报道,微软正在开发一款新的编程语言:M# 。它在C#的基础上添加了系统编程特性,可用来构建各种类型的应用,尤其是云计算应用。 微软员工Joe Du...

    钱曙光

扫码关注云+社区

领取腾讯云代金券