福爆 | 博客升级 .NET Core 3.0 又踩一坑

导语

昨天刚发了一篇《与时俱进 | 博客现已运行在 .NET Core 3.0 及 Azure 上》得瑟,本以为踩完了坑,结果晚上博客又爆了。Azure Application Insights 监控里发现了大量异常。我们来看看我如何收取福爆。

生产大爆炸

发生问题的是已经被删除的博客文章,正常情况下,这些不存在的文章会直接显示自定义的404页面,但实际上产生了500异常。日志如下:

2019-09-26 00:11:50.8405|RD00155DB89A5B|WARN|Moonglade.Web.Controllers.PostController|Post not found, parameter '2014/7/23/my-surface-pro-3-review-system-software'.,GET https://edi.wang/post/2014/7/23/my-surface-pro-3-review-system-software,Slug,66.249.71.135

2019-09-26 00:11:51.1174|RD00155DB89A5B|WARN|Moonglade.Web.Controllers.PostController|Post not found, parameter '2014/7/23/my-surface-pro-3-review-system-software'.,GET https://edi.wang/error,Slug,66.249.71.135

2019-09-26 00:11:51.1174|RD00155DB89A5B|ERROR|Microsoft.AspNetCore.Diagnostics.ExceptionHandlerMiddleware|An unhandled exception has occurred while executing the request.,System.ArgumentException: An item with the same key has already been added. Key: x-pingback

at System.Collections.Generic.Dictionary`2.TryInsert(TKey key, TValue value, InsertionBehavior behavior)

at System.Collections.Generic.Dictionary`2.Add(TKey key, TValue value)

at Microsoft.AspNetCore.HttpSys.Internal.HeaderCollection.Add(String key, StringValues value)

看上去像是个Pingback HTTP头被重复添加的问题。但实际上这个头被添加产生异常的本质原因是请求博客文章的Slug这个Action被执行了两次

重现故障

这个问题在开发时并没有发现,staging环境可以重现,但由于偷懒,没测过exception path,happy path过了就发布了。之所以开发环境 works on my machine 是因为这样一个设定,大部分 ASP.NET Core 程序都会这么做,毕竟是默认模板里的实践:

if (env.IsDevelopment())

{

ListAllRegisteredServices(app);

app.UseDeveloperExceptionPage();

}

else

{

app.UseExceptionHandler("/error");

app.UseStatusCodePagesWithReExecute("/error", "?statusCode={0}");

}

出问题的是 UseStatusCodePagesWithReExecute() 这个中间件。

最终在 GitHub 上找到了一个已知问题:

https://github.com/aspnet/AspNetCore/issues/13715

我用 VS2019 16.3.1 + .NET Core 3.0 正式版建了个测试工程,重现了这个问题。

public IActionResult Index(int id = 0)

{

if (id == 1)

{

return NotFound();

}

return View();

}

[Route("/error")]

[ResponseCache(Duration = 0, Location = ResponseCacheLocation.None, NoStore = true)]

public IActionResult Error(int? statusCode = null)

{

return Content($"Test Error Action: {statusCode}");

}

public void Configure(IApplicationBuilder app, IWebHostEnvironment env)

{

//app.UseStatusCodePages();

//app.UseExceptionHandler("/error");

app.UseStatusCodePagesWithReExecute("/error", "?statusCode={0}");

app.UseHttpsRedirection();

app.UseStaticFiles();

app.UseRouting();

app.UseAuthorization();

app.UseEndpoints(endpoints =>

{

endpoints.MapControllerRoute(

name: "default",

pattern: "{controller=Home}/{action=Index}/{id?}");

});

}

访问 /Home/Index?id=1

id=1的请求成功执行到 NotFound(); 正常情况应该立即执行 /error?statusCode=404,当实际上 Error 这个 Action 根本没有跑进去,而是马上再次执行了 Index,id=0

而因为执行的逻辑是ReExecute,也就是把action的执行结果放到“父”action里输出,所以会触发两次pingback头的添加,导致我博客大爆炸。

复制粘贴 能跑就行

微软并不打算在 3.0 的补丁更新中修复这个问题,而是直接放到了 3.1。好在微软提供了 workaround,所以我们只能先忍几个月。

在 UseRouting() 和 UseStatusCodePagesWithReExecute() 之间加入一段神奇的代码,即可结束福爆。

app.UseStatusCodePagesWithReExecute("/error", "?statusCode={0}");

// Workaround .NET Core 3.0 known bug

// https://github.com/aspnet/AspNetCore/issues/13715

app.Use((context, next) => {

context.SetEndpoint(null);

return next();

});

实在不行 删库跑路 也挺省心

目前 .NET Core 3.0 升级问题多多,资料少少,一不小心就容易领取福报。如果追求刺激和拥抱开源的乐趣,可以像我或者博客园一样直接踩坑。如果追求稳定,不想被公司开除,建议等 3.1 再更新吧~ 毕竟微软拥抱开源以后的产品,.1 才是能用的(早上更新的 VS2019 16.3.1笑而不语)。

原文发布于微信公众号 - 汪宇杰博客(ediwangblog)

原文发表时间:2019-09-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

扫码关注云+社区

领取腾讯云代金券