我正在用golang构建一个网络爬虫应用程序。
下载页面的HTML后,我分离出URL。我看到的URL中包含"#s“,例如"en.wikipedia.org/wiki/Race_condition#Computing".我想去掉"#“后面的所有字符,因为这些字符无论如何都会指向同一个页面。对如何做到这一点有什么建议吗?
发布于 2019-10-29 06:10:10
使用url包:
u, _ := url.Parse("SOME_URL_HERE")
u.Fragment = ""
return u.String()https://stackoverflow.com/questions/58599012
复制相似问题