我正在尝试解析来自以下网页的标题:
当我在标题元素上使用apache.commons.lang StringEscapeUtils.escapeHTML方法时,我得到以下结果
Das hermetische Caf�: Rock & Wrestling 2010
然而,当我用utf-8编码在我的网页上显示它时,它只显示一个问号。
使用以下代码:
String title = StringEscapeUtils.escapeHtml(myTitle);
如果我在这个网站上运行标题:,我会得到以下输出,这似乎是正确的
标题:
<title>Das
我正在尝试更改Lightword主题的,只显示标签中的页面标题,而不是通常的"Page title | Blog Title“。
在header模板中,我将标题行更改为:
<title><?php wp_title(''); ?></title>
在服务器上刷新页面后,它仍然显示为"Page Title | Blog Title“。我继续删除整个标题作为测试,只留下<title></title> -但它似乎覆盖了它在可湿性粉剂中,相同的标题格式出来。
最后,我在title标记中添加了一个类似这样的空格(
我正在为Obsidian开发扩展缩短urls (例如bit.ly、t.co等)的插件。他们在Markdown中的描述性更长的版本。要创建适当的标记链接,我需要阅读网页的标题。
然而,我一直遇到一个CORS问题,使我无法获取标题。我看过Cors代理解决方案,但这些免费的解决方案似乎要么是非持久的、不安全的,要么只是为了演示目的。
我的代码是开源的,可以在这里获得:
专门获取网页标题的代码是:
// Helper function to get the title of a web page
export async function getTitle(url:string){
try {