我正在尝试找到一个away来从在PHP字段中输入的URL中提取站点标题。例如,如果用户要输入URL ,我会希望输入“纽约时报”或“纽约时报”或类似的内容。我知道提取窗口的标题是相当容易的…例如,我链接的URL的标题是"Yankees 7,Phillies 3- Back on Top...“,但这正是我不想要的。
为了澄清,这是为了将来源添加到报价。
我用python编写了一个脚本,从网页中抓取一些位于b标记中的杂乱无章的内容以及它们的next_sibling。问题是,我的脚本失败时,行之间。我正在尝试从从title到Keywords:之前的页面中提取CHIEF COMPLAINT: Bright red blood per rectum及其相关的description。到目前为止,我已经尝试过:from bs4 import BeautifulSoup