因此,我有一个由数千条记录组成的数据帧,这些记录是我从.csv导入的。数据帧中的一个变量是从词典派生的自由文本字段。数据行的格式如下。three months", "6 months"),
c("24th december ", "2th january 2019", "25th january 2019") 基本上,我感兴趣的是从第一组引号中取出字符串,然后删除其余的,所以: c("9th november 2018&q
我用漂亮汤从a标签中提取出所有的but,但是其中一些引用开始时像"/videos.com“,而不是”www.范本/视频网站“,它们没有域名。所以,我要做的是从a标记中提取所有的hrefers,但是我想测试它是否以"/“开头,如果是这样,我将添加域"www.example.com”。starts with '/':
link = domain_name + a['href']