我有两个输入读入我的命令提示符,第一个是我正在编写的程序要搜索的一系列单词,第二个是包含单词所在位置的文件。例如,我的命令提示符显示为perl WebScan.pl word WebPage000.htm
现在,我没有问题访问这些输入打印,但我有很大的困难访问网页的内容,所以我可以执行正则表达式,以删除html
我正在尝试编写一个正则表达式,它只打印附加文档中的名字(只打印表格中的数据,我没有使用下面的内容,但最终会用到它)。https://automatetheboringstuff.com/files/examplePhoneEmailDirectory.pdf 以下是我到目前为止拥有的代码: import r
我需要重印符合特定规则的诗行。我一直在使用的规则是,如果一行中有一个单词出现多次,则重新打印该行。
例如,I have to go out with Jane将不会打印。然而,当单词to在该行中重复时,I have to go out to the movies with Jane将打印出来。:\\s+\\1\\b)+',它可以找到重复的单词,但只能是连续的</e