我已经下载了一本pdf格式的在线书籍,并想在我的ios项目中使用这本书。所需的格式为xml格式。question and there may be a blank line above我曾尝试使用word/pages将pdf转换为txt,并逐行阅读文本,但我无法识别问题和答案。另一个问题是,当我进行转换时,pdf的自动换行转换为换行符。pdf转换为正确的
Hi一直在玩一个简单的程序,读取文本和识别的关键字,其中的初始字母是大写的。我的问题是,这个程序不会从文字中删除标点符号,我的意思是佛罗多·弗罗多。佛罗多,是作为不同的条目,而不是相同的。再次感谢with open ('novel.txt') as f: for word in line.strip().split(): if word<