我有多个zip文件,如下面的示例:
759198298412.zip
----i love you.pdf
----forever and one.txt
----today and tomorrow.docs
48891721241592__5123.zip
----whatever it is.pdf
5717273_616.zip
----igotit.txt
----thank you very much.mp3
我正在尝试创建一个脚本来解压缩zip文件,并将解压缩后的文件重命名为zip文件名。如下所示的输出:
759198298412.pdf
759198298412.txt
我正在尝试将目录中的PDF文件列表转换为txt。然而,目前我只得到新创建的txt中pdf文件的最后一页。文件。
守则:
import os, PyPDF2
import re
for file in os.listdir("Documents/Python/"):
if file.endswith(".pdf"):
fpath=os.path.join("Documents/Python/", file)
pdffileobj=open(fpath,'rb')
pdfrea
我正在将文档从pdf转换为文本。pdfs当前在一个文件夹中,然后在txt转换后保存到另一个文件夹中。我有许多这样的文档,我更喜欢在子文件夹上迭代,并保存到txt文件夹中具有相同名称的子文件夹中,但在添加该层时遇到问题。 我知道我可以使用glob来递归迭代,并为文件列表等做这件事,但不清楚如何将文件保存到新文件夹中。这并不是完全必要的,但会更加方便和高效。 有什么好方法可以做到这一点吗? import os
import io
from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.
背景
我正在用Markdown写几本书。我的文件结构如下:
Description
writing/
Makefile 1. main Makefile (shown below)
book.template 2. pandoc template that uses TITLE
books/
current.txt 3. contains the current b
我试图从python 3中的文件名列表中创建一个随机的文件集。
#!/usr/local/bin/python3
import random
import sys
random.seed()
print("Reading lines from ", sys.argv[1])
linecount = 0
lines = []
with open(sys.argv[1]) as f:
for line in f:
lines.append(line)
filelist = random.sample(lines, 5);
for newfile
我有一个批处理脚本,用来提取PDF信息,然后重命名PDF。
这个脚本对1PDF文件很好,但是我需要在文件夹中直接使用它,其中有很多PDF文件。
那怎么做呢?
脚本需要对每个PDF文件运行,一个一个地运行到最后。一旦PDF文件被重命名为下一个文件,文件将被移动到另一个文件夹中,所以保存在文件夹中的PDF文件需要同样的东西。当文件夹为空时,脚本将退出。
@echo off
setlocal enabledelayedexpansion
set PDF="Renommer_Manuellement.pdf"
set text="Renommer_Manuellement.
我想使用shutil.move()函数将某些匹配某种模式的文件移动到新创建的( python )文件夹中,但该函数似乎只适用于现有文件夹。
例如,我有‘. .txt’,'b.txt','c.txt‘在文件夹'/test',我想使用os.join()在python脚本中创建一个文件夹'/test/b’,并将所有.txt文件移动到文件夹'/test/b‘
import os
import shutil
import glob
files = glob.glob('./*.txt') #assume that we in &
我有两个目录。我在dir_1中有一个python程序,将它们写入dir_1中的一个.txt文件。我本打算在dir_2中创建它们,但当我将它们都移到dir_2中时,python程序并没有写入dir_2中现有的.txt文件,而是在dir_1中创建了一个新的.txt文件并写入其中。我该如何解决这个问题?我对编程和python非常陌生,谷歌搜索也帮不了我,可能是因为我不知道到底要搜索什么。
with open('guest_book.txt', 'w') as file:
while True:
name = input('Please
我创建了这个批处理文件来创建基于文本文件的ZIP文件:
@echo off
set path="C:\Program Files\WinRAR\";%path%
for /f "tokens=1* delims=;" %%a in (list.txt) do (
WinRAR a -afzip "%%a" %%b
pause
cls
)
list.txt文件如下所示:
file1.zip;fileA.pdf fileB.pdf fileC.pdf
file2.zip;fileA.pdf fileB.pdf fileC.
我使用的是python 3,我的代码使用pdfminer将pdf转换为文本。我想将这些文件的输出放到一个新文件夹中。目前,它位于现有的文件夹中,它使用pdfminer从该文件夹转换为.txt。如何将输出重定向到其他文件夹。我现在想把输出放在名为"D:\extracted_text“Code的文件夹中: from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout import
我对cmd不太了解,但是我有一个有很多子文件夹的文件夹X,我需要创建一个cmd来删除这些子文件夹中的所有文件,但只能:
当文件名不在“相似”中时(list.txt -我已将其放在X文件夹中,但可以移动)
和
包含该文件的文件夹的名称中没有字符串(2019)。
在文件list.txt中,我拥有文件的所有文件夹路径(类似于X/folder1/folder2/filename.jpg)。要删除的文件不仅是.jpg。
环顾四周我试过:
@echo off
setlocal enableextensions
set "folder=C:\X"
set "excl
我创建了一个要在不同计算机上使用的Python脚本。我使用os和pyautogui模块,因为对于pyautogui,我在py python脚本所在的文件夹中存储了多个屏幕截图,我还有一个.txt文件,从中获取与脚本相关的信息,并且在每台计算机上应该是不同的。这是脚本中的引用:
os.chdir(r'C:\Users\myusername\Desktop\Script')
p.FAILSAFE = False
# extracts login and password from a txt file, for each user
credentials = open("
我需要从一个网页下载所有特定类型的链接文件,例如pdf,并根据网站结构将它们放在文件夹中。我使用curl和sed一起过滤它来创建下载的urls:
curl http://site/webpage | grep pdf | sort -u | sed 's/html code to exclude//' | sed 's/pdf">.*/pdf/' ~/urllist.txt
我创建文件夹时:
sed -e 's#http.*com/##' | sed -e 's#/.*##' | sed -e '$!N; /
我正尝试在Python脚本中执行批处理命令,只显示PDF文件名。基本上,Python脚本在一个文件夹C:\users\me\desktop\python中,该文件夹应该在桌面上的另一个文件夹(C:\users\me\desktop\some-folder)上执行命令,该文件夹中有包含PDF的子文件夹。
代码如下:
from subprocess import call
import os
for root, dirs, files in os.walk("../some-folder"):
for pdf_file in files:
if pdf_f
希望这是一个非常简单的,但我是一个全新的使用Python3的小项目,并希望一些指导。我有一个超过1000 pdf文件的文件夹,我想提取一些数据。我可以成功地将PDF转换为文本文件并将其保存在脚本目录中,但是我无法弄清楚如何一次为所有PDF运行该文件,并在新文件夹中为每个PDF创建一个输出文件。到目前为止,我拥有的代码如下。
from pdfminer3.layout import LAParams, LTTextBox
from pdfminer3.pdfpage import PDFPage
from pdfminer3.pdfinterp import PDFResourceManager
我正在使用pdfbox将pdf转换为txt,但我在一个文件夹中有多个文件,每个文件需要在不同的txt文件中创建。我的源代码是
public class PDFconversion
{
public static void main(final String[] args) throws IOException,SAXException, TikaException
{
//Assume sample.txt is in your current directory
File file = n
我使用以下代码将一个文件拆分为数百个不同的文件,每个文件有16行。现在,我想要多次运行这段代码,并在单独的文件夹中读取输入文件和写入输出,而不仅仅是在当前文件夹中。现在我以如下方式运行代码:
python split.py < input.txt
但是我想做一些类似的事情:
for i in {1..10}; do python split.py < folder${i}/input.txt ; done
并将这些文件写入相应的文件夹中。我可以从不同的文件夹读取输入文件,但问题是输出文件在我运行命令的目录中被写入和覆盖。我不确定如何在代码中修复这里的with open("
我认为我自己是python的中间用户,而这是一个新用户。在Linux上的IDLE (Python 3.2.3)中测试代码。下面是整个脚本:
Python 3.2.3 (default, Apr 10 2013, 05:29:11)
[GCC 4.6.3] on linux2
Type "copyright", "credits" or "license()" for more information.
==== No Subprocess ====
>>> from os import listdir, getcwd, chd