首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python读取PDF内容

    1,引言 晚上翻看《Python网络数据采集》这本书,看到读取PDF内容的代码,想起来前几天集搜客刚刚发布了一个抓取网页pdf内容的抓取规则,这个规则能够把pdf内容当成html来做网页抓取。神奇之处要归功于Firefox解析PDF的能力,能够把pdf格式转换成html标签,比如,div之类的标签,从而用GooSeeker网页抓取软件像抓普通网页一样抓取结构化内容。 从而产生了一个问题:用Python爬虫的话,能做到什么程度。下面将讲述一个实验过程和源代码。 2,把pdf转换成文本的Python源代码 下面的python源代码,读取pdf文件内容(互联网上的或是本地的),转换成文本,打印出来。这段代码主要用了一个第三方库PDFMiner3K把PDF读成字符串,然后用StringIO转换成文件对象。(源代码下载地址参看文章末尾的GitHub源)

    03

    SAP 新总账中 CodingBlock客户化自定义新字段方法

    CodingBlock客户化自定义新字段 1、Coding Block新字段 财务会计(新)-财务会计基本设置(新)-分类帐-字段-客户字段-编辑编码块(OXK3); 添加字段如图; 该步骤比较耗时,完成后,可查看客户化字段已经创建; 2、安装新字段到新总账汇总表FAGLFLEXT中 财务会计(新)-财务会计基本设置(新)-分类帐-字段-客户字段-包括总计表中的字段(FAGL_GINS); 输入表FAGLFLEXT,修改进入,将自定义字段加入,保存并激活; 该步骤耗时,完成后退出,在初始界面激活汇总表; 使用SE16,检查表FAGLFLEXT和BSEG,发现字段ZZFI已经加入了; 新增补的字段需要更改其记账码和字段状态组的字段状态(可使用事务码:FBKP),才能正常显示和输入,系统默认的状态是为“隐藏”。注意维护的语言,否则可能看不到字段名; 3、为Coding Block新字段定义凭证输入的子屏幕 为了使新增补的字段能在凭证输入时比较方便的输入,使新增的字段能出现在事务OXK3的屏幕中:发票/贷项发票快速输入、总账快速输入、科目分配和预制凭证等; 财务会计(新)-财务会计基本设置(新)-分类帐-字段-客户字段-编辑编码块(OXK3); 选择菜单“环境”,“预备快速输入”进入新的屏幕; 执行完成后,即可在FB50,F-02的屏幕中看到新增字段; 可以通过维护自定义屏幕变式和自定义子屏幕来设置字段出现的位置,路径如下: 财务会计(新)-总账会计核算(新)-业务交易-总账会计过帐-满意-在Enjoy事务中包括客户字段; 财务会计(新)-财务会计基本设置(新)-分类帐-字段-为编码块定义子屏幕(OXK1); 4、为Coding Block新字段维护数据表内容 使用事务SE11创建客户自定义的数据表ZZFI_BB; 点创建后进入表格创建界面,维护参数 创建字段如下; 维护技术设置; 保存后激活;然后可以使用事务SE16直接维护数据表ZZFI_BB的内容; 但对于一般的最终用户来说不会被分配访问数据表的操作权限,因此需要开发人员编写一段ABAP程序以使最终用户能简单方便的维护数据表内容; 5、定义Coding Block新字段的搜索帮助 为了在数据输入时方面的选择输入其数据值(F4),需要为新增补的字段创建搜索帮助;使用事务SE11创建搜索帮助; 点击创建,选择“基本索引帮助”,进入创建搜索帮助界面; 保存并激活; 6、分配搜索帮助给Coding Block新字段 使用事务SE11将创建号的搜索帮助分配给新增补字段; 保存并激活; 7、分配数据检查表给Coding Block新字段 使用事务SE11修改结构CI_COBL; 点修改进入,选中所需要维护的组件ZZFI,点 ,进入搜索帮助及检查视图; 点击按钮选择“外来码”,系统弹出对话框“外来关键词不存在,创建带值表ZZFI_BB的建议作为检查表格?”,选择“是”,接受系统建议; 选择“复制”复制外来码关键字检查表ZZFI_BB;此时可以看到ZZFI_BB已经填入到CheckTable中了; 保存并激活;此时可以使用FB50,F-02试试效果; 8、把方案和客户字段分配到分类帐 财务会计(新)-财务会计基本设置(新)-分类帐-分类帐-把方案和客户字段分配到分类帐 将客户字段ZZFI添加到分类帐OL中,这样表FAGLFLEXT中,就能对字段ZZFI产生一条汇总记录;经过这样设置,可以查询查询针对ZZFI的期初、发生、期末的数据了;

    02

    sap CodingBlock客制化自定义新字段方法

    CodingBlock客户化自定义新字段 1、Coding Block新字段 财务会计(新)-财务会计基本设置(新)-分类帐-字段-客户字段-编辑编码块(OXK3); 添加字段如图; 该步骤比较耗时,完成后,可查看客户化字段已经创建; 2、安装新字段到新总账汇总表FAGLFLEXT中 财务会计(新)-财务会计基本设置(新)-分类帐-字段-客户字段-包括总计表中的字段(FAGL_GINS); 输入表FAGLFLEXT,修改进入,将自定义字段加入,保存并激活; 该步骤耗时,完成后退出,在初始界面激活汇总表; 使用SE16,检查表FAGLFLEXT和BSEG,发现字段ZZFI已经加入了; 新增补的字段需要更改其记账码和字段状态组的字段状态(可使用事务码:FBKP),才能正常显示和输入,系统默认的状态是为“隐藏”。注意维护的语言,否则可能看不到字段名; 3、为Coding Block新字段定义凭证输入的子屏幕 为了使新增补的字段能在凭证输入时比较方便的输入,使新增的字段能出现在事务OXK3的屏幕中:发票/贷项发票快速输入、总账快速输入、科目分配和预制凭证等; 财务会计(新)-财务会计基本设置(新)-分类帐-字段-客户字段-编辑编码块(OXK3); 选择菜单“环境”,“预备快速输入”进入新的屏幕; 执行完成后,即可在FB50,F-02的屏幕中看到新增字段; 可以通过维护自定义屏幕变式和自定义子屏幕来设置字段出现的位置,路径如下: 财务会计(新)-总账会计核算(新)-业务交易-总账会计过帐-满意-在Enjoy事务中包括客户字段; 财务会计(新)-财务会计基本设置(新)-分类帐-字段-为编码块定义子屏幕(OXK1); 4、为Coding Block新字段维护数据表内容 使用事务SE11创建客户自定义的数据表ZZFI_BB; 点创建后进入表格创建界面,维护参数 创建字段如下; 维护技术设置; 保存后激活;然后可以使用事务SE16直接维护数据表ZZFI_BB的内容; 但对于一般的最终用户来说不会被分配访问数据表的操作权限,因此需要开发人员编写一段ABAP程序以使最终用户能简单方便的维护数据表内容; 5、定义Coding Block新字段的搜索帮助 为了在数据输入时方面的选择输入其数据值(F4),需要为新增补的字段创建搜索帮助;使用事务SE11创建搜索帮助; 点击创建,选择“基本索引帮助”,进入创建搜索帮助界面; 保存并激活; 6、分配搜索帮助给Coding Block新字段 使用事务SE11将创建号的搜索帮助分配给新增补字段; 保存并激活; 7、分配数据检查表给Coding Block新字段 使用事务SE11修改结构CI_COBL; 点修改进入,选中所需要维护的组件ZZFI,点 ,进入搜索帮助及检查视图; 点击按钮选择“外来码”,系统弹出对话框“外来关键词不存在,创建带值表ZZFI_BB的建议作为检查表格?”,选择“是”,接受系统建议; 选择“复制”复制外来码关键字检查表ZZFI_BB;此时可以看到ZZFI_BB已经填入到CheckTable中了; 保存并激活;此时可以使用FB50,F-02试试效果; 8、把方案和客户字段分配到分类帐 财务会计(新)-财务会计基本设置(新)-分类帐-分类帐-把方案和客户字段分配到分类帐 将客户字段ZZFI添加到分类帐OL中,这样表FAGLFLEXT中,就能对字段ZZFI产生一条汇总记录;经过这样设置,可以查询查询针对ZZFI的期初、发生、期末的数据了;

    02

    美众议院提案禁止政府采购中企视频监控设备,海康威视回应

    ---- 新智元报道 来源:彭博、央视、海康威视 编辑:克雷格 【新智元导读】美国众议院24日通过一项议案,其中包括一项增补提案,建议禁止美国联邦政府采购海康威视、大华等中国制造商供应的视频监控设备。海康威视今天回应称,提案没有事实依据和证据。 据彭博报道,周四,美国众议院投票通过一项议案,禁止政府机构使用中兴通讯制造的技术,并禁止国防部与与中国公司合作的供应商续签合同。同时还包括一项增补提案,建议以国家安全为由禁止美国联邦政府采购某些中国制造的视频监控设备。 议案提及到的几家中国公司包括海能达通信

    03
    领券