我需要的是使用Python获取word文件中文本的图像。每个文件的文本长度都会有所不同。如何在不包含文档其余部分空白的情况下检测文本并拍摄屏幕截图或生成该文本的图像?文本可以跨多行。Here is an example of the word file And this is the result I am looking for 我正在编写一个脚本,它读取word文件,截取上面的屏幕截图
字符串是一些非ascii字符,如中文,XXX是字符串的当前编码。>>> u'中文' == '中文'.decode('gbk')//The first one is u'\xd6\xd0\xce\xc4' while the second one u'\我使用的是中文简化的窗口。默认编码是gbk,python也是如此。我得到了两个unicode对象不