我有一个pdf,看起来是这样的:
我想把编号的项目提取到字典里:
output = {'01': 'Agriculture and related service activities',
'011': 'Growing crops, market gardening and horticulture'...}
目前,我正在使用tika从pdf中提取文本。但是我现在需要一个regex表达式来从内容中提取编号的项。我该怎么做?
from tika import parser
raw = parser.fro
我正在使用SQLite进行培训,并试图获得与在美国农业部实现的搜索结果相同的结果。
在中,如果我搜索“鸡胸烤熟”的搜索结果,就会得到56个结果。我搞不懂这个模式。如果我使用以下查询,则使用与它们相同的数据库:
SELECT *
FROM FOODDATA
WHERE FOODDES LIKE '%chicken%' OR FOODDES LIKE '%breast%' OR FOODDES LIKE '%cooked%' OR FOODDES LIKE '%roasted%';
它给了我2000多个结果。对我来说这是有道理的