我正在学习BeautifulSoup,发现了许多"html2text“解决方案,但我正在寻找的解决方案应该模仿格式:
<ul>
<li>One</li>
<li>Two</li>
</ul>
会变成
* One
* Two
和
Some text
<blockquote>
More magnificent text here
</blockquote>
Final text
至
Some text
More magnificent text here
Final text
我在看
我正在寻找一种好的方法来标记基于不同条件表达式的10k+事务,因为这将需要大量的时间来手动完成所有事情。
例如,如果事务的名称包含"Shell“,则标签将为"Transport”;如果名称包含"restaurant“,则标签将为"Food”。
一种可能是创建一个for循环,但这将在一段时间后变得一团糟。它看起来像这样:
for i in df_transactions.index:
if 'Shell' in df_transactions['Name'][i]:
df_transactions['