我正在使用Java爬行到MySQL数据库的网页。我得到网页编码,默认为UTF-8,如果找不到,从<meta>标签。characterEncoding=gbk,要存储文本的列为GBK编码。从观察上看,没有GBK字符串会出错。优先选择编码转换的答案。`pages` (
`content` TEXT CHARACTER SET
['ssentence']:在上面的代码中,我试图通过api进行情感分析并将它们存储到list.However中,api只输入GBK因此,它通常会遇到这样的错误:
UnicodeEncodeError: 'gbk' codec can't encode character '\u30fb' in position 14: illegal