首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

解决Python的恼人的encode、decode字符集编码问题

不论是什么编程语言,都免不了涉及到字符集的问题,我们经常在读写本文、获取网页数据等等各类情景下,需要和字符集编码打交道。这几天在公司就遇到了这么一个问题,由于软件需要初始化许多参数信息,所以使用ConfigParser模块进行配置文件的读写操作。本来一切OK,但当把这些.ini配置文件提交到git仓库后,再次下载使用时,默认的utf-8字符集编码,被git默认修改成了gbk编码。导致读取配置文件时默认使用的utf-8编码,最终导致异常报错。那么该如何解决读取文件时的字符集问题呢?Python有专门的字符集检测模块chardet,今天就带大家一起学习下它。

01

【陆勤践行】数据科学家自我修养——一份数据科学的开放课程清单

数据科学家自我修养——一份数据科学的开放课程清单 最近一年以来,大数据这个概念被吹嘘的天花乱坠,仿佛你要是不说大数据就落伍了。继云计算之后,大数据已然成为IT行业的热点。《哈佛商业评论》更是宣称“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。这里我不想重复什么是大数据,什么是数据科学,而是想以个人过去接近2年时间通过MOOC(开放课程)来学习数据科学的实践来给出一份个人建议的数据科学学习之路的课程清单。 数据科学家的自我修养 Drew Conway

08

庞氏骗局、市场操纵——关于区块链的几篇论文的读书笔记

Detecting Ponzi Schemes on Ethereum: Towards Healthier Blockchain Technology讲了庞氏骗局的检测。庞氏骗局是一种早就出现的骗局,它是通过从后来投资者取得的资金,作为“返利”返回给之前的投资者,虚假宣传,让投资者以为一定可以从中获利,而不断给其打钱,但可想而知,一旦发起骗局的人终止了,那么后来加入投资的那些人肯定收不到返利,资金就这样被骗走了。实际也表明,能从中获利的投资者占少部分,大部分参与者的利益是收到严重损害的,而获利最大的就是骗局的发起者。而智能合约由于其自动执行且不可终止,加上账户的匿名性,成为了庞氏骗局的一个很好的栖息地及保护伞。无疑,检测并预警庞氏骗局迫在眉睫。要检测智能庞氏骗局,首先能想到的办法就是可以根据智能合约的源码来手动判断,但这样工作量非常大,也不能实时监控,并且智能合约只需要通过字节码部署,没必要公开其源代码,所以其实以太坊上公开的源代码的合约并不多。所以更好的思路是从字节码入手,通过数据挖掘、机器学习的手段识别并预警智能庞氏骗局。首先,将智能合约的字节码反解成操作码是简单可行的,然后通过操作码的代码特征,如某个词出现的频率,可以判断其是否可能为庞氏骗局。此外,智能庞氏骗局有其独特的账户和交易行为特征,如参与者不多,多次参与,收益随机,大部分投资者没有回报,前期投资者回报次数较多,合约大部分只支付给曾经的投资者,投资次数与收益次数变异很大等,所以可以通过这些特征进行识别。这两个思路结合起来便是智能庞氏骗局的一个识别方法,这一方法无需源代码,在智能合约部署时即可识别庞氏骗局,且实验表明效果较好,有利于相关机构建立监管机制帮助投资者避免损失,帮助区块链技术更好的发展。

02
领券