我主要感兴趣的是创造性的东西,但也感兴趣的科学背后的观众和营销的一种媒体。考虑在数据科学上有一个稳定的职业生涯,你认为我应该从哪里开始?媒体分析和商业智能一样大吗?我查看了在线课程,比如谷歌分析学院( google analytics academy )和其他类似的课程:
https://www.edx.org/xseries/data-science-analytics-context
https://www.coursera.org/specializations/jhudatascience
这是正确的道路吗?即使这个人是编程初学者,也很容易在这样的领域找到工作吗?
我需要在我的熊猫数据框架上对分类变量进行一个热编码。
我的数据集非常大,超过2000年的产品is 是一个热编码。
我试过pd.get_dummies,它总是崩溃。
我也尝试了科学工具包-学习的OneHotEncoder,也崩溃了!(它可以很好地处理较小的dataframe子集)
还有什么其他方法吗?对于非常大的数据集来说,对一个热门的分类变量进行编码的最有效的方法是什么?
我的数据框架:
Month User ProductID
1 A ProdA
3 A ProdB
11 A ProdC
12 A
我的网络工程师说,我是一个集群的一部分,其中两个apache应用服务器(每个512 g RAM)每个Tomcat有142个实例(我的公司代表每台带有2G RAM的6个实例)。这似乎是很多,我的延迟问题随着时间的推移-早上7点科技委软件功能良好,上午10点,科技委-系统显着地减缓了这种缓慢持续到下午6点科技委。我的问题是,一个应用服务器可以处理多少Tomcat实例?