在“过程挖掘:数据科学在行动”(2016 - Van der Aalst,pag 11)的导言一章中,作者说:
虽然数据科学可以被看作是统计的延续,但大多数统计学家对最近数据科学的进展贡献不大。大多数统计学家关注的是理论结果,而不是现实世界的分析问题。对于较大的数据集至关重要的计算方面,通常被统计学家忽略。重点是生成建模,而不是预测和处理与数据质量和大小有关的实际挑战。
我对这句粗话不太清楚。事实上,由于生成模型是生成数据的模型,所以一旦我们获得数据,我们就可以进行预测。所以,对我来说,生成模型和预测并不是对立的概念。你觉得呢?
我看了的官方公告。因此,我想移动我的客户的生产应用程序之一。要求在两个不同的区域设置此应用程序,如下所示
基本上,我们有两个来自澳大利亚和土耳其的人口统计数据,人们将从那里访问服务器,所以我们需要两个web服务器,一个来自澳大利亚,另一个来自欧洲。
带有窗口服务器的- 2 r2服务器
-将数据库服务器与SQL server分开
-单负载平衡器
查询
1)哪个数据中心最适合上述区域?
2)我们关心的不是正常运行时间,而是本地性能。
based so to run application on 1 VM is okay?
3),在其中托管区域数据库,这样无论性能问题如何,这两个web服务器都可以
我正在尝试通过使用子查询中主查询的相同值来匹配两个表之间的数据。为此,我使用了3个表:
World -玩家所在的世界区域-实际销毁的玩家对象-只是一个用于跟踪玩家在世界中的进展的统计表
我要做的是创建一个查询,显示游戏和他们所在的世界,并获得他们在那个世界中销毁的所有对象的计数。我的查询目前是这样的:
select
world_id,
world_name,
player_id
count(select * from objects_destoryed where player_id = <insert player ID>) as Stats
fr