我有一个程序,可以读取大约一百万行,并对行进行分组;客户端计算机完全没有压力,cpu使用率不超过5%,网卡使用率约为10%或更少。如果在同一台客户机上运行四个程序副本,则使用率会以相同的速度增长,在运行这四个程序的情况下,cpu使用率约为20%,网络使用率约为40%。这让我认为我可以使用线程从数据库中读取信息来提高性能。客户端: Windows 7,CSDK 3.50.TC7
服务器: AIX 5.3,IBM Informix Dynamic Server Versio
我目前正在重建我们的服务器,其中包含我们的区域服务器和数据节点。当我关闭一个数据节点时,10分钟后,它拥有的数据块将在其他数据节点之间重新复制,这是理所应当的。我们有10个数据节点,因此随着数据块的重新复制,我看到了大量的网络流量。然而,我看到每台服务器的流量只有500-600 only (机器都有千兆接口),所以它肯定不受网络限制。每个数据节点有6个7200 rpm的sata驱动器,在此期间IO使用率非常低,每个驱动器的IO使用率仅达到20-30%的峰值。hdfs中是