文章/答案/技术大牛

发布

问环回tcp连接加速
EN

Stack Overflow用户

提问于 2014-08-27 10:28:32

回答 2查看 869关注 0票数 4

我试图使用以下代码使用tcp回送连接向第三方应用程序(运行在同一服务器上)发送一些字节。

struct sockaddr_in serv_addr;
struct hostent *server;
int sockfd = socket(PF_INET, SOCK_STREAM, 0);
server = gethostbyname(host_address);

bzero((char *) &serv_addr, sizeof (serv_addr));
serv_addr.sin_family = AF_INET;

bcopy((char *) server->h_addr, (char *) &serv_addr.sin_addr.s_addr, server->h_length);

/**** Port No. Set   ****/
serv_addr.sin_port = htons(portno);
int sockKeepAliveOption = 1;
int al = setsockopt(sockfd, SOL_SOCKET, SO_KEEPALIVE, (void*) &sockKeepAliveOption, sizeof (sockKeepAliveOption));
if (al == -1) {
    std::cout << "Setsocket option err: SO_KEEPALIVE --unable to set keep alive tcp connection." << std::endl;
} 
else {
    std::cout << "S0_KEEPALIVE set, with SOL_SOCKET.. . ..\n" << std::endl;
}

我一次发送400个字节，每秒发送100次。我使用以下代码发送

int n = send(sockfd,sendB,400, ONLOAD_MSG_WARM);

我的问题是，我变得高度抖动。我得到最小的延迟3我们，平均7我们和最大19我们。我如何优化它呢？

谢谢

2014年8月28日编辑。

让我再补充几个信息。我也是从同一端口在不同的线程接收数据，但在我发送后。我还通过下面的代码为每个线程分配一个核心，除了核心0之外的所有cpu都与调度程序隔离。

        thread1= new std::thread(myfunction, input1, input2);
        pthread_t thread_hnd = thread1->native_handle();
        CPU_SET(5, &cpuset);
        s = pthread_setaffinity_np(thread_hnd, sizeof (cpu_set_t), &cpuset);

我得到了好的数字(3或4 us)，当我连续发送在每1毫秒，但如果频率是较少(例如1-5在一秒钟)，然后我得到约20我们，但avg是大约7我们。

不同线程在同一个端口上侦听和发送会产生抖动吗？

2014年8月28日第二版。

这是我的cpu状态。它不会去C3。Core 2 7是我通过循环回送数据的线程。

 Cpu speed from cpuinfo 3499.00Mhz
 True Frequency (without accounting Turbo) 3499 MHz

 Socket [0] - [physical cores=6, logical cores=6, max online cores ever=6]
 CPU Multiplier 35x || Bus clock frequency (BCLK) 99.97 MHz
 TURBO ENABLED on 6 Cores, Hyper Threading OFF
 Max Frequency without considering Turbo 3598.97 MHz (99.97 x [36])
 Max TURBO Multiplier (if Enabled) with 1/2/3/4/5/6 cores is  38x/37x/36x/36x/36x/36x
 Real Current Frequency 3600.17 MHz (Max of below)
    Core [core-id]  :Actual Freq (Mult.)      C0%   Halt(C1)%  C3 %   C6 %  Temp
    Core 1 [0]:       3600.17 (36.01x)      1.08    98.9       0       0    41
    Core 2 [1]:       3595.44 (35.96x)      1.07    98.9       0       0    46
    Core 3 [2]:       3595.28 (35.96x)         1    99.1       0       0    40
    Core 4 [3]:       3599.01 (36.00x)         1    99.9       0       0    46
    Core 5 [4]:       3599.51 (36.01x)         0     100       0       0    50
    Core 6 [5]:       3598.97 (36.00x)       100       0       0       0    56

  Socket [1] - [physical cores=6, logical cores=6, max online cores ever=6]
  CPU Multiplier 35x || Bus clock frequency (BCLK) 99.97 MHz
  TURBO ENABLED on 6 Cores, Hyper Threading OFF
  Max Frequency without considering Turbo 3598.97 MHz (99.97 x [36])
  Max TURBO Multiplier (if Enabled) with 1/2/3/4/5/6 cores is  38x/37x/36x/36x/36x/36x
  Real Current Frequency 3600.12 MHz (Max of below)
    Core [core-id]  :Actual Freq (Mult.)      C0%   Halt(C1)%  C3 %   C6 %  Temp
    Core 1 [6]:       3598.97 (36.00x)       100       0       0       0    56
    Core 2 [7]:       3598.51 (36.00x)      1.12    98.8       0       0    49
    Core 3 [8]:       3599.98 (36.01x)      1.94      98       0       0    45
    Core 4 [9]:       3598.97 (36.00x)       100       0       0       0    56
    Core 5 [10]:      3599.48 (36.01x)         1    99.9       0       0    48
    Core 6 [11]:      3600.12 (36.01x)      3.44    96.5       0       0    45

 C0 = Processor running without halting
 C1 = Processor running with halts (States >C0 are power saver)
 C3 = Cores running with PLL turned off and core cache turned off
 C6 = Everything in C3 + core state saved to last level cache
 Above values in table are in percentage over the last 1 sec
 [core-id] refers to core-id number in /proc/cpuinfo

loopback

tcp

onload

回答 2

Stack Overflow用户

发布于 2014-08-27 10:47:08

首先，有一些技术可以加快速度，但这并不一定能解决抖动问题。大多数速度优化也依赖于异步套接字处理，主要是在接收数据时提供帮助，在发送数据时帮助更少。

可能有用的是设置TCP_NODELAY选项。这将通过禁用Nagle算法来确保数据包尽快发送出去。本质上，Nagle算法试图在单个数据包中附加多个TCP缓冲区，从而以延迟/抖动为代价，最大限度地提高吞吐量。

此外，请记住，在这样低分辨率的时间是棘手的充其量。再次检查您的定时器分辨率(clock_getres)，并记住任何系统中断和进程调度都会影响定时。你的实际抖动可能比你的时间要好。

票数 2

Stack Overflow用户

发布于 2014-08-27 20:27:39

你能在你的网络线程上试试sched_setaffinity(2)吗？如果您的代码是单线程的，那么使用它的包装器taskset(1)就更容易了.

此外，最好用isolcpus参数引导Linux，这样其他不相关的进程就不会打扰您的实验。

https://askubuntu.com/questions/165075/how-to-get-isolcpus-kernel-parameter-working-with-precise-12-04-amd64

C国最新情况

您的CPU是否可能睡得太深了(>= C3)？

http://feedsforyou.blogspot.com/2008/07/acpi-states.html

这个工具可能有助于监视C状态：

https://code.google.com/p/i7z/

根据您的CPU和内核版本，您可能希望调整intel_idle.max_cstate内核参数或类似的内容。

请参阅cstate=0禁用c状态？

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/25524758

复制

相似问题

问环回tcp连接加速
EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问环回tcp连接加速EN

回答 2

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问环回tcp连接加速
EN