RPC超时机制
Linux下RPC支持简单的超时重传机制,采用了固定超时时间间隔和固定重试次数。当RPC服务发送一个报文时(对应一次远程过程调用),它便启动一个定时器;如果定时器在远程过程调用应答到达前期满,RPC服务便重发请求。程序员可以为某个给定应用调整超时时间间隔以及重试次数,但无法自适应。
这种简单机制无法保证可靠性,无法保证RPC client可以判断远程过程执行情况。如果网络丢失了所有应答,RPC client可能会重传几次请求,每次请求都导致远程过程被调用一次。然而当RPC client 端的RPC服务达到重试上限,它会宣布远程过程无法被调用(这时错误代码通常是timeout)。必须注意,应用程序不能将失败解释成远程过程从来没有被调用过,它很可能已经被调用了多次!我在写RPC程序的时候就遇到了被调用多次的情况,弄得我一头雾水!
RPC的timeout有两个,一个是总超时值(Total Timeout),另外一个是重试超时值(Retry Timeout)。
1. 总超时值:Client端等待Server端应答的总时间量;TCP和UDP都使用该值。
2. 重试超时:Client端等待Server端的应答期间,每次重传请求的间隔时间;只用于UDP。
默认的超时值可以通过 clnt_control(CLGET_TIMEOUT/CLGET_RETRY_TIMEOUT) 函数来获取。
-
struct timeval tv;
-
clnt_control(clnt, CLGET_TIMEOUT, (char *)&tv);
-
printf("timeout = %d : timeout = %d\n", tv.tv_sec, tv.tv_usec);
-
-
clnt_control(clnt, CLGET_RETRY_TIMEOUT, (char *)&tv);
-
printf("timeout = %d : timeout = %d\n", tv.tv_sec, tv.tv_usec);
经过测试,发现在Linux下,UDP的默认总超时值为-1,重传超时值为5秒;TCP的默认总超时值为0。
这两个值可以通过 clnt_control(CLSET_TIMEOUT/CLSET_RETRY_TIMEOUT) 来修改。总超时值也可以在clnt_call时指定(timeout参数)。
阅读(4899) | 评论(0) | 转发(0) |