RPC超时机制

Linux下RPC支持简单的超时重传机制，采用了固定超时时间间隔和固定重试次数。当RPC服务发送一个报文时（对应一次远程过程调用），它便启动一个定时器；如果定时器在远程过程调用应答到达前期满，RPC服务便重发请求。程序员可以为某个给定应用调整超时时间间隔以及重试次数，但无法自适应。
这种简单机制无法保证可靠性，无法保证RPC client可以判断远程过程执行情况。如果网络丢失了所有应答，RPC client可能会重传几次请求，每次请求都导致远程过程被调用一次。然而当RPC client 端的RPC服务达到重试上限，它会宣布远程过程无法被调用（这时错误代码通常是timeout）。必须注意，应用程序不能将失败解释成远程过程从来没有被调用过，它很可能已经被调用了多次！我在写RPC程序的时候就遇到了被调用多次的情况，弄得我一头雾水！

RPC的timeout有两个，一个是总超时值（Total Timeout），另外一个是重试超时值（Retry Timeout）。
1. 总超时值：Client端等待Server端应答的总时间量；TCP和UDP都使用该值。
2. 重试超时：Client端等待Server端的应答期间，每次重传请求的间隔时间；只用于UDP。

默认的超时值可以通过 clnt_control(CLGET_TIMEOUT/CLGET_RETRY_TIMEOUT) 函数来获取。

点击(此处)折叠或打开

struct timeval tv;
clnt_control(clnt, CLGET_TIMEOUT, (char *)&tv);
printf("timeout = %d : timeout = %d\n", tv.tv_sec, tv.tv_usec);
clnt_control(clnt, CLGET_RETRY_TIMEOUT, (char *)&tv);
printf("timeout = %d : timeout = %d\n", tv.tv_sec, tv.tv_usec);

经过测试，发现在Linux下，UDP的默认总超时值为-1，重传超时值为5秒；TCP的默认总超时值为0。

这两个值可以通过 clnt_control(CLSET_TIMEOUT/CLSET_RETRY_TIMEOUT) 来修改。总超时值也可以在clnt_call时指定（timeout参数）。

阅读(4943) | 评论(0) | 转发(0) |

上一篇：配置tftp server

下一篇：在agent中发送SNMP trap

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6