Erlang风格的RPC-pascal4123-ChinaUnix博客

Quick & Win -- 五多

首页　| 　博文目录　| 　关于我

pascal4123

博客访问： 1738102
博文数量： 607
博客积分： 10031
博客等级：上将
技术积分： 6633
用户组：普通用户
注册时间： 2006-03-30 17:41

文章分类

全部博文（607）

mind（2）
tech_spec（15）
misc（0）
biz（16）
self（7）
tech（521）
life（45）
未分配的博文（1）

文章存档

2011年（2）

2010年（15）

2009年（58）

2008年（172）

2007年（211）

2006年（149）

我的朋友

最近访客

推荐博文

Erlang风格的RPC

分类：

2010-01-29 23:38:33

原文 http://armstrongonsoftware.blogspot.com.nyud.net/2008/05/road-we-didnt-go-down.html

Erlang中的RPC

最近,在erlang的邮件列表中,我参与了一个非常有趣的讨论,Steve Vinoski和他的朋友们谈及RPC的一些"错误". 这个讨论开始与5月22日,FaceBook宣布部署采用erlang编写的chat server.

Steve发表了一个回复说:“...多年的CORBA经验告诉我,使用RPC是一件非常困难,非常错误的事情.而erlang风格的RPC却非常棒,因为erlang本身是分布式的.对于一般的语言,RPC带来的困难远远多于其解决的问题...”

后面出现更多的回复,我要求Steve详尽的解释其观点.

随后,Steve给出了丰富且有说服力的关于RPC问题的论述: "如果你没有很多的时间和精力,那么我告诉你,RPC的目标是使分布式的调用和本地调用尽可能的相似,但是这恰恰是其最根本的错误.因为远程调用和本地调用具有很多的不同..."

不错,不错,不错.当我读到这里时,在我的脑海里闪现出一连串的好,好,好.谢谢Steve!

Erlang没有选择的道路
Steve过去曾深入研究RPC,并且感受RPC带给他问题,但是现在Steve站出来,告诉我们他曾经经历的一切.

对一个远程操作竭力地封装,使其看起来像本地操作,这就是RPC主要错误所在,因为远程和本地调用完全不同,我再次重申这个观点.

在不是最坏的情况下,远程调用和本地调用对性能的影响也差别很大.一个本地调用可能仅仅需要几十微秒，而通过RPC远程调用可能会消耗几十毫秒。两者性能大约相差1000倍。

如果程序员不知道本地调用和远程调用间的不同,那么他很难写出高效的代码.如果其在软件内部掺杂了很多RPC调用,那么很有可能他的软件性能会饱受毁灭性的打击.

我曾将亲眼目睹很多工程的失败,正是因为参与者对远程调用和本地调用没有清晰的认识.

尤其需要注意的是,这种认识上的模糊对大型的项目的开发影响更坏.因为在较小的开发团队中,每个参与者都了解其使用的调用为远程还是本地调用.

Erlang如何实现RPC
所有的erlang程序都是由很多并行的process组成, process可以创建其他的process,可以发送、接收消息。这些操作在erlang中都是非常轻量，高效的操作。

Process可以被连接起来(link)，用来应对错误处理。如果Process A与Process B相连（通过调用link/1函数）,当A发生错误时，B会接收到一个错误信号，反之B发生错误时，A也会收到信号。Process连接机制，内部使用 Process的消息发送/接收机制。

当我们进行分布式系统开发时，需要多种形式的RPC调用。如果使用RPC，那么对于各种问题，RPC具有各种各种的规范及形式，严格的形式要求以及对错误的处理方式使应用RPC成为一场灾难。

在Erlang的时间，通过send，receive和link，开发者非常轻松的构建具有自定义错误处理功能的“个人RPC”。

Erlang中没有“RPC存根生成器”，也完全没有必要拥有类似的生成器。

在很多程序中，可能仅仅需要一些简单的RPC调用，在Erlang中，我们可以这样实现：

rpc(Pid, Request) ->

Pid ! {self(), Request},

receive
{Pid, Response} -> Response

end.

非常简单，这段代码首先发送一个请求，然后等待应答。

基于上面的代码，可以进行很多有用的扩展。简单的RPC在发送请求后，永远的等待应答，所以如果应答无法返回（比如远程主机crash）,那么请求方会被永远的挂起。通过添加一个timeout可以轻松解决这个问题：

rpc(Pid, Request, Time) ->

Pid ! {self(), Request},

receive {Pid, Response} -> Response

after Time ->

{error, timeout}

end.

现在我们有了更高的要求。如果我们想产生一个exception，当与我们通信的远程主机die的时候，那么代码如下：

rpc(Pid, Request) ->

link(Pid),

Pid ! {self(), Request},

receive

{Pid, Response} ->

Response

end.

通过link/1函数，我们将自身process与Pid连接起来，确保远程主机出错，die时，本地Process也终止。

新任务，现在我们想“并行”执行两个RPC：

rpc(Pid1, Pid2, Request) ->

Pid1 ! Pid2 ! {self(), Request}

receive {Pid1, Response} ->

receive {Pid2, Response2} ->

{Response1, Response2}

end

end.

(不必担心这段代码是否工作，Response1和Response2返回的顺序对代码没有影响)

通过上面的几个小例子，我想要说明的是：在Erlang中对于RPC的形式和规模以及错误处理，程序员可以进行各种精确的控制。同时上面的例子也说明，仅仅通过Process和消息，就可以很方便地更改RPC。

“标准”的RPC基于一个假设 -- 所有的应答都应返回给client。

在RPC框架中（比如SOAP），可能会有这样的处理：让X去做Y，最后把结果发送给Z。这在Erlang中也很容易实现：

rpc(tell, X, toDo, Y, reply Z) ->

X ! {Z, Y}.

(在这里，我们固定发送的tuple消息中，第一个元素为希望得到应答的Process，第二个参数为要执行的动作。在文章开始的例子中，调用者等待应答，那么Z可以设置为self())。

现在，我们要给我们的程序加上版本控制功能，也很容易:

rpc(Pid, Request, Vsn) ->

Pid ! {self(), vsn, Vsn, Request},

receive … end.

好了，通过这些例子，向您展现了版本控制，错误处理，同步执行，超时等等可以非常简单地添加到RPC调用中。通过消息接口，用户可以很轻松的定义各种交互。

最后，很多开发中通用的模式我们都为您准备好了，那就是OTP库。

阅读(1794) | 评论(0) | 转发(0) |

上一篇：早上8点前不适合运动

下一篇：从网络安装Loogson版 Debian（原创）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6