Chinaunix首页 | 论坛 | 博客
  • 博客访问: 851866
  • 博文数量: 150
  • 博客积分: 5123
  • 博客等级: 大校
  • 技术积分: 1478
  • 用 户 组: 普通用户
  • 注册时间: 2008-11-06 10:03
文章分类

全部博文(150)

文章存档

2011年(2)

2010年(139)

2009年(9)

分类:

2010-08-23 00:44:29

plproxy的调用流程 收藏

    plproxy能够在PostgreSQL上运行的一种过程语言,能够完成对远程数据库的调用,并能够完成数据切片的功能。数据流处理过程如下图所示:

    首先需要明确的是plproxy只能对用户自定的方法才有小,如果想达到对sql语句的无条件转发,plproxy是做不到的。比如希望所有的select * from tablename 都转发到cluster1上,所有的update语句都转发到cluster2上,是不能通过plproxy做到的。
    plproxy能做到的是:在plproxy cluster上定义foo()函数,在cluster1和cluster2上也定义foo()函数,cluster1和cluster2上的foo()函数的定义是完全相同的,包括函数参数都是相同的;二者和plproxy cluster上的foo()定义均不同。

    1. plproxy的关键函数

        a. plproxy.get_cluster_version(cluster_name)  举例如下:
  1. CREATE OR REPLACE FUNCTION plproxy.get_cluster_version(cluster_name text)
  2. RETURNS int4 AS $$
  3. BEGIN
  4.     IF cluster_name = 'a_cluster' THEN
  5.         RETURN 1;
  6.     END IF;
  7.     RAISE EXCEPTION 'Unknown cluster';
  8. END;
  9. $$ LANGUAGE plpgsql;
          该函数返回的是当前plproxy的配置版本号,每当有请求时此函数都会调用。如果该函数的返回值和plproxy的缓存的配置版本号不同,则plproxy会认为配置已经更新,就会调用下面两个函数重新读取配置。

       b. plproxy.get_cluster_partitions(cluster_name text) 举例如下:
  1. CREATE OR REPLACE FUNCTION plproxy.get_cluster_partitions(cluster_name text)
  2. RETURNS SETOF text AS $$
  3. BEGIN
  4.     IF cluster_name = 'a_cluster' THEN
  5.         RETURN NEXT 'dbname=part00 host=127.0.0.1';
  6.         RETURN NEXT 'dbname=part01 host=127.0.0.1';
  7.         RETURN;
  8.     END IF;
  9.     RAISE EXCEPTION 'Unknown cluster';
  10. END;
  11. $$ LANGUAGE plpgsql;
        该函数返回plproxy所设置的内容,当所访问的cluster名称为a_cluster时,返回RETURN NEXT所对应的远程主机配置。

       c. plproxy.get_cluster_config(cluster) 举例如下:
  1. CREATE OR REPLACE FUNCTION plproxy.get_cluster_config(
  2.     in cluster_name text,
  3.     out key text,
  4.     out val text)
  5. RETURNS SETOF record AS $$
  6. BEGIN
  7.     -- lets use same config for all clusters
  8.     key := 'connection_lifetime';
  9.     val := 30*60; -- 30m
  10.     RETURN NEXT;
  11.     RETURN;
  12. END;
  13. $$ LANGUAGE plpgsql;
        该函数返回plproxy与cluser1和cluster2链接时的一些参数,如生命周期,超时时间,是否使用binary IO等。

    2. foo()函数的定义:

        在plproxy cluster上定义foo的内容如下:
  1. CREATE OR REPLACE FUNCTION foo(i_username text)
  2.   RETURNS text AS
  3. $BODY$
  4.     CLUSTER 'a_cluster'; RUN ON hashtext(i_username) & 1;
  5. $BODY$
  6.   LANGUAGE 'plproxy' VOLATILE
  7.   COST 100;
       在cluster1和cluster2上定义foo的内容如下:
  1. CREATE OR REPLACE FUNCTION foo(i_username text)
  2.   RETURNS text AS
  3. $BODY$
  4. BEGIN
  5.     RETURN 'user already exists';
  6. END;
  7. $BODY$
  8.   LANGUAGE 'plpgsql' VOLATILE SECURITY DEFINER
  9.   COST 100;
       可以看到,在plproxy上定义的foo()函数的language是“plproxy”,在cluster1和2上的foo()函数定义的language是“plpgsql”,这是最主要的区别。

   3. 调用过程


      a. 客户端发送select foo()的请求到plproxy cluster;
      b. plproxy cluster发现foo()是用户自定义的函数,查找到该函数定义内容发现该函数是通过plproxy language定义的
      c. plproxy cluster把控制权转交到plproxy language的handler,
      d. 该handler执行foo()的内容,发现该函数需要使用名为"a_cluster"的配置
      e. handler调用plproxy.get_cluster_version("a_cluster"),发现配置版本号相符;
         则继续调用 
plproxy.get_cluster_partitions("a_cluster")获得四项远程cluster的链接配置;
         然后继续调用 
plproxy.get_cluster_config(in cluster_name text,out key text,out val text)获得链接时的配
         置信息
      f. 最后根据RUN ON hashtext(i_username) & 1 把"select foo()"请求转发到cluster1或者2上。  
         hashtext(i_username) & 2 会返回
一个0-1之间的值,根据这个值确定应该转发请求到哪个具体的cluster上.
      g. 在cluster上执行"select foo()",把结果"user already exists"返回给plproxy cluster
      h. plproxy cluster再把收到的结果返回给client.

   4. plproxy的局限
       plproxy并不能完成无条件的转发,只能在自定义的函数上实现此功能。这就要求在实际的应用中,需要把大量的业务逻辑放到PostgreSQL服务器端来完成,降低了灵活度。

       一点体会:使用PostgreSQL,需要改变思路,需要适应把业务逻辑通过服务器端编程实现的过程。这是与MySQL的很大不同。

      plproxy官方链接

      例子:
            

阅读(1186) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~