Python for Hive-物连天涯-ChinaUnix博客

物连天涯的ChinaUnix博客sunjiqiangwork.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

物连天涯

博客访问： 123873
博文数量： 91
博客积分： 167
博客等级：入伍新兵
技术积分： 530
用户组：普通用户
注册时间： 2012-05-22 17:26

文章分类

全部博文（91）

mysql（7）
算法（3）
windows（2）
java（6）
linux（24）
虚拟化（2）
hive（2）
python（7）
物联网（14）
hbase（2）
IT杂谈（9）
hadoop（11）
未分配的博文（2）

文章存档

2012年（91）

我的朋友

最近访客

推荐博文

Python for Hive

分类：

2012-09-27 01:35:27

原文地址：Python for Hive 作者：skybin090804

当使用hadoop成为web日志或生产日志的存储池后，我们可以使用./hive登录到hive shell中
进行查询操作。但为了方便,在查询方面用python进行封装好相应方法进行使用，用java进行我们的统计分析。

使用hive客户端的相关功能只需要将${hive_home}/lib/py路径加入但python的运行环境路径中就行了。
如以下脚本：

#/usr/bin/env python
#-*- coding: utf-8 -*-

import os,sys

dir = os.path.dirname(os.path.realpath(sys.argv[0]))

sys.path.insert(0, dir + '/lib/py') ####引入相关python for hive 的相关环境

from hive_service import ThriftHive
from hive_service.ttypes import HiveServerException
from thrift import Thrift
from thrift.transport import TSocket
from thrift.transport import TTransport
from thrift.protocol import TBinaryProtocol

def hiveExe(sql):
    try:
        transport = TSocket.TSocket('192.168.237.13', 10000)
        transport = TTransport.TBufferedTransport(transport)
        protocol = TBinaryProtocol.TBinaryProtocol(transport)
        client = ThriftHive.Client(protocol)
        transport.open()
        client.execute(sql)
        print "The return value is : "+client.fetchOne()
        transport.close()
    except Thrift.TException, tx:
        print '%s' % (tx.message)

if __name__ == '__main__':
     print hiveExe("select * from img_ana limit 2")

阅读(376) | 评论(0) | 转发(0) |

上一篇：Hive基础

下一篇：hadoop资源

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6