在 Linux 上模拟大规模并行数据库处理！［转载网络］-hkebao-ChinaUnix博客

运维开发yaofang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

hkebao

博客访问： 31085645
博文数量： 2065
博客积分： 10377
博客等级：上将
技术积分： 21525
用户组：普通用户
注册时间： 2008-11-04 17:50

文章分类

全部博文（2065）

创业天下（1）

技术论坛（0）

方案选择（1）
Android开发（0）
开源项目（12）

puppet配置文件管（0）

开源XEN管理工具（0）

在线图片处理（1）

日志分析工具（1）

计费系统（1）

python统计PY源码（2）

JAVA服务提供器（1）

网络工具（1）

Java版杀进程工具（1）

网络爬虫（2）

论坛发帖机设计（1）
Ruby区（3）

CODE（0）

相关资讯（0）

基础教程（3）
面向服务（1）

rest（0）

xml-rpc（1）
运维与开发（8）

应用服务（1）

网上学习笔记（1）

程序员杂志（1）

投稿（0）

架构方面（0）

网络方面（0）

系统管理OS（1）

开发方面（0）

虚拟化方面（0）

存储方面（0）

数据库方面（3）
互联网（33）

天涯论坛（0）

淘宝开放平台（0）

开放平台开发（0）

朱敬（1）

俞强华（1）

盛大（1）

VC（1）

webgame（0）

其它（1）

云计算（1）

移动互联网（1）

CU（1）

互联网产品设计（1）

InfoQ（2）

技术方向（0）

产品设计（1）

关注腾讯（2）

马化腾（0）

腾讯（1）

从技术解读互联网（2）

网店乐（0）

80后粉丝网（1）

点评网（0）

网站盈利（1）

国内一流互联网公（1）

网站运营（2）

技术动态（2）

搜房网（0）

案例公司（0）

新技术探讨（4）

新闻杂谈（1）

马云（1）

人物（0）

反思（0）

行业动态（2）
Window（10）

基本配置（1）

OS安全配置（1）
Flash（14）

应用篇（0）

中级篇（0）

基础篇（14）

flex学习（0）
DOS命令（7）
虚拟技术（3）

开发（0）

学习笔记（0）

XEN（0）

虚拟软件（0）

虚拟化技术（1）

相关知识（1）

相关技术动态（1）

虚拟动态（0）
linux（177）

源码学习（0）

YUM包（2）

相关专题（0）

RedHat认证（0）

shell杂（1）

Linux内核（1）

网络命令（2）

安全（1）

linux工具（2）

bash（0）

工具代码（3）

linux系统学习教（9）

LVS篇（1）

源码整理（11）

装机（5）

linux小技巧（8）

常用配置文件（2）

Ubuntu（1）

系统管理（4）

linux杂（9）

linux学习（13）

linux调优（2）

VI篇（4）

SED与AWK（6）

linux常用命令（43）

防火墙（6）

SHELL学习（10）

脚本学习（1）

鸟哥私房菜专集（6）

DNS学习（7）
其他内容（416）

混迹社会（0）

2011计划（1）

自己的项目（1）

未来之约（1）

工作日志（4）

日记（4）

职场生涯（4）

区域城市（3）

linux认证（0）

CCNA认证（0）

下一代网站（1）

投资自己（1）

当站长（2）

新闻日记（31）

创业专栏（9）

实战（0）

技术（0）

淘宝易货（0）

编码（1）

读书（3）

新浪财经（0）

程序设计（1）

学习（4）

股票软件（1）

读书笔记（3）

积淀（1）

工作（0）

酒文化（0）

茶文化（0）

搜狐财经（0）

第二职业（1）

压力篇（3）

项目进展（2）

木材（0）

家居（0）

传统产业分析（0）

可行性市场分析（1）

寻找市场（1）

互联网创业（2）

时间管理（2）

要做的平台产品（1）

人际交往（1）

项目学习法（3）

营养（5）

IT认证考试（0）

论坛精华（8）

职业规划（16）

创业篇（2）

年计划（0）

年计划（19）

汽车平台（0）

关注地产（0）

平台（0）

外包项目（2）

求职面试（14）

创业立志（5）

股票学习（0）

美食（1）

学习基金理财（2）

我的基金（2）

面试（0）

反省过去（1）

CTO相关资讯（0）

心情日记（28）

工作（4）

专题一（1）

财务（1）

大项目（3）

互联网盈利（8）

整理电子商务站（1）

男人与石头（1）

金融证券（0）

银行基金（11）

未来计划（13）

架构师（6）

社会经验（10）

工作室（11）

职业规划（8）

理财大全（1）

赚钱计划（10）

我的小说（3）

经典励志（24）

学习计划（2）

健康之道（4）

旁征博引（36）

学习心得（17）

编程心得（19）
java框架（55）

数据导入工具（1）

项目学习记录（0）

WEB框架理论（1）

常见异常错误（1）

整理代码（0）

笔记（0）

常用代码（3）

配置（6）

2010学习笔记（7）

专题（0）

Hibernate（0）

dom4j（2）

xsocket框架（1）

Ant开源学习（2）

Spring框架（0）

structs2.0（30）
php学习（198）

认证项目CI（0）

PHP自定义函数（0）

PHP整理笔记（1）

PHP面向对象（1）

UC专题（3）

wordpress（0）

php专题篇（9）

基于CI开源项目（0）

框架学习（1）

PHP缓存（0）

php整理备战（0）

php常用的代码（1）

PHP整理网站（0）

PHP看开源代码（3）

实战经验（2）

PHP制作公司CMS（3）

看实例学习整理（8）

PHP相关资料整理（18）

整理CU文章（23）

CodeIgniter框架（5）

Smarty学习整理（8）

帝国CMS学习区（3）

PHP168学习区（0）

PHP制作网站总结（51）

PHP常用函数整理（30）

PHP实例教程（7）

PHP入门资料（19）
Javascript（86）

ajax代码库（0）

ajax专题（1）

javascript理论（1）

JQuery应用（8）

javascript基础（3）

DEMO（4）

Javascript专题（7）

JQuery插件专题（6）

js常用代码集合（7）

JQuery框架学习（11）

JS解决跨域（0）

JavaScript小项目（1）

JavaScript整理（12）

Prototype框架（0）

ajax学习（14）
安全红客（7）

CODING（4）

网络安全（3）
敏捷开发（0）

技术准备（0）
奋斗领域（12）

分布式操作系统（0）

嵌入式操作系统（0）

Kernel（0）

Linux方向（0）

Linux内核研究（0）

C学习（2）

C代码库（1）

工具函数（0）

专题篇（3）

2010年专题产品篇（0）

UNIX环境高级编程（2）

网络编程相关（0）

数据结构与算法（0）

服务器性能编程（0）

HTTP编程（0）

网络编程（0）

C实现服务器（2）
J2ME学习（2）
WAP开发（0）
软件测试（3）

相关（1）

单元测试（0）

功能测试（0）

性能测试（1）
数据库学习（218）

故障排查经验（1）

2010数据库大会资（2）

相关资料整理（0）

mysql杂（2）

Mysql基础教程（6）

工作经验（1）

架构瓶颈（1）

系统管理员（1）

数据库技术（4）

基础（0）

索引理论（0）

SQL语句理论（2）

理论（2）

架构设计（0）

SQL编程（0）

MSSQL问题解决（2）

MySQLDBA篇（38）

数据库基础理论（8）

常用系统管理（12）

架构之数据库设计（2）

MySQL编程篇（15）

MySQL架构第一步（6）

MYSQL主从软件（6）

MYSQL查询优化篇（36）

MySQL中的文件（9）

MySQL主从配置（6）

MSSQL2000（12）

数据库加程序（2）

MYSQL（34）
兴趣研究（0）

全文检索（0）
IT运维体系（38）

翻译（2）

转载资料（2）

puppet（4）

ZABBIX（0）

mantis-bug管理系（0）

职业（2）

游戏运维（0）

Rsync（3）

rrd（1）

mrtg（0）

certmaster（0）

Func（1）

Cfengine（1）

cacti（2）

nagios（1）

ITIL（0）

规范流程（0）

Remedy（0）

kettle（0）

jpivot（0）

mondrian（0）

开源框架（1）

实践内容（1）

运维经验整理（2）

网上眼界（10）

新技术（0）

相关理论（4）
Erlang（4）

资料整理（4）
开源学习（6）

开源产品使用（1）

其他开源（1）

Memoranda（0）

Drupal专题学习笔（0）

php开源（0）

python开源代码（2）

C开源代码（0）

Shell开源（0）

JAVA开源（1）
Jython学习（0）

Jython入门学习（0）
理论知识（69）

gfs（1）

mfs（0）

分布式文件系统（1）

SNMP（4）

VPN教程（1）

网络教程（1）

存储教程（3）

存储产品（1）

漫谈存储（3）

存储开发（0）

存储技术（1）

存储理论（2）

存储相关（0）

存储（0）

操作系统（0）

软件工程（0）

其它相关（0）

算法（0）

计算机知识（3）

网上资料（8）

CCNA教程（9）

计算机硬件（4）

FastDFS专题（1）

架构之开源篇（0）

架构之硬件（9）

架构之系统（2）

架构之存储篇（3）

架构之网络篇（7）

计算机网络（2）

正则表达式（3）
服务器配置（105）

nginx源码研究（0）

实际案例分享（1）

nginx开发（2）

apache学习笔记（4）

资料介绍（1）

资料使用（0）

CDN（2）

LVS（0）

服务器安全（1）

haproxy（1）

Varnish（0）

squid（1）

编程篇（0）

memcached（2）

nginx整理学习（15）

nginx实战经验（5）

nginx官网资料（4）

FTP服务器（1）

lighttpd（3）

版本控制管理（8）

负载均衡（1）

nginx服务器（8）

服务器集群（1）

IIS服务器（12）

resin服务器（16）

Apache服务器（13）

Tomcat服务器（3）
JSP学习（57）

JSP开发经验之谈（2）

JSP架构设计（1）

JSP基础（1）

JSP专题（3）

J2EE体系（0）

JSP缓存整理（2）

JSP配置文件（3）

JSP实践编程（2）

JSP自定义标签（10）

JSP文本操作（2）

JSP扩展话题（1）

JAVABEAN学习（5）

Servlets学习（12）
XML学习（15）

YAML（0）

SOAP专题（2）

XML基础篇（7）

WebService（0）

JSON（6）
ASP学习（89）

ASP专题整理（5）

vbs教程（4）

JMail整理版（1）

ASP其他（2）

ASP建站整理（9）

ASP整理归档版（22）

ASP工具整理（14）
专题讨论（99）

LDAP（0）

LINUX密码管理（0）

代码优化JOB（2）

CI框架公司培训（1）

理论学习（0）

JSP（1）

内存DB（1）

代码库（1）

HTTP隧道（0）

破解验证码（2）

研究专题（1）

JQuery培训（0）

MySQL架构（3）

培训专题（0）

GAE专题（0）

不懂就学专题（1）

Google APP Engin（0）

ROR框架整理（0）

Hibernate整理（1）

Django培训专题（0）

编程思想篇（1）

8月份研究模拟Htt（1）

HttpClient学习（2）

Java开源版商城（0）

JAVA实现下载器（2）

学习项目制作（0）

PHP（10）

文档编写（1）

WEB服务器（1）

网页爬虫（9）

网络处理老师（1）

好的网站大全（2）

JavaScript代码（6）

CSS样式（0）

Java（17）

Python（24）

ASP（8）
编程工具（13）
JAVA学习（160）

数据库编程（11）

JAVA短信（0）

Java面试题（1）

JAVA日常工具（3）

JAVA新技术（2）

开发思想JAVA版（1）

JAVA小品（1）

SCJP考证（1）

java基础教程（5）

JAVA网络编程（10）

JAVA岗位招聘（5）

JAVA性能监控（3）

JAVA与设计模式（0）

java.lang（1）

系统学习（2）

java.util（7）

Java代码之美（2）

基础学习整理（6）

JAVA高级工程师（11）

高性能架构（2）

专题研究（8）

java.io（1）

SUN官网资料（2）

JAVA缓存（0）

JAVA正则（1）

RMI（1）

JAVA基础（20）

面向接口编程（1）

JAVA编程思想（3）

JAVA操作流文件（9）

JAVAMail专题（2）

JAVA中数据结构（12）

JMS学习（1）
WEB开发（79）

原创架构（1）

架构大讲堂（8）

CSS框架（0）

百度UED团队（2）

前端开发（0）

架构整理（3）

DIV+CSS实例整理（0）

DIV学习笔记（2）

前台学习资料（1）

HTTP理论（19）

COOKIE详细分析（5）

SVG学习篇（10）

WEB页面分析（0）

程序方面（0）

CSS框架（3）

SEO优化（0）

页面编码（2）

HTML学习（18）

div+css（5）
未分配的博文（65）

文章存档

2012年（2）

2011年（19）

2010年（1160）

2009年（969）

2008年（153）

我的朋友

相关博文

在 Linux 上模拟大规模并行数据库处理！［转载网络］

分类：数据库开发技术

2010-03-30 20:52:54

大规模并行处理（massively parallel processing，MPP）是使许多廉价计算机在一起工作以解决大问题的关键。某些类别的问题是很难分成小块然后转交给机器群集来处理的，幸运的是，关系数据库适用于并行化。

分区和群集是数据库可伸缩性的关键。现在，您可以先从低成本技术来着手实现，这反驳了 “MPP 等于大规模的采购价格（massive purchase price）”的观点。本文将向您演示如何在您的便携式电脑上使 DB2? Extended Enterprise Edition（EEE）V7.2 在 Linux 上运行起来。然后，我们将探究如何在单个计算机上设置两个数据库分区（称为多个逻辑节点）以及如何在这些节点之间创建分区表。

虽然本文使用的环境是 DB2 EEE V7.2，但是对于使用 DB2 V8 企业版的用户也有借鉴作用，基本过程没有太大差别。

以上就是花费数百万美元构成的计算机群集处理 DB2 EEE 中数据的方式。但是，单个 CPU 机器也可以运行多个节点，并模拟构成计算机群集。

并行群集多重处理是计算领域一项非常激动人心的领域，现在学习分区和群集知识是为将来使用做好准备的主要方法。

回页首

MPP 数据库技术的完全简史

并行数据库的最初成功设计之一要回溯到 1986 年，请参阅［ Dewitt 1986］。经历了一段时间之后，直到二十世纪九十年代中期这些数据库才成为商业实体 — UNIX? 平台上的产品。MPP 数据库与 Linux 的结合在 2001 年首次战胜了商业数据仓库基准程序。基于低成本 Intel 的硬件、IBM 的 DB2 EEE 和 Linux 的结合被用于完成。

并行数据库是如何工作的？

使多台计算机同时处理同一问题的方法主要有两种。

“无共享（shared nothing）”体系结构意味着每台计算机都有它自己的 CPU、内存和磁盘。计算机通过高速互连被连接在一起，如图 1 所示。当处理查询时，每个节点处理其本地表中的行，然后将节点的部分结果回传给协调程序节点。协调程序将来自所有节点的所有结果合并成最终结果集。节点不一定是独立的计算机 — 在单个计算机上可以存在多个分区。

高速互连对于任何计算机群集（不管是不是数据库的）性能都至关重要。请参阅有关该主题的，以了解当从 100 兆位交换器更改为 10 兆位集线器时对群集关系数据库产生的性能影响。目前的互连技术要比 100 兆位快得多，它所提供的性能在 500 MB／秒到 6 GB／秒之间，这样的带宽绰绰有余。

共享磁盘体系结构（图 2）使用锁管理器在计算机之间作出仲裁，这些计算机都访问一个公共磁盘池。这种体系结构在原理上是有缺陷的，因为当节点数增加时，群集会沉溺于锁请求中。速度较快的硬件隐藏了大量的错误，但即使在每个节点上使用锁高速缓存，该方法也不能违背物理规律，并且如果没有特定硬件来完成在 DB2 for z/OS? 上使用 Parallel Sysplex? 技术实现的作业，它将无法伸缩。

该环境中的数据库访问要求每个节点都在共享磁盘上请求一块数据。如果另一个节点已经锁定该数据准备更新，那么正在请求的节点必须等待正在更新的节点完成。这种环境容易发生“死锁”的锁情况。节点 1 锁定资源 A 并请求资源 B。节点 2 锁定资源 B 并请求对资源 A 的锁定。这两个节点都不释放它们的锁，所以它们一直等待下去。

您已经知道群集中的每个节点都处理它的本地数据，然后将其结果回传给查询协调程序节点。但是，每个节点如何分配到关系表中的数据子集呢？这就是 散列分区在 MPP 群集中所做的事情。

要在多个节点之间分布表，选择分区键。如果存在主键，那么这是分区键的一个非常好的选项。基数非常低的列（例如，只有两个值“M”和“F”的性别）是糟糕的分区键。

在 CREATE TABLE 语句中指定表分区。下面是一个示例：

CREATE TABLE marty (
        

?????foo INTEGER
        

??????)
        

                

PARTITIONING KEY(foo) USING HASHING;

根据对名为 foo 的列计算散列值，“marty”表将被散布于 MPP 群集（或虚拟群集）中的所有节点中。计算散列值时，数据库计算哪个节点（在虚拟群集中是分区）拥有该特定散列值的行并将这些行存储在适当的计算机上。您或许已经确定了散列算法必须非常快。

基数低的列对于分区表是一个糟糕选项，因为它产生极少的唯一值。如果 MPP 群集中有 10 个节点，而分区列中仅有 5 个唯一值，那么只有 5 个节点将有数据，可能会更少！但是，不必担心，可以将多个列用于分区键。

回页首

让我们尝试在单个计算机上使用 DB2 EEE（一种无共享关系数据库）来模拟无共享方法。单处理器的计算机能够提供一种完全模拟无共享群集的测试环境。

下面的每个安装步骤都以描述性信息的链接开始，这些信息可在后面的逐步注释一节中找到。（逐步注释开始处的相应链接可让您返回到安装步骤。）如果您遇到问题，请参阅故障排除。安装完 DB2 之后，可以在数据库服务器中的两个分区（模拟节点）之间进行数据分区。如果您想要快速且方便地开始，可以使用模式与程序来填充表。

在 Intel 体系结构机器上安装 Linux。它可以是便携式电脑或任何其它 PC。本文的测试在 SuSE 7.2 和 Red Hat 7.0、7.1 以及 7.2 上运行。
更改 inetd/xinetd 以接受 rsh。
- 在 SuSE 上，编辑 /etc/inetd.conf，取消 rsh 行的注释。确保在更改配置文件之后重新启动 inetd。
- 在 Red Hat 上，编辑文件 /etc/xinetd.d/rsh，将“disable = yes”更改成“disable = no”。
作为 root 用户，使用下列命令序列来重新启动 xinetd（确切的文件名可能会有所不同）：
# /etc/rc.d/rc3.d/S56xinetd stop

# /etc/rc.d/rc3.d/S56xinetd start

如下更改 SuSE 7.2 或 Red Hat 7.1 和 7.2 的内核参数：

sysctl -w kernel.shmmax=10737418>24
            

sysctl -w kernel.msgmni=1024
            

sysctl -w fs.file-max=8192
            

sysctl -w kernel.sem=?50 32000 32 1024?

安装公共域 ksh（pdksh）：
rpm -i pdksh-5.1.14-8.i386.rpm
您的 pdksh 发行版可能会不同。
安装 DB2 EEE V7.2。您可以从下载 DB2 EEE for Linux 的试用版。
- 以 root 用户身份登录，使用下列命令安装 DB2 EEE V7.2 产品：
  ./db2setup
- 选择选项以创建样本数据库和管理服务器。使用用户标识的缺省值，因为这些指示信息都基于缺省值。我希望不要使用“auto-start at reboot”选项。

编辑 /etc/services 文件，添加下面粗体显示的行：

DB2_db2inst1????60000/tcp???# Connection port for DB2 instance db2inst1
            

# line below added to provide ports for MLN
            

                        DB2_db2inst1_END????60004/tcp???# end of range of MLN ports
                        

# make sure the next port is greater than the 60004 above
            

# no overlaps are allowed

以用户 db2inst1 身份登录，设置该用户的 rsh。创建权限为 600 并具有下列项的文件 .rhosts：
localhost

your_host_name_here
使用下列命令测试 rsh 设置：
db2_all echo hi
输出将是回显到标准输出（stdout）的字符串“hi”。

通过输入下列 DB2 命令序列测试您的安装：

db2start
            

db2 connect to sample
            

db2 connect reset
            

db2stop

这些命令启动数据库，将您连接到样本数据库，然后停止数据库。

数据库停止后，编辑文件 ./sqllib/db2nodes.cfg 并添加另一个虚拟节点。TCP/IP 名为“mikado”的主机（它有两个逻辑节点）上的文件类似于：
0 mikado 0

1 mikado 1

使用 db2start 命令启动多个逻辑节点。输出将类似于：

[db2inst1@mikado db2inst1]$ db2start
            

01-01-2002 20:30:38?????1???0???SQL1063N??DB2START processing was successful.
            

01-01-2002 20:30:39?????0???0???SQL1063N??DB2START processing was successful.
            

SQL1063N??DB2START processing was successful.
            

[db2inst1@mikado db2inst1]$

创建跨逻辑节点进行分区的表。如果您需要复习分区概念，请参阅无共享环境中的数据分区。

connect to sample;
            

                        

CREATE TABLE marty (
            

?????foo INTEGER
            

??????)
            

                        

PARTITIONING KEY(foo) USING HASHING;

将一些数据插入表中。可以使用 Java? 来完成这一步或者您自己做。

通过使用下列 SQL 语句查看分区分布：

select partition ( foo) as Partition_Hash,
            

?????count(*) as Hash_Count
            

from marty
            

group by??partition ( foo)
            

order by count(*) desc
            

fetch first 10??rows only ;

最后一步。）祝贺您！享受您的选择吧！

回页首

在 Intel 体系结构机器上安装 Linux。
与先前版本相比，Linux 的安装过程有了很大的改进。我认为它比 Windows? 方便得多，只需要一次重新引导。在一个过程中安装一个完整的开发环境，而不需要许多附加过程。

可以挑选 SuSE（）或 Red Hat（）的发行版或者任何一种版本，但应遵守它并学习如何好好地管理它。Red Hat V7.2 对 lilo（一种引导管理器）进行了更新，使之可以识别 Windows 2000? 分区以便进行双重引导。这比起使用 Windows 引导管理器来要少很多工作，后者需要占用引导扇区的前 512 个字节并使它成为 boot.ini 文件中的一个选项。Red Hat 7.1 也使用 EEE，但标准分发版中的 PCMCIA 驱动程序会在一台机器上引起内核恐慌。7.1 和 7.2 都具有新的 Linux 内核 V2.4。这有许多重要改进，尽力获得新分发版是值得的。

我建议使用定制安装选项，该选项允许文件系统分配。它还提供了屏幕来让您选择想要安装的软件包。打算将 1.3 GB 的空间用于相当全面的 Linux 映象。这包括完整的开发环境、Web 服务器、Perl 和 Python 等。

我惊喜地发现，在 SuSE 缺省安装时，在 /etc/hosts 文件中有多个 IP V6 项。当我们在因特网上用完地址时，使人们转向 ipv6 是一件好事情，因为它提供了多达数个数量级的地址。我还针对 Windows XP 分区测试了 SuSE 的引导管理器，它引导到 Linux 或 Windows，而且不会产生任何问题。

请访问，这上面收集了有关如何处理大多数配置问题的优秀文章。
更改 xinetd 以接受 rsh。
当前的 Linux 分发版做了一件好事情，新安装可以进行网络访问。但这意味着您一定要明确地启用您想要使用的功能部件。您可能会认为这太过多疑了，但您错了。我通过可用的 Telnet 和 ftp 将一台旧的速度缓慢的 486 PC 与有线电视调制解调器连接。果然，有人闯入了该机器。甚至连破旧的机器也不能躲过黑客的注意。

/etc/rc.d/rc3.d 目录包含在运行级别 3 上运行的所有脚本。每个以“S”开头的脚本都是用参数“start”运行的。您可以浏览这些脚本，以更好地了解所有这些消息在启动和关闭时是如何出现的以及它们的真正含意。
更改 SuSE 或 Red Hat 7.1 和 7.2 的内核参数。
这多有趣呀！您可以更改而不必重新编译内核。疑难解答一节描述了如果您不作这一更改的话，您将获得的错误消息。您将能够启动引擎，但如果没有增加参数 msgmni，连接到数据库的尝试将失败。
安装公共域 ksh。
db2_all 脚本依赖于公共域 ksh。可以通过链接 bash 可执行文件并称之为 ksh 来解决这一问题，但这种逃避手段只对某些命令起作用。继续安装 pdksh。如果愿意，您也可以呆在 bash 中完成您想做的每件事情。
以 root 用户身份登录，安装 DB2 EEE V7.2。
要使用的最佳文档是快速入门 — 请参阅：
DB2 for UNIX Quick Beginnings GC09-2970，它包含了很好的逐步安装信息。

安装屏幕类似于图 3：

请对用户标识全部使用缺省值，因为剩余的指示信息都使用缺省值。图 4显示了数据库服务器和管理服务器的缺省用户。
编辑 /etc/services 文件，添加粗体显示的行。
每个逻辑节点都需要一个通信端口来侦听连接请求并与其它节点对话。请记住：当节点处理其本地数据时，它需要与其它节点进行通信来回传结果集。逻辑节点使用的端口范围在 /etc/services 中用 _END 语法保留。

如果没有额外的侦听器端口，就不能启动多个逻辑节点！
以用户 db2inst1 身份登录，设置该用户的 rsh。
对于要对话的节点来说，它们必须相互信任。您可以使用 .rhosts 文件或者让系统管理员（在您自己的 Linux 机器上是您自己）将那些项置于 /etc/hosts.equiv 中。
测试安装。
此时，您已经连接到单个 DB2 EEE 节点实例。下一步是关闭该实例，然后添加另一个逻辑节点。如果您遇到连接问题，请确保存在名为“sample”的数据库。
数据库停止后，编辑文件 ./sqllib/db2nodes.cfg。
这是定义附加节点的方法。第一个数字是节点号，下一项是 TCP/IP 节点名，第三项是节点将用来通信的端口。这是服务器实例的 /etc/services 中端口号的偏移量。不必担心，在所示的示例文件中，我不会尝试将真实的端口 0 和真实的端口 1 用于 DB2。
启动多个逻辑节点。
祝贺您！您已经完成了。现在，您正在模拟在无共享群集中运行两个不同的计算机。当数据库产生时，它将为第二个节点创建数据副本。
创建跨节点进行分区的表。请注意新的语法：
PARTITIONING KEY(foo) USING HASHING;
这是指定哪个列用于分区数据的方法。请记住：列 foo 中的值应该有高基数（假定没有许多重复值）。
将一些数据插入表中。
如果您更喜欢用另一种方法来插入行，请随意。该程序将一个递增整数插入列 foo 中。

查看分区分布。
该步骤中所示的查询显示了行在 4096 个散列存储区之间是如何分布的。随着更多的键值混编到特定存储区，散列存储区不断增大。这表示某些散列存储区的值可以比其它散列存储区多。这是任何散列算法所固有的，不会有负面影响，除非有一个显著的散列偏离。如果发生显著的偏离，您或许要查看分区键的基数并挑选一些值更为独特的东西。

select partition ( foo) as Partition_Hash,
            

?????count(*) as Hash_Count
            

from marty
            

group by??partition ( foo)
            

order by count(*) desc
            

fetch first 10??rows only ;
            

                        

PARTITION_HASH HASH_COUNT
            

-------------- -----------
            

?????????
2626??????????17
            

??????????3464??????????15
            

???????????307??????????13
            

???????????329??????????13
            

???????????746??????????13
            

??????????1913??????????13
            

???????????107??????????12
            

???????????492??????????12
            

???????????847??????????12
            

??????????1021??????????12
            

                        

??10 record(s) selected.

最后一个步骤。）
祝贺您！享受您的选择吧！如果您到此没有任何错误，我会很激动。如果有错误，我希望下面一节会尽量减少您的烦恼。

回页首

万一某一步骤出错，下面是各种错误消息的参考和修正它们所需的步骤。

消息：SQL6031N 错误

症状：

SQL6031N??Error in the db2nodes.cfg file at line number "2". Reason code "12".

诊断：要查找该错误的文本，使用 db2 命令环境

$ db2 ? SQL031N

              

                            

Reason code ?2? states:

(12) Ensure that you only use port values that are specified in
the services file (/etc/services file on UNIX-based systems) for
your instance.

解决方案：要修正该问题，根据上面第 6 步的描述更新 /etc/services。

消息：SQL6048N 通信错误
该消息可能出现在启动和停止处理期间，如第 10 步中所描述的那样。该问题的根源要回到第 2 步。导致出现该消息的其它可能问题是 pdksh 问题，我们将在下面讨论它。

症状：

[db2inst1@poohbah db2inst1]$ db2start
              

12-31-2001 09:29:32?????0???0???SQL6048N??A communication error occurred during START or STOP DATABASE MANAGER processing.
              

12-31-2001 09:29:32?????1???0???SQL6048N??A communication error occurred during START or STOP DATABASE MANAGER processing.
              

SQL1032N??No start database manager command was issued.??SQLSTATE=57019

              

                            

SQL6048N A communication error occurred during START or STOP
              

??????????DATABASE MANAGER processing.

诊断：
节点无法彼此对话。节点必须通信，才能传输 SQL 查询和接收回结果集。

下面显示了该错误消息的全文：

Explanation: A TCP/IP communication error occurred while the START or STOP DATABASE MANAGER 
	command was trying to establish connection with all the nodes defined in the sqllib/db2nodes.cfg file.

              

                            

User Response: Do the following:: Ensure that the node has the proper a
	uthorization defined in the .rhosts or the host.equiv files.

              

                            

If using multiple logical nodes, ensure the DB2NODE environment 
variable is set correctly. The DB2NODE environment variable indicates the node the application
	will attempt to connect to. DB2NODE must be set to the node number of one of the nodes 
	defined on the same host as the application.

解决方案：
在 db2inst 主目录中添加 .rhosts 文件，通过输入下列命令，验证 rsh 是否正在运行：

$ rsh localhost echo hi

文本“hi”将出现在标准输出上。您可以用下列命令进一步验证功能的正确性：

$ db2_all echo hi

应该在标准输出上获得字符串“hi”，db2_all 的成功操作指出您还正确地安装了 pdksh。如果 db2_all 失败，请阅读下一个错误消息。

消息：SQL6048N

症状：
由于第 2 步中 rsh 设置出现的问题，我们可能已经看到了这一错误消息。如果没有按照第 4 步所描述的那样安装 pdksh，那么也会出现该错误。

[db2inst1@poohbah db2inst1]$ db2start
              

12-31-2001 10:21:42?????0???0???SQL6048N??A communication error occurred during START or STOP DATABASE MANAGER processing.
              

12-31-2001 10:21:42?????1???0???SQL6048N??A communication error occurred during START or STOP DATABASE MANAGER processing.
              

SQL1032N??No start database manager command was issued.??SQLSTATE=57019

诊断：
这些错误是由于丢失 /bin/ksh 引起的。

解决方案：
按照下面的指示信息安装公共域 Korn shell：

rpm -i /mnt/cdrom/RedHat/RPMS/pdksh-5.2.14-13.i386.rpm

消息：SQL0902C 系统错误

症状：
数据库启动，但在连接时发生错误。在 Red Hat 7.1 和 Red Hat 7.2 平台上出现的错误有所不同。

Red Hat Linux 7.2 上的内核参数错误：

[db2inst1@poohbah db2inst1]$ db2start
              

01-03-2002 10:41:45?????1???0???SQL1063N??DB2START processing was successful.
              

01-03-2002 10:41:46?????0???0???SQL1063N??DB2START processing was successful.
              

SQL1063N??DB2START processing was successful.
              

[db2inst1@poohbah db2inst1]$ db2 connect to sample
              

SQL0902C??A system error (reason code = "") occurred.
              
Subsequent SQL statements cannot be processed.??SQLSTATE=58005
              

[db2inst1@poohbah db2inst1]$

Red Hat Linux 7.1 上的内核参数错误：

[db2inst1@mikado db2inst1]$ db2start
              

01-03-2002 11:19:14?????1???0???SQL1063N??DB2START processing was successful.
              

01-03-2002 11:19:16?????0???0???SQL1063N??DB2START processing was successful.
              

SQL1063N??DB2START processing was successful.
              

[db2inst1@mikado db2inst1]$ db2 connect to sample
              

SQL1084C??Shared memory segments cannot be allocated.??SQLSTATE=57019
              

[db2inst1@mikado db2inst1]$

诊断：
未正确设置 Linux 内核参数。

解决方案：
要修正该问题，可按照第 3 步所描述的那样更改内核参数。

可以通过更新 /etc/sysctl.conf 文件，使这个更改在重新引导时自动操作。

如下验证操作是否成功：

[db2inst1@poohbah db2inst1]$ db2 connect to sample

              

                            

???Database Connection Information

              

                            

?Database server????????= DB2/LINUX 7.2.0
              

?SQL authorization ID???= DB2INST1
              

?Local database alias???= SAMPLE

消息：SQL30081N 或 SQL1013N

症状：
在 Linux 和 Windows 2000 上，您会获得下列错误：

C:\\>db2 connect to sample
              

C:\\>db2 connect to sample
              

SQL30081N??A communication error has been detected.??
	Communication protocol being used: "TCP/IP".??Communication API being used: "SOCKETS".
              

Location where the error was detected: "".
              

Communication function detecting the error: "connect".
              

Protocol specific error code(s): "10060", "*", "*".
              

SQLSTATE=08001
              

                            

C:\\>db2 connect to grommit
              

SQL1013N??The database alias name or database name "GROMMIT" could not be found.
              

SQLSTATE=42705

诊断：
您正在设法连接的数据库不存在。

解决方案：
对于这两条消息，使用下列命令来列出实例中所有数据库的名称：

db2 attach to yourinstancenamehere
              

db2 list database directory

??连接到存在的数据库，或者如下创建一个新的数据库：

db2 create database sample

确保您连接到正确的实例。如果您有任何疑问，输入下列命令来查看所有实例名：

db2ilist

阅读(1650) | 评论(0) | 转发(0) |

上一篇：探悉Servlet的init方法［转载］

下一篇：Linux下安装OpenSSH［转载网络未做测试验证］

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6