刘胜涛
作者刘胜涛2014-04-03 15:24
数据库管理员, Volkswagen Group China

绝对原创:手把手教你搭建虚机pureScale

字数 13480阅读 16802评论 47赞 13
1、环境准备

硬件环境:3 x86-64虚拟机,内存要求 1.5G 或以上(主要针对虚拟机,内存过低会造成数据库实例启动失败)

操作系统:Suse Linux Enterprise Server 11.3

DB2 版本:DB2 v10.5

机器名:node01 node02 node03

IP192.168.18.201 192.168.18.202 192.168.18.203

网关:192.168.18.2

利用iscsi服务来做共享存储功能,其中node01 作为 iscsi Servernode01node02 node03 作为 iscsi Client,这样三台虚拟机上都能看到相同的磁盘了(按照developer workers上的文章:非 InfiniBand 环境下搭建 DB2 pureScale,我用DB2 v10.5时启动实例失败,可能10.5做了限制,CFmember在同一台机器启动失败,帮多了一台虚拟机)。

2、操作系统安装:

Node01预留出一块分区,不进行格式化(文件类型为0x83 Linux)做为 pureScale 集群的 Sharing Disk 使用,Node02Node03node01其它相同就可,

安装必要的包:

libstdc++32 位和 64 位库)
glibc
32 位和 64 位库)
cpp
gcc
gcc-c++
kernel-source
binutils
ksh-93u-0.8.1

openssh

ntp

完成SUSE 11 SP3的安装。

验证:检查/lib/modules/3.0.76-0.11-default/build/include/linux有无autoconf.h,如果没有autoconf.h,安装DB2时会报Compiling GPL :.......Failure错误。

解决方法:cp –v  /usr/src/linux-3.0.76-0.11-obj/x86_64/default/include/generated /lib/modules/3.0.76-0.11-default/build/include/linux

 

 

3、添加用户和用户组

三台机器全部执行如下命令(如果不做特殊说明,以#表示root身份登录,以$表示db2inst1身份,以下相同)

#groupadd -g 1001 db2fadm1

#groupadd -g 1002 db2iadm1

#useradd -g db2fadm1  -u 1001 -m  -d /home/db2fenc1  -p db2fenc1  db2fenc1

#useradd -g db2iadm1  -u 1002 -m  -d /home/db2inst1   -p db2inst1  db2inst1

#mkdir /root/.ssh

# su - db2inst1 -c "mkdir -p /home/db2inst1/.ssh"

4、配置ssh 信任连接

ssh信任通俗的说就是直接ssh不用输入密码

/etc/hosts添加另外两台机器的IP地址及机器名(确保3台机器名与ip地址全部出现在hosts文件中)

例如我的机器hosts如下:

127.0.0.1       localhost

192.168.18.201  node01.site  node01

192.168.18.202  node02.site  node02

192.168.18.203  node03.site  node03

node01执行如下命令:

#ssh-keygen -t rsa

#cp -v  /root/.ssh/id_rsa.pub /root/.ssh/id01

#scp  /root/.ssh/id01 node02:/root/.ssh

#scp  /root/.ssh/id01 node03:/root/.ssh

#su - db2inst1

$ssh-keygen -t rsa

$cp -v  /home/db2inst1/.ssh/id_rsa.pub     /home/db2inst1/.ssh/id01

$scp   /home/db2inst1/.ssh/id01   node02:/home/db2inst1/.ssh

$scp   /home/db2inst1/.ssh/id01   node03:/home/db2inst1/.ssh

 

node02执行如下命令:

#ssh-keygen -t rsa

#cp -v  /root/.ssh/id_rsa.pub            /root/.ssh/id02

#scp  /root/.ssh/id02           node01:/root/.ssh/

#scp  /root/.ssh/id02           node03:/root/.ssh/

#su - db2inst1

$ssh-keygen -t rsa

$cp -v  /home/db2inst1/.ssh/id_rsa.pub  /home/db2inst1/.ssh/id02

$scp   /home/db2inst1/.ssh/id02 node01:/home/db2inst1/.ssh/

$scp   /home/db2inst1/.ssh/id02 node03:/home/db2inst1/.ssh/

 

node03执行如下命令:

#ssh-keygen -t rsa

#cp -v  /root/.ssh/id_rsa.pub /root/.ssh/id03

#scp   /root/.ssh/id03  node01:/root/.ssh

#scp   /root/.ssh/id03  node02:/root/.ssh

#su - db2inst1

$ssh-keygen -t rsa

$cp -v  /home/db2inst1/.ssh/id_rsa.pub  /home/db2inst1/.ssh/id03

$scp   /home/db2inst1/.ssh/id03  node01:/home/db2inst1/.ssh/

$scp   /home/db2inst1/.ssh/id03  node02:/home/db2inst1/.ssh/

分别在node01node02node03执行如下命令

#cd  /root/.ssh

#cat id01 id02 id03 > authorized_keys

#chmod 600 authorized_keys

#su - db2inst1

$cd /home/db2inst1/.ssh

$ cat id01 id02 id03 > authorized_keys

 

测试是否配置成功

3台机器分别以rootdb2inst1执行:

#ssh node01 ls

#ssh node02 ls

#ssh node03 ls

#su - db2inst1

$ssh node01 ls

$ssh node02 ls

$ssh node03 ls

确保不用输入密码,则配置成功。

5、ISCSI 共享存储配置

Iscsi server端配置(node01上执行):

修改/etc/ietd.conf,添加如下内容:

Target iqn.2014-03.node01.site:scsidisk01

Lun 0 Path=/dev/sda4,Type=fileio

注意:我的未分区硬盘为/dev/sda4,你的可能不一样的@_@~~~~

添加自启动

#chkconfig -a  iscsitarget

检查是否成功

#chkconfig  -l  iscsitarget

结果:iscsitarget  0:off  1:off  2:off  3:on   4:off  5:on   6:off

重启iscsitarget服务

# /etc/init.d/iscsitarget restart

iscsi client端配置(node01node02node03执行,):

iscsitarget文件内容如下:

#! /bin/sh

### BEGIN INIT INFO

# Provides: iscsiclsetup

#node02node03上如果未装iscsitarget需将下下行的$iscsitarget

# Required-Start: $network $syslog $iscsitarget $remote_fs smartd

# Required-Stop:

# Default-Start: 3 5

# Default-Stop: 0 1 2 6

# Description: ISCSI client setup

### END INIT INFO

case "$1" in  start)

iscsiadm  --mode discoverydb  --type sendtargets  --portal 192.168.18.201 --discover

iscsiadm --m node --targetname iqn.2014-03.node01.site:scsidisk01 --portal 192.168.18.201:3260 --login

;;

stop)

 iscsiadm -m node -T iqn.2014-03.node01.site:scsidisk01  -p 192.168.18.201 --logout

;;

restart)    ## Stop the service and regardless of whether it was    ## running or not, start it again.   

$0 stop   

$0 start   

;;

  *)

Esac

保存后执行:#/etc/init.d/iscsiclient restart

验证iscsiclient是否启动成功:

#fdisk -l

检查有无/dev/sdb出现

6、配置Linux环境变量

/etc/profie.local添加内容

alias sl='tail -f /var/log/messages'

alias fc='fcslogrpt /var/log/messages'

export PATH=/root/bin:/usr/sbin/rsct/bin:/opt/ibm/db2/v10.5/bin:$PATH

export PATH=/usr/lpp/mmfs/bin:$PATH

export DB2USENONIB=TRUE

export DB2_CFS_GPFS_NO_REFRESH_DATA=true

然后执行# . /etc/profile.local,完成后你就可以安装purescale了,我猜测应该是设置了变量DB2USENONIB,使purescale不再要求你强制InfiniBand或万兆网卡,使我等穷人可以有机会玩这种高档、洋气、上档次的数据库。。。

7、DB2 V10.5 的安装:

node01:~/server_t # ./db2_install

DBI1324W  Support of the db2_install command is deprecated. For

      more information, see the DB2 Information Center.

Default directory for installation of products - /opt/ibm/db2/V10.5

***********************************************************

Install into default directory (/opt/ibm/db2/V10.5) ? [yes/no]

yes

Specify one of the following keywords to install DB2 products.

  SERVER

  CONSV

  EXP

  CLIENT

  RTCL

Enter "help" to redisplay product names.

Enter "quit" to exit.

***********************************************************

server

***********************************************************

Do you want to install the DB2 pureScale Feature? [yes/no]

Yes

 

曾经出现的错误:

ERROR: An error occurred while compiling IBM General Parallel File System

(GPFS) Portability Layer (GPL) on host "node01". Return code "2". GPL

compilation log file location  "/tmp/compileGPL.log.000". The GPFS file system

cannot be mounted properly until the GPL module is successfully compiled on

this host.  For details, see the specified GPL compilation log. After fixing

the problems shown in the log file, re-run the DB2 installer. For information

regarding the GPFS GPL module compile, see DB2 Information Center.

 

Compiling GPL :.......Failure

ERROR: A major error occurred while installing "DB2 Server Edition " on this

computer.

解决方案:

查看错误日志:compileGPL.log.000,为以下内容:

cd /usr/lpp/mmfs/src/config; ./configure --genenvonly; if [ $? -eq 0 ]; then /usr/bin/cpp -P def.mk.proto > ./def.mk; exit $? || exit 1; else exit $?; fi

手工执行时会发现在./configure --genenvonly; 这一步报找不到

/usr/bin/diff: /lib/modules/3.0.76-0.11-default/build/include/linux/autoconf.h: No such file or directory

Kernel source tree does not have the correct autoconf.h file.

See /usr/lpp/mmfs/src/README for further information

手工拷呗一下autoconf.h文件即可

#cp –v /usr/src/linux-3.0.76-0.11-obj/x86_64/default/include/generated/autoconf.h /lib/modules/3.0.76-0.11-default/build/include/linux/

 

GPFS 文件系统配置与挂载

方法1:使用db2cluster_prepare

node01上执行:

#/opt/ibm/db2/v10.5/instance/db2cluster_prepare -instance_shared_dev /dev/sdb

DBI1446I  The db2cluster_prepare command is running.

DB2 installation is being initialized.

 

 Total number of tasks to be performed: 1

Total estimated time for all tasks to be performed: 60 second(s)

 

Task #1 start

Description: Creating IBM General Parallel File System (GPFS) Cluster and Filesystem

Estimated time 60 second(s)

Task #1 end

 

The execution completed successfully.

 

For more information see the DB2 installation log at

"/tmp/db2cluster_prepare.log".

DBI1070I  Program db2cluster_prepare completed successfully.

此时df -l查看一下会发现多了一个挂载点

node01:/opt/ibm/db2/V10.5/instance # df -l

Filesystem     1K-blocks    Used Available Use% Mounted on

/dev/sda2       19599036 8122392  10481060  44% /

udev              958688     120    958568   1% /dev

tmpfs             958688      76    958612   1% /dev/shm

/dev/sda3       10327940  154460   9648836   2% /home

/dev/db2fs1     15728640  627712  15100928   4% /db2sd_20140401103940

 

曾经出现报错:

 

 DBI20022E The DB2 installer detected that the variable record "GPFS_CLUSTER" is

defined in the global registry. However, the GPFS cluster does not exist on

host "node01".

Creating IBM General Parallel File System (GPFS) Cluster and Filesystem :.......Failure

查看/tmp/ibm.db2.cluster.GuOypP发现有如下内容报错:

014-04-01-10.26.12.358494+480 I5385E400             LEVEL: Warning

PID     : 7469                 TID : 139670848014112 PROC : db2cluster

INSTANCE:                      NODE : 000

HOSTNAME: node01

FUNCTION: DB2 UDB, oper system services, sqloMessage, probe:1

MESSAGE : Cannot obtain registry variables

DATA #1 : Hexdump, 4 bytes

0x00007FFF17631758 : B400 0F87

解决方案:由于此前我在此机器上试过Ndb2cluster_prepare,包括V9.8V10.1V10.5安装,导致全局注册表变量没有删除干净,使用db2greg -dump

V,GPFS_CLUSTER,NAME,db2cluster_20140403105617.site,-,DB2_CREATED将其删除。

#cp -v /var/db2/global.reg  /var/db2/global.reg_20140401 

#db2delgreg -delvarrec service= GPFS_CLUSTER

总结:db2cluster_prepare这个命令失败时

  1. 检查iscsi client是否准备好,fdisk -l查看一下是否有/dev/sdb
  2. 全局注册表变量是否未删除干净 ,db2greg -dump查看
  3. 检查一下是否tsadomain存在,lsrpdomain,使用rmrpdomain将其删掉,如果其node为活动需先将其node停掉。具体参考tsa相关命令,
  4. 检查一下gpfs cluster domain是否未清理干净,如果未清理干净,需要使用将fsnsdnode清理掉,具体命令参考gpfs信息中心。

 

方法2:手工挂载GPFS

遇到过使用db2cluster_prepare时无法成功,手工安装(不确定是否遇到了传说中的bug)。

  1. 创建cluster,不加-filesystem -disk选项:

node01:

#db2cluster -cfs -create -domain  mydomain -host node01

#db2cluster -cfs -add  -host node02

# db2cluster -cfs -add  -host node03

说明:上面如果不出故障当然可以加上-filesystem –disk参数,当然也可以用mmaddnode –N XXX来添加节点

  1. 添加许可协议:

提供两种方法

#mmchlicense server --accept -N node01,node02,node03

#/opt/ibm/db2/v10.5/bin/db2cluster -cfs -add -license

  1. 创建nsd:任意node执行

编写newNSD文件内容如下

%nsd:

  device=/dev/sdb

  nsd=nsd1

  usage=dataAndMetadata

#mmcrnsd -F /tmp/newNSD (-v no)

如果报mmcrnsd: Disk device sdb refers to an existing NSD,而使用mmlsnsd 又查找不到相应的nsd,添加-v no可以跳过此验证。 

#mmlsnsd 查看创建的nsd名称,记下,在第3步时需要用到.

  1. 创建Cluster File System并挂载

启动所有node,任意node执行 

#mmstartup -a

#mmgetstate -a

确保所有node全部启动成功为active

# mmcrfs -T /db2sd_20140401   db2sd_20140401   nsd1(此处的nsd1为第2步的nsd名称)

#mmmount all -a

 

--曾经出现的错误:mmstartup -a无响应

,查看日志/var/adm/ras/mmfs.log.previous

Tue Apr  1 22:02:11 CST 2014: runmmfs starting

Removing old /var/adm/ras/mmfs.log.* files:

Unloading modules from /lib/modules/3.0.76-0.11-default/extra

runmmfs: The /lib/modules/3.0.76-0.11-default/extra/mmfslinux.ko kernel extension does not exist.

runmmfs: Unable to verify kernel/module configuration.

Loading modules from /lib/modules/3.0.76-0.11-default/extra

runmmfs: The /lib/modules/3.0.76-0.11-default/extra/mmfslinux.ko kernel extension does not exist.

runmmfs: Unable to verify kernel/module configuration.

Tue Apr  1 22:02:11 CST 2014 runmmfs: error in loading or unloading the mmfs kernel extension

Tue Apr  1 22:02:11 CST 2014 runmmfs: stopping GPFS

解决方案:重新编译一下gpfs的源码,因为手工卸载gpfs

/usr/lpp/mmfs/src/README有详细的编译方法:主要命令方法如下:

#cd /usr/lpp/mmfs/src

#make Autoconfig

#make InstallImages

make InstallImages会在/lib/modules/`uname -r`/extra目录生成3个文件,大功告成.

  创建实例

创建实例前:

node02#/opt/ibm/db2/V10.5/instance/db2icrt -cf  node01 -cfnet node01

  -m node02 -mnet node02 -instance_shared_dir /db2sd_20140401

 -tbdev 192.168.18.2 -u db2fenc1 db2inst1

-tbdev  官方解释为:Specifies a shared device path for a device that will act as a tiebreaker in the DB2 pureScale environment to ensure that the integrity of the data is maintained. 通俗的讲就是在member出现故障时,判断哪个member可以恢复服务,穷屌丝们就用网关IP来代替了,只要能 ping 通即可判断为可用。

此时执行:# db2instance  -instance db2inst1 -list可以查看

node01:/opt/ibm/db2/V10.5/instance # mmlscluster

GPFS cluster information

========================

  GPFS cluster name:         db2cluster_20140401103900.site

  GPFS cluster id:           6571095102926235332

  GPFS UID domain:           db2cluster_20140401103900.site

  Remote shell command:      /var/db2/db2ssh/db2locssh

  Remote file copy command:  /var/db2/db2ssh/db2scp

 

GPFS cluster configuration servers:

-----------------------------------

  Primary server:    node01.site

  Secondary server:  node02.site

 

 Node  Daemon node name  IP address      Admin node name  Designation

----------------------------------------------------------------------

   1   node01.site       192.168.18.201  node01.site      quorum-manager

   2   node02.site       192.168.18.202  node02.site      quorum-manager

曾经出现报错:

错误1、报2632-0442632-068,此类错误为创建tsa domain时的错误,原因在于虚拟机是拷贝的,不是重新安装的。

解决方法:#/usr/sbin/rsct/install/bin/recfgct

 

启动实例

node01:$/home/db2inst1/sqllib/adm/db2start

怎么样,报错了吧,应该是SQL1721N

SQL1721N  Starting the DB2 database manager failed because of a problem with a configuration file that is needed by RDMA.受打击吧。

你装完了实例启动不了,没关系,这么高档的玩意怎么能让你这么快启动啊。

你得设置两个注册表变量才能用普通网络.

$db2set DB2_SD_SOCKETS_RESTRICTIONS=false

$db2set DB2_CA_TRANSPORT_METHOD=SOCKETS

使用如下命令可以查看CFmember的状态。

#db2instance  -instance db2inst1  -list

node01:/home/db2inst1 # db2instance  -instance db2inst1 -list
ID        TYPE             STATE                HOME_HOST               CURRENT_HOST            ALERT   PARTITION_NUMBER        LOGICAL_PORT    NETNAME
--        ----             -----                ---------               ------------            -----   ----------------        ------------    -------
0       MEMBER           STARTED                   node02                     node02               NO                  0                   0     node02
128     CF               PRIMARY                   node01                     node01               NO                  -                   0     node01

HOSTNAME                   STATE                INSTANCE_STOPPED        ALERT
--------                   -----                ----------------        -----
  node01                  ACTIVE                              NO           NO
  node02                  ACTIVE                              NO           NO

此时你可以使用lssam查看tsa的两个节点的状态。

#lssam


添加成员

node03添加为另一个member,如果实例没有启动会自动启动实例,所以预先将上一步的两台机器上的db2set执行完毕先。

node01:

#/opt/ibm/db2/v10.5/instance/db2iupdt -d -add -m node03 –mnet node03 db2inst1

#su - db2inst1 -c "db2start member 1"

开启你的purescale之旅

#db2sampl

执行完毕后两台member都可以看到数据库sample,可以同时对库进行操作

 

后记 purescale确实非常好用,也非常好玩。一共是4个产品组成:TSARSCTGPFSDB2,我从亲手开始搭建到最后成功耗费了我大量精力,现将我的历程整理出来,希望大家少走弯路,你亲自搭建时会遇到各种各样的问题,GOOD LUCK 感参考了两篇purescale文章,其中一篇的作者长臂虾还对我进行了指导。感谢张东焕老师为我提供的GPFS的资料。关于purescale交流,欢迎拍砖,QQ41334906

 

参考资料

1、在非 InfiniBand 环境下搭建 DB2 pureScale在非 InfiniBand 环境下搭建 DB2 pureScale在非 InfiniBand 环境下搭建 DB2 pureScale在非 InfiniBand 环境下搭建 DB2 pureScale在非 InfiniBand 环境下搭建 DB2 pureScale在非 InfiniBand 环境下搭建 DB2 pureScale在非 InfiniBand 环境下搭建 DB2 pureScale

http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1207maoq/

2DB2 10.1 pureScale in VMware

http://www.zinox.com/node/184

3GPFS信息中心

http://publib.boulder.ibm.com/infocenter/clresctr/vxrx/index.jsp?topic=/com.ibm.cluster.gpfs.doc/gpfsbooks.html

4TSA信息中心(Tivoli System Automation for Multiplatforms)

http://pic.dhe.ibm.com/infocenter/tivihelp/v3r1/index.jsp


此外,在DB2 10.5中还有一个非常大的功能改进,增加了BLU加速器。


BLU加速器是新版DB2数据库中的一个功能,它的作用类似于一个列式分析型DBMS。BLU能够线性垂直扩展到64核CPU,而水平扩展将很快实现。IBM建议所有面向分析负载的DB2表都应该使用BLU加速器。第一个版本的BLU加速器针对10 TB级别数据库进行了优化,其能力可以处理20 TB数据。


  BLU加速器在技术方面的创新亮点包括:

  • 查询功能完全管道化(pipelining ),表扫描可以共享;
  • 数据忽略(Data Skipping)功能能够有效降低I/O;
  • 基于单指令多数据结构(SIMD)的矢量化(Vectorization );
  • 概率缓存取代传统LRU(Least Recently Used),经常被引用的数据块出现在内存当中的几率就越大。这一功能的背后还有更复杂的随机算法支持;
  • “自动化工作负载管理”功能,IBM认为查询之间的资源争用是造成资源浪费的主要原因,这一功能让BLU加速器与传统DB2数据库相比在并发性上产生差异性优势。

目前正在进行一些测试,有最新的内容,我到时在博客上进行更新。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

13

添加新评论47 条评论

刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-11-27 10:49
你的两台机器信任没有配置好。
dengrpdengrp软件开发工程师, Truly
2014-11-25 20:18
db2cluster_prepare -instance_shared_dev /dev/sdb创建GPFS时提示需要输入密码,为什么?怎么fix?
gtj1208gtj1208数据库架构师, 金融行业
2014-10-08 10:40
收了,先安装一遍试试
lichuan128lichuan128系统工程师, 中科软
2014-08-04 18:49
在本地可以连接上数据库,我的笔记本电脑到虚拟机的网络没有问题。
lichuan128lichuan128系统工程师, 中科软
2014-08-04 18:48
我是按照您的文档配置的db2 pureScale集群环境,实例信息如下:
[db2inst1@db2node02 ~]$ db2instance -list
ID          TYPE                   STATE                HOME_HOST                CURRENT_HOST                ALERT        PARTITION_NUMBERLOGICAL_PORT        NETNAME
--          ----                   -----                ---------                ------------                -----        ----------------------------        -------
0        MEMBER                 STARTED                db2node02                   db2node02                   NO                       0           0        db2node02
1        MEMBER                 STARTED                db2node03                   db2node03                   NO                       0           0        db2node03
128        CF                 PRIMARY                db2node01                   db2node01                   NO                       -           0        db2node01

HOSTNAME                   STATE                INSTANCE_STOPPED        ALERT
--------                   -----                ----------------        -----
db2node03                  ACTIVE                              NO           NO
db2node01                  ACTIVE                              NO           NO
db2node02                  ACTIVE                              NO           NO
[db2inst1@db2node02 ~]$
lichuan128lichuan128系统工程师, 中科软
2014-08-04 18:47
您好:我最近在用db2 data studio和在WAS 配置数据库源,测试数据库的连接,一直报错。我是参照:http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1307purescale/index-newv7.html#ibm-pcon这个文章配置的,报错信息如下:
连接尝试未成功。

摘要

SQL4499N  与数据源断开连接导致发生致命错误。

请尝试以下建议来帮助解决问题:

确保已启动数据服务器。
检查使用的数据库名称是否为实际数据库名称,而不是别名。
检查主机是否为有效的名称或 IP 地址,端口号是否为可与数据服务器通信的有效端口号。
要进一步诊断问题,请返回“属性”部分,然后使用“跟踪”页面来启用跟踪。请联系数据库管理员,并提供跟踪和其他可用的支持信息。
完整消息内容: [jcc][t4][2030][11211][4.16.53] 在对连接的底层 socket、socket input stream 或 socket output stream 执行操作期间
发生通信错误。错误位置:Reply.fill() - socketInputStream.read (-1)。消息:Connection reset。

说明

<b>说明:</b><br/><br/>尝试访问了找不到、未启动或不支持事务的数据库。
<br/><b>用户响应:</b><br/><br/>确保系统数据库目录中存在指定的数据库名称。如果系统数据库目录中不存在数据库名称,那么数据库不存在或未编目数据库名称。如果需要,请发出 db2start 命令,然后重新提交当前命令。
SQLSSTATE: 08004

支持

连接属性

数据库: SAMPLE
URL: jdbc:db2://192.168.28.202:60000/SAMPLE:retrieveMessagesFromServerOnGetMessage=true;securityMechanism=11;
用户名: db2inst1
密码: (未显示)

环境

驱动程序类名 = com.ibm.db2.jcc.DB2Driver
驱动程序版本 = 4.16.53
驱动程序 JAR 文件路径 = C:IBMBPMSharedpluginscom.ibm.datatools.db2_2.2.0.v20130525_0720driverdb2jcc4.jar;C:IBMBPMSharedpluginscom.ibm.datatools.db2_2.2.0.v20130525_0720driverdb2jcc_license_cisuz.jar
操作系统名称 = Windows 7
操作系统体系结构 = amd64
操作系统版本 = 6.1
JVM 实施供应商 = IBM Corporation
JVM 运行时 = Java(TM) SE Runtime Environment
Java 版本 = JRE 1.7.0 IBM J9 2.6 Windows 7 amd64-64 Compressed References 20130205_137358 (JIT enabled, AOT enabled)
J9VM - R26_Java726_SR4_20130205_1656_B137358
JIT  - r11.b03_20130131_32403
GC   - R26_Java726_SR4_20130205_1656_B137358_CMPRSS
J9CL - 20130205_137358
启动程序 = D:IBMDS4.1.0eclipse.exe

堆栈跟踪

com.ibm.db2.jcc.am.DisconnectNonTransientConnectionException: [jcc][t4][2030][11211][4.16.53] 在对连接的底层 socket、socket input stream 或 socket output stream 执行操作期间
发生通信错误。错误位置:Reply.fill() - socketInputStream.read (-1)。消息:Connection reset。 ERRORCODE=-4499, SQLSTATE=08001com.ibm.db2.jcc.am.fd.a(Unknown Source)
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-29 10:44
CF与member在同一台机器上V10.5的有人成功了都。
daolin2005daolin2005数据库管理员, 某城商行
2014-04-28 17:14
RHEL 6.3 ,db2 V10.1.0.0,CF和Member各在一台机器上,成功了。楼主分享的那个PDF更好!感谢分享.
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-18 15:29
厉害,我试了一次没成功我就加了台机器,你更牛。
taylor840326taylor840326数据库管理员, 中国百盛集团
2014-04-18 14:49
刘胜涛: niubility,这么快啊。
全是刘哥的文档写的好,把能碰到的情况都在文档中说明了。大牛就是大牛!
taylor840326taylor840326数据库管理员, 中国百盛集团
2014-04-18 14:46
我在配置的时候CF与MEMBER放在了同一台机器上,启动成功了。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-17 13:19
niubility,这么快啊。
taylor840326taylor840326数据库管理员, 中国百盛集团
2014-04-17 13:10
按照涛哥的这份文档,已经成功在RHEL6.5系统上把环境搭建起来了。配置过程稍有些不同。待整理后贴到论坛里。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-17 09:32
错误理解你的意思,你说的是实例用户不配信任。我的报错是root不配信任。RHEL有一个关于db2lossh的错误解决办法,详见http://www.db2china.net/club/thread-35385-1-1.html,通过trace我发现在创建实例时根本不会用到实例用户。所以不配问题不大应该。db2ssh这个应该跟实例关系不大,You can configure db2locssh so that you can install the DB2® pureScale® feature without enabling remote root login and passwordless SSH. I think it is none of business instance user.
zhendazhenda数据库管理员, 昆仑银行
2014-04-17 09:13
刘胜涛: 有这个命令,可以不配置啊,这个命令可以甚至不用启用root用户登录。只需用一个db2ssid用户就可以,何必非纠结于此呢,这个命令的实质也是需要生成公钥与私钥,然后将公钥
呵呵,不是纠结,是好奇,有命令为何还报这个错误,原理性的东东是知道的。搞技术的对每个问题细节深入探讨都不过分,哈哈。
taylor840326taylor840326数据库管理员, 中国百盛集团
2014-04-16 15:34
刘胜涛: 有空试试,跟scsi差不多一个原理吧。
就是一个linux系统,只不过配置逻辑卷和配置iscsi都可以在web图形界面下配置。特方便。而且这个系统支持HA。这个系统有商用案例。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-16 13:30
taylor840326: 涛哥,可以试试openfiler做一个软存储,然后你的节点通过IQN号挂载这个存储共享出来的内容。
有空试试,跟scsi差不多一个原理吧。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-16 10:58
有这个命令,可以不配置啊,这个命令可以甚至不用启用root用户登录。只需用一个db2ssid用户就可以,何必非纠结于此呢,这个命令的实质也是需要生成公钥与私钥,然后将公钥进行交换,跟配置信任的ssh的原理其实是一样的。
zhendazhenda数据库管理员, 昆仑银行
2014-04-16 10:52
刘胜涛: 看了文档,确实可以不用配置ssh信任就能玩转,可以使用/var/db2/db21ssh/db2locssh generate_keys来搞定,具体可以参考info center,我是查看linux日志报错才想到的。lin
linux有这个命令,那为什么之前还报错啊。Host Name : target status :The validation completed with errors. DBI20069E Communication could not be established between the t two hosts. Source host: XXX. Target host XXXXDBI20069E.
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-16 10:13
zhenda: 在安装10.5软件时会自动安装实例互信命令,在创建实例时自动执行。我搭建环境aix 7.1.22 有个/var/db2/db2ssh,里面就是相关互信命令,删除db2ssh创建实例时就会报错,实
看了文档,确实可以不用配置ssh信任就能玩转,可以使用/var/db2/db21ssh/db2locssh generate_keys来搞定,具体可以参考info center,我是查看linux日志报错才想到的。linux也有的。
taylor840326taylor840326数据库管理员, 中国百盛集团
2014-04-16 09:06
涛哥,可以试试openfiler做一个软存储,然后你的节点通过IQN号挂载这个存储共享出来的内容。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-11 15:21
有钱淫的家伙,穷人玩不起那么高端的东西。
zhendazhenda数据库管理员, 昆仑银行
2014-04-11 14:59
刘胜涛: 刚试了一下,如果添加实例时不配置ssh会报错,Host Name : target status :The validation completed with errors. DBI20069E Communication could not be establis
在安装10.5软件时会自动安装实例互信命令,在创建实例时自动执行。我搭建环境aix 7.1.22 有个/var/db2/db2ssh,里面就是相关互信命令,删除db2ssh创建实例时就会报错,实例创建失败时不会回滚,会残留较多db2文件,需手工清除。

删除db2ssh后报错信息如下:

ERROR: The specified file, "/var/db2/db2ssh/db2locssh", was not found.

Configuration of instance "db2sdin1" failed on hosts "CF01, DBMEM01"

The value "DB2AUTOSTART=NO" was set in the Profile Registry for the "db2sdin1"
instance.

不知道这个和操作系统是否有关,看看是否有db2ssh这个目录。
zhendazhenda数据库管理员, 昆仑银行
2014-04-11 14:50
刘胜涛: 刚试了一下,如果添加实例时不配置ssh会报错,Host Name : target status :The validation completed with errors. DBI20069E Communication could not be establis
我搭建是有IB卡,即Infiniband卡。最开始也是说需要实例配置ssh,后来发现可以不用配置,只需要配置root即可。已成功搭建。是通过命令行创建的。 在添加cf和member时也不要配置实例的ssh。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-10 10:50
是的,你先要确认你的iscsi server是否工作正常,iqn的命名是有一定规则的,scsi配置我是第一次,这个还真是没有遇到问题。你可以试一下suse就更改一下配置文件就能看到,或者你可视化配置,具体你瞧一下我的链接上的developer上的文章,上面有图形化配置,我为了简化将图形化全部忽略掉了。
hchaohchao网站运营经理, TWT
2014-04-10 09:43
此文就做为刘兄下次答疑的参考教材,呵呵
yellow-finyellow-fin项目经理, 浙江兰德纵横网络技术有限公司
2014-04-10 09:39
我用的suse,具体的配置,是不是提供iSCSI的那台作为“发起程序”,其他的作为“目标”进行配置?
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-09 13:36
你可以使用图形化来配置如果是suse的话。
yellow-finyellow-fin项目经理, 浙江兰德纵横网络技术有限公司
2014-04-09 11:59
iscsi的配置还是有点问题。。。求详解
dxggabdxggab数据库管理员, 公安部四局
2014-04-09 10:03
经过认真学习,刘教授的课就是经典。研究深刻,内容丰富,贴近实战,向刘教授学习。
daolin2005daolin2005数据库管理员, 某城商行
2014-04-08 21:00
NB给力。
yangchao2008yangchao2008数据库运维工程师, NNIT
2014-04-08 17:36
不错!学习学习!
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-08 16:27
刚试了一下,如果添加实例时不配置ssh会报错,Host Name : target status :The validation completed with errors. DBI20069E Communication could not be established between the t two hosts. Source host: XXX. Target host XXXXDBI20069E.
我猜想你应该是用的图形化安装配置的实例,一次性添加多个节点,没有试过图形化。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-08 10:45
你添加节点呢,如果id值不一致会报错的。开了trace在添加实例时用到了ssh node03 XX这样的命令,你可以试一下
zhendazhenda数据库管理员, 昆仑银行
2014-04-08 09:52
DB2 V10.5 在配置ssh时,应该不需要配置实例用户了。purescale会自动生成实例互信。
刘胜涛刘胜涛数据库管理员, Volkswagen Group China
2014-04-08 09:43
共同研究,我也是第一次接触这玩意
zhendazhenda数据库管理员, 昆仑银行
2014-04-07 21:48
最近正在搭建测试purescale,有什么不会的回头请教一下。
daoguo525daoguo525系统工程师, 世纪五岳(北京)科技有限公司
2014-04-07 09:41
shlei6067shlei6067数据库管理员, NJ
2014-04-06 22:50
值得好好学习下
sunyangnjsunyangnj技术经理, 苏宁金融研究院
2014-04-06 16:14
现在还用不到purescale,还在用DPF,以后公司要上purescale,就参考一下
sunyangnjsunyangnj技术经理, 苏宁金融研究院
2014-04-06 16:13
写的很好啊
zhenglyzhengly数据库架构师, 保密
2014-04-04 16:57
taylor840326taylor840326数据库管理员, 中国百盛集团
2014-04-04 09:33
涛哥威武!支持原创!
詹氏归来詹氏归来数据库管理员, IT公司
2014-04-03 17:58
值得学习
欧阳峰欧阳峰其它, Freelancer
2014-04-03 17:18
支持原创
yellow-finyellow-fin项目经理, 浙江兰德纵横网络技术有限公司
2014-04-03 15:33
太棒了。。。
hchaohchao网站运营经理, TWT
2014-04-03 15:27
热乎乎的原创内容啊
Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广