版本约定
操作系统版本centos6.5,64位
jdk1.6的版本也支持jdk1.7的版本
python版本为2.6或者2.7
集群版本cdh5.3.2
cloudera manager 5.3
mysql5.0以上版本
cm安装前说明
防火墙关闭
service iptables stop chkconfig iptables off
关闭selinuxvi /etc/selinux/config设置selinux=disabled
确认端口7180没有被占用
在安装coudera manager 前先安装数据库mysql.并配置数据库的配置文件和创建相应的数据库。需要将mysql数据库默认存储引擎改为innodb.cm安装方式安装方式采用yum安装,由于内网机器无法访问外网,所以我们必须搭建一个本地的yum仓库,yum仓库机器10.100.3.17。
本地yum仓库搭建yum安装所需rpm安装包包括cloudera manager 5 相关安装包,下载地址:http://archive-primary.cloudera.com/cm5/redhat/6/x86_64/cm/5.3.2/rpms/x86_64/ ,
cdh5.3.2相关安装包,下载地址:http://archive-primary.cloudera.com/cdh5/redhat/6/x86_64/cdh/5.3.2/rpms/x86_64/,http://archive-primary.cloudera.com/cdh5/redhat/6/x86_64/cdh/5.3.2/rpms/noarch/
上传相关安装包到10.100.3.17机器/var/ftp/pub/packages目录下,然后执行createrepo命令:
createrepo -g /var/ftp/pub/repodata/repomd.xml /var/ftp/pub/
cdh集群机器配置本地yum源:
cd /etc/yum.repos.d/
rm -rf * #删除无用配置yum源文件
vi ftp-server.repo #加入ftp-server.repo文件加入如下配置:
[base]
name=ftp-server
baseurl=ftp://10.100.3.17/pub/
gpgcheck=0
clouera manager安装cdh集群说明cdh集群机器为3台,分别为10.100.3.95,10.100.3.96,10.100.3.97,10.100.3.98,10.100.3.99
将cloudera manager agent 分别部署在这五台机器上,
将cloudera manager server 和mysql部署在10.100.3.95上
安装jdk首先检查集群机器是否安装过openjdk,如果有安装过,请卸载,执行命令 :
rpm -qa | grep jdk
rpm -e xxx #xxx为上一步输出的rpm包名
在所有机器上安装jdk,并配置java_home,执行命令:
yum install jdk
vi /etc/profile #加入以下配置
export java_home=/usr/java/jdk1.6.0.31
export path=$java_home/bin:$java_home/lib:$path
#使配置生效
source /etc/profile
配置ntp服务
我们需要配置集群ntp时间同步,因为集群安装完毕后cloudera manager会对集群做时间同步检测,如果不同步会报警
bad health --clock offset
the host's ntp service did not respond to a request for the clock offset.
我们采用10.100.3.95作为master机器,所有机器都同步该机器上的时间,所有机器安装ntp服务
yum install ntp
配置95机器上ntp server,修改/etc/ntpd.conf文件加入如下配置
restrict 0.0.0.0master 0.0.0.0nomodify nostrap #让所有网段都可以同步该机器的时间
server 127.127.1.0
fudge 127.127.1.0stratum 8
启动ntp服务
/etc/init.d/ntpd start
chkconfig ntpd on
其他机器同步该机器时间,并且也开启ntpd服务,如果其他机器不开启ntpd服务,cloudera manager同样会报警,因为cloudera manager 会使用ntpdc -c loopinfo 这个命令来判断集群的延迟时间。集群同步时间命令为:
ntpdate 10.100.3.95
#并在crontab中加入命令
crontab -e
*/15* * * * ntpdate 10.100.3.95
安装mysqlcloudera manager通过数据库来管理服务信息和集群配置信息。可以使用内置的postgresql或者外部数据库系统,目前支持mysql,oracle,以及外部postgresql数据库。这里我们安装外部的mysql数据库。
$ yum install mysql mysql-devel mysql-server
#安装mysql后启动;
$ service mysqld start
#配置mysql数据库,添加如下内容,添加以后。重启mysql数据库。如果没报错,则配置成功;
[mysqld]
transaction-isolation = read-committed
# disabling symbolic-links is recommended to prevent assorted security risks;
# to doso, uncomment thisline:
# symbolic-links = 0
key_buffer = 16m
key_buffer_size = 32m
max_allowed_packet = 32m
thread_stack = 256k
thread_cache_size = 64
query_cache_limit = 8m
query_cache_size = 64m
query_cache_type = 1
max_connections = 550
#log_bin should be on a disk with enough free space. replace '/var/lib/mysql/mysql_binary_log'with an appropriate path foryour system and chown the specified folder to the mysql user.
#log_bin=/var/lib/mysql/mysql_binary_log
#expire_logs_days = 10
#max_binlog_size = 100m
# for mysql version 5.1.8or later. comment out binlog_format forolder versions.
binlog_format = mixed
read_buffer_size = 2m
read_rnd_buffer_size = 16m
sort_buffer_size = 8m
join_buffer_size = 8m
# innodb settings
innodb_file_per_table = 1
innodb_flush_log_at_trx_commit = 2
innodb_log_buffer_size = 64m
innodb_buffer_pool_size = 4g
innodb_thread_concurrency = 8
innodb_flush_method = o_direct
innodb_log_file_size = 512m
[mysqld_safe]
log-error=/var/log/mysqld.log
pid-file=/var/run/mysqld/mysqld.pid
移除这两个文件:/var/lib/mysql/ib_logfile0;/var/lib/mysql/ib_logfile1,重启mysql服务。
安装 mysql jdbc connector驱动下载地址:http://dev.mysql.com/downloads/connector/j/5.1.html,把驱动包放在/usr/share/java目录下,如果目录/usr/share/java不存在,则创建它,并且将驱动包重新命名。
$ mkdir -p /usr/share/java/
$ cp mysql-connector-java-5.1.17.jar /usr/share/java/mysql-connector-java.jar
配置mysql设置root账号的密码:
$ sudo /usr/bin/mysql_secure_installation
[...]
enter current password forroot (enter fornone):
ok, successfully used password, moving on...
[...]
set root password? [y/n] y
new password:
re-enter newpassword:
remove anonymous users? [y/n] y
[...]
disallow root login remotely? [y/n] n
[...]
remove test database and access to it [y/n] y
[...]
reload privilege tables now? [y/n] y
all done!
创建mysql数据库
创建数据库用来保存activity monitor,report manager, hive metastore server, sentry server, cloudera navigator audit server, cloudera navigator metadata server服务相关配置信息。
使用root用户登陆mysql数据库
$ mysql -u root -p
enter password:
创建数据库
mysql> create database database default character set utf8;
query ok, 1row affected (0.00sec)
mysql> grant all on database.* to 'user'@'%'identified by 'password';
query ok, 0rows affected (0.00sec)
其中database,user,password查看下表
activity monitor amon amon amon_password
reports manager rman rman rman_password
hive metastore server metastore hive hive_password
sentry server sentry sentry sentry_password
cloudera navigator audit server nav nav nav_password
cloudera navigator metadata server navms navms navms_password
role
database
user
password
安装cloudera manager server
$ yum install cloudera-manager-daemons
$ yum install cloudera-manager-server
配置cloudera manager server数据库这里cloudera manager server和mysql安装在同一台机器,执行命令
/usr/share/cmf/schema/scm_prepare_database.sh mysql -uroot -p --scm-host localhost scm scm scm
出现successful 表示执行成功。
启动cloudera manager server服务
service cloudera-scm-server start
cloudera manager agent 不需要手动安装直接进入cm得web界面自动安装配置即可。
web登录url 格式:http://:
打开浏览器,输入url ,http://10.100.3.95:7180
默认用户名:admin 密码:admin
安装cloudera manager agent,以及cdh相关组件1.根据cm引导界面,选择cloudera express 免费版。点击下一步到为cdh集群安装指定主机。
2.输入需要安装集群的机器ip地址,包括cloudera manager server 机器。
3.选择集群的安装方式,选择使用数据包,cdh版本选择自定义,并输入yum源地址ftp://10.100.3.17/pub/, cloudera manager agent选择自定义,输入yum源地址ftp://10.100.3.17/pub/。点击继续
4.集群安装状态,可以看到每台集群的安装状态,如果正常则进入下一步。
5.选择要安装的cdh组件,我们选择自定义,安装hbase、hdfs、hive、hue、key-value store indexer、oozie、solr、spark、sqoop 2、yarn、zookeeper服务。点击继续
6.cm会检测安装环境,会提示一处安装警告: cloudera 建议将/proc/sys/vm/swappiness设置为0,当前设置为60, 我们需要在集群每台机器上执行命令:
echo 0> /proc/sys/vm/swappiness
7.选择集群机器的角色分配,对于默认的选择都可以选择在master(10.100.3.95)机器上,当然像second namenode可以选择在非namenode机器上。注意cloudera management service都选master(10.100.3.95),也就是安装mysql的主机。因为其他主机没有安装mysql.点击继续
8.数据库配置。根据创建数据表选择所对应的服务即可。
9.集群设置。选择默认,集群开始安装。
oozie配置
oozie安装完毕之后还需要做以下配置才能使用:
1.安装oozie共享库,操作如下:
选择oozie服务点击操作->停止点击安装oozie共享库点击启动2.配置ext js库,操作如下:
下载ext-2.2.zip文件,下载地址http://dev.sencha.com/deploy/ext-2.2.zip把该文件放入运行oozie server的主机/var/lib/oozie/目录下解压该文件重启oozie服务3.配置外部数据库这里配置mysql,操作如下:
选择oozie服务,点击配置面板选择oozie server default group->数据库配置oozie服务器数据库类型选择mysql,选择oozie服务器数据库名称,默认为oozie,选择oozie服务器数据库主机地址,选择oozie服务器数据库用户,选择oozie服务器数据密码。并保存配置选择操作->停止选择操作->创建数据库选择操作->启动hue配置配置流程见:cloudera manager 安装文档#添加hue服务.不同之处在于要启动hue服务,hue依赖其它服务配置,需要修改如下配置:
进入cm主机面板选择配置->资源管理,修改启用基于cgroup的资源管理属性,设置为true,默认为false;进入yarn服务面板选择配置->服务范围,修改将cgroups用于资源管理属性,设置为true,默认为false。修改始终使用linux container executor,设置为true,默认为false;进入impala服务面板选择配置->服务范围->admission control,修改enable dynamic resource pools属性,设置为true,默认为false。
遇到的问题1.第一次安装时,由于98,99机器内存问题异常关机,导致安装一半中止,以及自己的错误操作导致又回到了安装的第一步,但是选择输入安装的机器集群时,引导界面里面多了3个已经加入到集群的机器,导致这3台机器无法选择。解决办法:这3台机器卸载重装。步骤如下:
service cloudera-scm-agent stop
service cloudera-scm-agnet hard_stop_confirmed
yum remove 'cloudera-manager-*'avro-tools crunch flume-ng hadoop-hdfs-fuse hadoop-hdfs-nfs3 hadoop-httpfs hbase-solr hive-hbase hive-webhcat hue-beeswax hue-hbase hue-impala hue-pig hue-plugins hue-rdbms hue-search hue-spark hue-sqoop hue-zookeeper impala impala-shell kite llama mahout oozie pig pig-udf-datafu search sentry solr-mapreduce spark-python sqoop sqoop2 whirr
yum clean all
rm -rf /tmp/.scm_prepare_node.lock
rm -rf /var/lib/flume-ng /var/lib/hadoop* /var/lib/hue /var/lib/solr* /var/lib/zookeeper* /var/lib/spark/
然后重新从安装cloudera manager server步骤开始即可。
2.10.100.3.98,10.100.3.99机器下载安装cdh相关组件不成功,提示:network_interfaces info nic iface eth0 doesn't support ethtoll (95),并且在98,99机器上运行service network restart 则ip会自动丢失,原因是安装机器的时候采用的动态ip导致,修改为静态ip。
3.10.100.3.98,10.100.3.99机器在下载cdh包时一直卡在’正在获取安装锁‘,点击详细信息提示:begin flock 4 cloudera。产生的原因是多次安装cloudera-manager-agent服务,并且启动过clouder-scm-agent服务导致产生了锁文件。删除掉该文件即可。执行命令:
rm -rf /tmp/.scm_prepare_node.lock
4.10.100.3.98,10.100.3.99机器下载安装cdh相关组件不成功,点击详细信息提示:
mainthread agent error hearbeating to 10.100.3.95:7182 failed
...
...
attributeerror: ‘nonetype’ object has no attribute ‘type’
解决办法:进入相关机器,重启cloudera-scm-agent服务,执行命令
service clouder-scm-agent restart
5.安装完毕后集群hdfs报警,提示 ’集群中有293个副本不足的块。集群众共有296个块。百分比副本不足的块:98.99%。临界阈值:40% under-replicated blocks‘,产生的原因是因为一开始98,99机器故障,只安装了3台机器,datanode节点只有2个,而安装过程中采用的都是默认配置,dfs.replication 设置的为3,所以导致次报警。通过使用hadoop fsck /命令检查hdfs块信息会提示安装hbase的时候写入的数据块 target replica is 3 but found 2 replica(s)。解决办法:配置dfs.replication值为2并执行以下命令:
su hdfs
hadoop fs -setrep 2/
6.安装hue之后hue web ui启动不起来,首页报错:
traceback (most recent call last):
...
...
importerror: no module named useradmin
查看/usr/lib/hue/目录可以看到app.reg文件的软连接文件失效,并没有创建此文件,解决办法是:在/usr/lib/hue/tools/app_reg/目录下有一个app_reg.py的文件 是用来产生该注册文件的,查看它的语法,使用命令tools/app_reg/app_reg.py --install apps/xxx/ ,其中xxx为apps目录下的所有文件加名称。执行完之后问题解决。
此次是安装过程中遇到的所有问题,之后会把原有集群从cdh3u5升级到cdh5.3.2,期间遇到的问题后续整理。