Hive通过JavaAPI操作

Hive的连接

Hive的连接方式有几种--在这里介绍JDBC连接的方式

1.首先了解配置

配置文件所在的位置:
HiveServer2远程连接的端口,默认为10000--------------hive.server2.thrift.port
hive中的数据库和表在HDFS中存放的文件夹的位置--------hive.metastore.warehouse.dir
                                                    /apps/hive/warehouse
hive所在集群的IP地址--------------------------------hive.server2.thrift.bind.host
默认为5000L,此处修改为5000,不然程序会报错 ---------hive.server2.long.polling.timeout

Hive的元数据库,采用的是本地Mysql作为元数据库-----javax.jdo.option.ConnectionURL
连接元数据的驱动名----------------------------------javax.jdo.option.ConnectionDriverName
连接元数据库用户名----------------------------------javax.jdo.option.ConnectionUserName
连接元数据库用户名连接元数据库密码------------------javax.jdo.option.ConnectionPassword



查看hiveserver2是否已经开启
    启动元数据库 :        hive --service metastore &
    启动hiveserver2:  hive --service hiveserver2 &

    查看日志:
        日志文件hive.log的路径在
         cd  /etc/hive/conf/hive-log4j.properties
         cat hive-log4j.properties
             #Define some default values that can be overridden by system properties
                hive.log.threshold=ALL
                hive.root.logger=INFO,DRFA
                hive.log.dir=${java.io.tmpdir}/${user.name}
                hive.log.file=hive.log

        在Ambari中设置为  /var/log/hive
         cd  /var/log/hive
    查看命令
        netstat -nl |grep 10000
    查看Ambari中的hive

2. 依赖的jar包

    <hive.version>1.1.2</hive.version>
    ${hive.version}
org.apache.hive.hive-exec
org.apache.hive.hive-metastore
org.apache.hive.hive-jdbc
org.apache.hive.hive-service

代码

相关代码--使用JDBC连接
   hiveCon = DriverManager.getConnection(getProptFileLoador("hive.URL"),
                getProptFileLoador("hive.USERNAME"), getProptFileLoador("hive.PASSWORD") );

参考:

jdbc远程连接hiveserver2 http://www.cnblogs.com/superAng/p/5939642.html

blogroll

social