7.获取单行Get
如果希望获取整行数据,用行键初始化一个Get对象就可以,如果希望进一步缩小获取的数据范围,可以使用Get对象的以下方法:
如果希望取得指定列族的所有列数据,使用addFamily添加所有的目标列族即可;
如果希望取得指定列的数据,使用addColumn添加所有的目标列即可;
如果希望取得目标列的指定时间戳范围的数据版本,使用setTimeRange;
如果仅希望获取目标列的指定时间戳版本,则使用setTimestamp;
如果希望限制每个列返回的版本数,使用setMaxVersions;
如果希望添加过滤器,使用setFilter
下面详细描述构造函数及常用方法:
7.1.构造函数
Get的构造函数很简单,只有一个构造函数:Get(byte[] row) 参数是行键。
7.2.常用方法
Get addFamily (byte[] family) 指定希望获取的列族
Get addColumn (byte[] family, byte[] qualifier) 指定希望获取的列
Get setTimeRange (long minStamp, long maxStamp) 设置获取数据的时间戳范围
Get setTimeStamp (long timestamp) 设置获取数据的时间戳
Get setMaxVersions (int maxVersions) 设定获取数据的版本数
Get setMaxVersions() 设定获取数据的所有版本
Get setFilter (Filter filter) 为Get对象添加过滤器,过滤器详解请参见:http://blog.csdn.net/u010967382/article/details/37653177
void setCacheBlocks (boolean cacheBlocks) 设置该Get获取的数据是否缓存在内存中
7.3.实测代码
测试表的所有数据:
hbase(main):016:0》 scan ‘rd_ns:leetable’
ROW COLUMN+CELL
100001 column=info:address, timestamp=1405304843114, value=longze
100001 column=info:age, timestamp=1405304843114, value=31
100001 column=info:name, timestamp=1405304843114, value=leon
100002 column=info:address, timestamp=1405305471343, value=caofang
100002 column=info:age, timestamp=1405305471343, value=30
100002 column=info:name, timestamp=1405305471343, value=show
100003 column=info:address, timestamp=1405407883218, value=qinghe
100003 column=info:age, timestamp=1405407883218, value=28
100003 column=info:name, timestamp=1405407883218, value=shichao
3 row(s) in 0.0250 seconds
(1)获取行键指定行的所有列族、所有列的最新版本数据
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:leetable”);
Get get = new Get(Bytes.toBytes(“100003”));
Result r = table.get(get);
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))
);
}
table.close();
代码输出:
Rowkey : 100003 Familiy:Quilifier : address Value : qinghe
Rowkey : 100003 Familiy:Quilifier : age Value : 28
Rowkey : 100003 Familiy:Quilifier : name Value : shichao
(2)获取行键指定行中,指定列的最新版本数据
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:leetable”);
Get get = new Get(Bytes.toBytes(“100003”));
get.addColumn(Bytes.toBytes(“info”), Bytes.toBytes(“name”));
Result r = table.get(get);
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))
);
}
table.close();
代码输出:
Rowkey : 100003 Familiy:Quilifier : name Value : shichao
(3)获取行键指定的行中,指定时间戳的数据
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:leetable”);
Get get = new Get(Bytes.toBytes(“100003”));
get.setTimeStamp(1405407854374L);
Result r = table.get(get);
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))
);
}
table.close();
代码输出了上面scan命令输出中没有展示的历史数据:
Rowkey : 100003 Familiy:Quilifier : address Value : huangzhuang
Rowkey : 100003 Familiy:Quilifier : age Value : 32
Rowkey : 100003 Familiy:Quilifier : name Value : lily
(4)获取行键指定的行中,所有版本的数据
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:itable”);
Get get = new Get(Bytes.toBytes(“100003”));
get.setMaxVersions();
Result r = table.get(get);
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))+
“ Time : ”+cell.getTimestamp()
);
}
table.close();
代码输出:
Rowkey : 100003 Familiy:Quilifier : address Value : xierqi Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : address Value : shangdi Time : 1405417477465
Rowkey : 100003 Familiy:Quilifier : address Value : longze Time : 1405417448414
Rowkey : 100003 Familiy:Quilifier : age Value : 29 Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : age Value : 30 Time : 1405417477465
Rowkey : 100003 Familiy:Quilifier : age Value : 31 Time : 1405417448414
Rowkey : 100003 Familiy:Quilifier : name Value : leon Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : name Value : lee Time : 1405417477465
Rowkey : 100003 Familiy:Quilifier : name Value : lion Time : 1405417448414
8.获取多行Scan
Scan对象可以返回满足给定条件的多行数据。如果希望获取所有的行,直接初始化一个Scan对象即可。如果希望限制扫描的行范围,可以使用以下方法:
如果希望获取指定列族的所有列,可使用addFamily方法来添加所有希望获取的列族
如果希望获取指定列,使用addColumn方法来添加所有列
通过setTimeRange方法设定获取列的时间范围
通过setTimestamp方法指定具体的时间戳,只返回该时间戳的数据
通过setMaxVersions方法设定最大返回的版本数
通过setBatch方法设定返回数据的最大行数
通过setFilter方法为Scan对象添加过滤器,过滤器详解请参见:http://blog.csdn.net/u010967382/article/details/37653177
Scan的结果数据是可以缓存在内存中的,可以通过getCaching()方法来查看当前设定的缓存条数,也可以通过setCaching(int caching)来设定缓存在内存中的行数,缓存得越多,以后查询结果越快,同时也消耗更多内存。此外,通过setCacheBlocks方法设置是否缓存Scan的结果数据块,默认为true
我们可以通过setMaxResultSize(long)方法来设定Scan返回的结果行数。
下面是官网文档中的一个入门示例:假设表有几行键值为 “row1”, “row2”, “row3”,还有一些行有键值 “abc1”, “abc2”, 和 “abc3”,目标是返回“row”打头的行:
HTable htable = 。.. // instantiate HTable
Scan scan = new Scan();
scan.addColumn(Bytes.toBytes(“cf”),Bytes.toBytes(“attr”));
scan.setStartRow( Bytes.toBytes(“row”)); // start key is inclusive
scan.setStopRow( Bytes.toBytes(“row” + (char)0)); // stop key is exclusive
ResultScanner rs = htable.getScanner(scan);
try {
for (Result r = rs.next(); r != null; r = rs.next()) {
// process result.。.
} finally {
rs.close(); // always close the ResultScanner!
}
8.1.常用构造函数
(1)创建扫描所有行的Scan
Scan()
(2)创建Scan,从指定行开始扫描,
Scan(byte[] startRow)
参数:startRow行键
注意:如果指定行不存在,从下一个最近的行开始
(3)创建Scan,指定起止行
Scan(byte[] startRow, byte[] stopRow)
参数:startRow起始行,stopRow终止行
注意:startRow 《= 结果集 《 stopRow
(4)创建Scan,指定起始行和过滤器
Scan(byte[] startRow, Filter filter)
参数:startRow起始行,filter过滤器
注意:过滤器的功能和构造参见http://blog.csdn.net/u010967382/article/details/37653177
8.2.常用方法
Scan setStartRow(byte[] startRow) 设置Scan的开始行,默认结果集包含该行。如果希望结果集不包含该行,可以在行键末尾加上0。
Scan setStopRow(byte[] stopRow) 设置Scan的结束行,默认结果集不包含该行。如果希望结果集包含该行,可以在行键末尾加上0。
Scan setTimeRange(long minStamp, long maxStamp) 扫描指定时间范围的数据
Scan setTimeStamp(long timestamp) 扫描指定时间的数据
Scan addColumn(byte[] family, byte[] qualifier) 指定扫描的列
Scan addFamily(byte[] family) 指定扫描的列族
Scan setFilter(Filter filter) 为Scan设置过滤器
Scan setReversed(boolean reversed) 设置Scan的扫描顺序,默认是正向扫描(false),可以设置为逆向扫描(true)。注意:该方法0.98版本以后才可用!!
Scan setMaxVersions() 获取所有版本的数据
Scan setMaxVersions(int maxVersions) 设置获取的最大版本数
void setCaching(int caching) 设定缓存在内存中的行数,缓存得越多,以后查询结果越快,同时也消耗更多内存
void setRaw(boolean raw) 激活或者禁用raw模式。如果raw模式被激活,Scan将返回所有已经被打上删除标记但尚未被真正删除的数据。该功能仅用于激活了KEEP_DELETED_ROWS的列族,即列族开启了hcd.setKeepDeletedCells(true)。Scan激活raw模式后,就不能指定任意的列,否则会报错
Enable/disable “raw” mode for this scan. If “raw” is enabled the scan will return all delete marker and deleted rows that have not been collected, yet. This is mostly useful for Scan on column families that have KEEP_DELETED_ROWS enabled. It is an error to specify any column when “raw” is set.
hcd.setKeepDeletedCells(true);
8.3.实测代码
(1)扫描表中的所有行的最新版本数据
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:itable”);
Scan s = new Scan();
ResultScanner rs = table.getScanner(s);
for (Result r : rs) {
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))+
“ Time : ”+cell.getTimestamp()
);
}
}
table.close();
代码输出:
Rowkey : 100001 Familiy:Quilifier : address Value : anywhere Time : 1405417403438
Rowkey : 100001 Familiy:Quilifier : age Value : 24 Time : 1405417403438
Rowkey : 100001 Familiy:Quilifier : name Value : zhangtao Time : 1405417403438
Rowkey : 100002 Familiy:Quilifier : address Value : shangdi Time : 1405417426693
Rowkey : 100002 Familiy:Quilifier : age Value : 28 Time : 1405417426693
Rowkey : 100002 Familiy:Quilifier : name Value : shichao Time : 1405417426693
Rowkey : 100003 Familiy:Quilifier : address Value : xierqi Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : age Value : 29 Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : name Value : leon Time : 1405417500485
(2)扫描指定行键范围,通过末尾加0,使得结果集包含StopRow
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:itable”);
Scan s = new Scan();
s.setStartRow(Bytes.toBytes(“100001”));
s.setStopRow(Bytes.toBytes(“1000020”));
ResultScanner rs = table.getScanner(s);
for (Result r : rs) {
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))+
“ Time : ”+cell.getTimestamp()
);
}
}
table.close();
代码输出:
Rowkey : 100001 Familiy:Quilifier : address Value : anywhere Time : 1405417403438
Rowkey : 100001 Familiy:Quilifier : age Value : 24 Time : 1405417403438
Rowkey : 100001 Familiy:Quilifier : name Value : zhangtao Time : 1405417403438
Rowkey : 100002 Familiy:Quilifier : address Value : shangdi Time : 1405417426693
Rowkey : 100002 Familiy:Quilifier : age Value : 28 Time : 1405417426693
Rowkey : 100002 Familiy:Quilifier : name Value : shichao Time : 1405417426693
(3)返回所有已经被打上删除标记但尚未被真正删除的数据
本测试针对rd_ns:itable表的100003行。
如果使用get结合setMaxVersions()方法能返回所有未删除的数据,输出如下:
Rowkey : 100003 Familiy:Quilifier : address Value : huilongguan Time : 1405494141522
Rowkey : 100003 Familiy:Quilifier : address Value : shangdi Time : 1405417477465
Rowkey : 100003 Familiy:Quilifier : age Value : new29 Time : 1405494141522
Rowkey : 100003 Familiy:Quilifier : name Value : liyang Time : 1405494141522
然而,使用Scan强大的s.setRaw(true)方法,可以获得所有已经被打上删除标记但尚未被真正删除的数据。
代码如下:
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:itable”);
Scan s = new Scan();
s.setStartRow(Bytes.toBytes(“100003”));
s.setRaw(true);
s.setMaxVersions();
ResultScanner rs = table.getScanner(s);
for (Result r : rs) {
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))+
“ Time : ”+cell.getTimestamp()
);
}
}
table.close();
输出结果如下:
Rowkey : 100003 Familiy:Quilifier : address Value : huilongguan Time : 1405494141522
Rowkey : 100003 Familiy:Quilifier : address Value : Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : address Value : xierqi Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : address Value : shangdi Time : 1405417477465
Rowkey : 100003 Familiy:Quilifier : address Value : Time : 1405417448414
Rowkey : 100003 Familiy:Quilifier : address Value : longze Time : 1405417448414
Rowkey : 100003 Familiy:Quilifier : age Value : new29 Time : 1405494141522
Rowkey : 100003 Familiy:Quilifier : age Value : Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : age Value : Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : age Value : 29 Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : age Value : 30 Time : 1405417477465
Rowkey : 100003 Familiy:Quilifier : age Value : 31 Time : 1405417448414
Rowkey : 100003 Familiy:Quilifier : name Value : liyang Time : 1405494141522
Rowkey : 100003 Familiy:Quilifier : name Value : Time : 1405493879419
Rowkey : 100003 Familiy:Quilifier : name Value : leon Time : 1405417500485
Rowkey : 100003 Familiy:Quilifier : name Value : lee Time : 1405417477465
Rowkey : 100003 Familiy:Quilifier : name Value : lion Time : 1405417448414
(4)结合过滤器,获取所有age在25到30之间的行
目前的数据:
hbase(main):049:0》 scan ‘rd_ns:itable’
ROW COLUMN+CELL
100001 column=info:address, timestamp=1405417403438, value=anywhere
100001 column=info:age, timestamp=1405417403438, value=24
100001 column=info:name, timestamp=1405417403438, value=zhangtao
100002 column=info:address, timestamp=1405417426693, value=shangdi
100002 column=info:age, timestamp=1405417426693, value=28
100002 column=info:name, timestamp=1405417426693, value=shichao
100003 column=info:address, timestamp=1405494141522, value=huilongguan
100003 column=info:age, timestamp=1405494999631, value=29
100003 column=info:name, timestamp=1405494141522, value=liyang
3 row(s) in 0.0240 seconds
代码:
Configuration conf = HBaseConfiguration.create();
HTable table = new HTable(conf, “rd_ns:itable”);
FilterList filterList = new FilterList(FilterList.Operator.MUST_PASS_ALL);
SingleColumnValueFilter filter1 = new SingleColumnValueFilter(
Bytes.toBytes(“info”),
Bytes.toBytes(“age”),
CompareOp.GREATER_OR_EQUAL,
Bytes.toBytes(“25”)
);
SingleColumnValueFilter filter2 = new SingleColumnValueFilter(
Bytes.toBytes(“info”),
Bytes.toBytes(“age”),
CompareOp.LESS_OR_EQUAL,
Bytes.toBytes(“30”)
);
filterList.addFilter(filter1);
filterList.addFilter(filter2);
Scan scan = new Scan();
scan.setFilter(filterList);
ResultScanner rs = table.getScanner(scan);
for (Result r : rs) {
for (Cell cell : r.rawCells()) {
System.out.println(
“Rowkey : ”+Bytes.toString(r.getRow())+
“ Familiy:Quilifier : ”+Bytes.toString(CellUtil.cloneQualifier(cell))+
“ Value : ”+Bytes.toString(CellUtil.cloneValue(cell))+
“ Time : ”+cell.getTimestamp()
);
}
}
table.close();
代码输出:
Rowkey : 100002 Familiy:Quilifier : address Value : shangdi Time : 1405417426693
Rowkey : 100002 Familiy:Quilifier : age Value : 28 Time : 1405417426693
Rowkey : 100002 Familiy:Quilifier : name Value : shichao Time : 1405417426693
Rowkey : 100003 Familiy:Quilifier : address Value : huilongguan Time : 1405494141522
Rowkey : 100003 Familiy:Quilifier : age Value : 29 Time : 1405494999631
Rowkey : 100003 Familiy:Quilifier : name Value : liyang Time : 1405494141522
注意:
HBase对列族、列名大小写敏感
评论
查看更多