life x web Technology Design

コミュニケーションとテクノロジーを考えるブログ

[ #HCJ11F] レポート:Apache HBase: an Introduction

TAGS: None

Hadoop Conference 2011 Fall

日時:2011/09/26
場所:ベルサール汐留

イベントの詳細:
http://hadoop-conference-japan-2011-fall.eventbrite.com/
【重要】イベントのアーカイブ
http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html
———————


『Apache HBase: an Introduction』
Cloudera Inc, Todd Lipcon


□HBaseについて
・オープンソース:Apache 2.0ライセンス
・distributed:1−1000台のコモディティサーバーで稼働
・ZooKeeperによるフェイルオーバー
・サーバーの追加によるリニアなスケーリング
・Map datastore
・not relational
・row key
・like Map
・Rows are stored in sorted order



□カラムファミリについて
・HDFS上で別のファイルとして格納される
異なる特徴やアクセスパターンのデータに適用
・設定
・圧縮
・バージョンをいくつ残すかの設定
・キャッシュポリシー

□アクセス方法
・Java API
・REST/HTTP
・Apache Thrift
・Hive / Pig (for analytics)



□HBaseAPI
・get(row)
・put(row, Map)
・scan(key range, filter)
・increment(row, columns)

…etc…(checkAndPut, Delete…)

・MapReduce / Hive

□用語
・Region : subset of rows (like range partition)
・RegionServer : Serves data
・Master : coordinate slaves



□HBase vs Others
○HBase vs HDFS



○HBase vs RDBMS



○HBase vs Other NoSQL
・Favor Consistency
・Great Hadoop Integration
・Ordered range partitions
・Auto shards / scales

□ケーススタディ
・Firefox Crash Reports
・Facebook Analytics
・OpenTSDB

TAGS: None

One Response to “[ #HCJ11F] レポート:Apache HBase: an Introduction”


  1. [ #HCJ11F] [Hadoop] Hadoop Conference 2011 Fallに参加してきました « life x web Technology Design
    on 9月 30th, 2011
    @ 12:08 PM

    [...] [ #HCJ11F] レポート:The role of the Distribution in the Apache Hadoop Ecosystem [ #HCJ11F] レポート:Apache HBase: an Introduction [ #HCJ11F] レポート:(LT) Lightweight wrapper for Hive on Amazon EMR [ #HCJ11F] [...]

Leave a Reply

© 2009 life x web Technology Design. All Rights Reserved.

This blog is powered by the Wordpress platform and beach rentals.