life x web Technology Design

コミュニケーションとテクノロジーを考えるブログ

[ #HCJ11F] レポート:The role of the Distribution in the Apache Hadoop Ecosystem

TAGS: None

Hadoop Conference 2011 Fall

日時:2011/09/26
場所:ベルサール汐留

イベントの詳細:
http://hadoop-conference-japan-2011-fall.eventbrite.com/
【重要】イベントのアーカイブ
http://mit.recruit.co.jp/hadoop/conference2011fall/info/archive.html
———————

『The role of the Distribution in the Apache Hadoop Ecosystem』
Cloudera Inc, Todd Lipcon


□Hadoopについて
Hadoop → HDFS(Scalable FS)+ MapReduce(Distributed Processing)

・巨大かつ複雑なタイプのデータに対しても柔軟に保存、マイニングできる
・経済的にスケール出来る

□なぜHadoopなのか?
・ここ10年でデータは巨大かつ様々なタイプに
→さらに柔軟でスケーラブルな解決策が求められた
→☆大きなデータを扱うことは困難をもたらしたが、同時にデータの活用という【新たな可能性】を生み出した

□利用用途
1.高度な分析目的 (Webの例:ソーシャルネットワークの分析)
2.データ処理 (Webの例:クリックなどの集計処理)

□Clouderaについて
・CDH
→最も使われているdistribution
→安定かつ信頼性は高い(サービス群の依存などもきちんとテストしてある)
→オープンソース

・SCM Express(Service and Configuration Manager Express)

http://www.cloudera.com/products-services/scm-express/

→CDHを簡単にインストール
→WebUIでHadoopの設定を行える
→(Expressでは)50ノードまで設定可能
→無料!!!

□導入の流れ
Hadoopの良さを理解してもらう

SCM Expressでインストール、利用する

規模に応じてCloudera Enterpriseへ

□Cloudera Enterprise
・Cloudera Management Suite
・Activity Monitor
・Service & Configuration Monitor
・Resource Manager
・Authorization Manager
・Cloudera Support
日本語でも!

TAGS: None

One Response to “[ #HCJ11F] レポート:The role of the Distribution in the Apache Hadoop Ecosystem”


  1. [ #HCJ11F] [Hadoop] Hadoop Conference 2011 Fallに参加してきました « life x web Technology Design
    on 9月 30th, 2011
    @ 11:58 AM

    [...] [ #HCJ11F] レポート:The role of the Distribution in the Apache Hadoop Ecosystem [ #HCJ11F] レポート:Apache HBase: an Introduction [ #HCJ11F] レポート:(LT) Lightweight [...]

Leave a Reply

© 2009 life x web Technology Design. All Rights Reserved.

This blog is powered by the Wordpress platform and beach rentals.