Advertisement
Guest User

Untitled

a guest
Jan 26th, 2015
206
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 1.99 KB | None | 0 0
  1. YARN
  2.  
  3. Haoopは大規模データに対するバッチ処理の道具としては十分な機能を持っている
  4. ただしエンタープライズ用途で利用するときの課題が残っていた
  5.  
  6. 処理性能
  7. 可能性
  8. 運用
  9. セキュリティ
  10.  
  11. --------
  12. 処理性能
  13.  
  14. スループットはじゅうぶん、ただしレスポンスは遅い
  15. MapReduce時代の起動に数十秒〜数分かかる
  16. -即座に結果を返してほしい場合にむかない
  17. -MRジョブを何度も繰り返すことが必要な処理に向かない(機械学習にある反復法)
  18.  
  19. 可用性:
  20. スレーブサーバーはSPOFではない
  21. ・スレーブに障害が発生した場合は自動で縮退される
  22.  
  23.  
  24. マスターサーバーはSPOF
  25.  
  26. ・バージョンアップはクラスタの全停止が必須
  27.  
  28. セキュリティ:データ暗号化が未着手
  29.  
  30. 1系のHadoopでは課題が残されていた
  31. ---------------
  32. 2系
  33.  
  34.  
  35. YARNの登場でレイテンシの低い処理も可能になった
  36. YARNとはリソース管理層を切り出したもの
  37. 生まれた理由
  38. ・スケーラビリティを向上させる
  39. ・MR以外の分散処理を実行する
  40.  
  41. <YARNになって、サービス名と役割が変化>
  42.  
  43. MRv2(MapReduce on YARN)
  44.  
  45. hadoopはバッチ処理だけではなくなった
  46.  
  47.  
  48. ----
  49. スナップショット
  50. 手軽に「今の」データを保持
  51. コマンド一つで即時に過去のデータを保持できる
  52. ディレクトリ探知で取得
  53. データコピーが発生しない(Copy on Write)
  54.  
  55. 定期的にスナップショットをとることでオペミスデータ改ざんの対策が可能
  56.  
  57.  
  58. -----------------
  59. セキュリティ:暗号化にも対応
  60. hdfsコマンドに暗号化のしくみがはいっている(クライアントコマンドに暗号化のしくみが入っている
  61.  
  62.  
  63. HTraceによるトレーサビリティの追求
  64. HBaseで利用されているプロファイリングツール
  65. 分散環境のトラブルシューティングのために便利な機能
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement