Advertisement
Guest User

Untitled

a guest
Jan 25th, 2015
195
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 3.92 KB | None | 0 0
  1. 11:06
  2. Twitter日本語データの詳細
  3.  
  4. どうやってFireforceを処理しているのか
  5.  
  6. 従来型ソーシャルメディアリスニング
  7. プロモーション効果測定
  8.  
  9. CMの効果測定
  10.  
  11. ユーザー分析
  12. 高度ターゲティング
  13. POS
  14. 消費者パネル
  15.  
  16.  
  17. Twitterアカウントと購買履歴をひもづきしてみる
  18. タイムライタンで商品関連ツイートをみたひとの購入確率は見ていない人の1.6倍
  19. 商品について発言した人の購入率は発言していない人の1・5倍〜3倍
  20.  
  21.  
  22. ユーザー行動分析
  23. ワールドカップ戦を見てた人はどんなモノを買って食べているのか
  24. 年齢層
  25. 思考性
  26. 男性・女性
  27. かを分析
  28. クラスタわけ、機械学習
  29.  
  30. 位置の地図をマッピング
  31.  
  32. 地域分析
  33. GPS情報と投稿情報から分析
  34. ネガティブな地域、ポジティブな地域
  35.  
  36.  
  37.  
  38.  
  39.  
  40. ---
  41. ターゲティング
  42. ID連携
  43. 非ID連携
  44.  
  45.  
  46. お客様でTwiterIDで結びつけてもらう
  47. TwiterIDの行動履歴がおえるようになる(ECサイト
  48. お客様にあわせてリコメンドができる
  49.  
  50.  
  51. ID連携はハードル高い
  52. ID連携しなくてもある程度はつかえる
  53.  
  54.  
  55. 従来のメルマガよりも効果が出ている
  56.  
  57. 機械的に発言から20代男性っぽいなどを機械学習から判別する
  58.  
  59.  
  60.  
  61. ---------------------
  62.  
  63.  
  64. 次世代CRM基板xオムニチャンネル
  65.  
  66.  
  67. 被害状況把握 竜巻発生、多くのTweetが投稿されることにより信憑性が高まる
  68.  
  69.  
  70.  
  71.  
  72.  
  73. -----
  74.  
  75. 金融センチメント指標
  76.  
  77.  
  78. 世の中のムードから株価を推測
  79. 株式指標<->Tweetセンチメント指標
  80.  
  81.  
  82.  
  83.  
  84. [2.Tweerデータ提供サービスおよびシステムの概要]
  85. Twiterデータ提供サービス
  86. サンプルホース
  87. フィルターホース
  88.  
  89. リアルタイムデータ提供API
  90. リアルタイムサーチ
  91. ヒストリカルサーチ
  92.  
  93. 過去データ提供API
  94. 2006年のすべての日本語データを保持
  95.  
  96. -----------
  97. サンプルホース
  98. フィルターホース
  99. リアルタイムサーチ
  100. ヒストリカルサーチ
  101.  
  102. ヒストリカルサーチはHadoopで実施
  103.  
  104. オンプレミス環境
  105. RabbitMQ使用 フィルタリングサーバー
  106. PostgreSQL 日本語ユーザーDB(+PeaceMaker HA)
  107. Zookeeperで現用系、待機系の切り替えをやっている
  108. ユーザーのTweetの削除のイベントをうけてちゃんと削除したりしている
  109.  
  110. 受信サーバーで日本語のツイートのみをフィルタして後続に渡す
  111.  
  112.  
  113. ----------------------
  114. 配信部
  115. QMQ
  116.  
  117. 分配サーバー QMQ 配信サーバー(Apaceh Tomcat)
  118.  
  119.  
  120. 蓄積部
  121. Hadoopクラスタ
  122.  
  123. クラウド環境
  124.  
  125. [インテグレーション上の問題と〜]
  126. ツイート1日 5億件つぶやき
  127. 6000tweet/per sec
  128.  
  129. 瞬間的つぶやく
  130. 一位 14万/sec バルス
  131.  
  132.  
  133. データ再取得の難しさ
  134. TWからNW切断されると再接続までに配信されたツイートデータを受け取り損ねてしまう
  135. fireforceには一応過去にさかのぼってツイートをとれるが、それも制限があるので工夫が必要
  136. ー>OSSのインテグレーション活用でかいけつ
  137.  
  138.  
  139. トラフィックの継続的な増加に対応ー>スケールアウト構成にする
  140. ツイートの瞬間的な急増 -> システムの適切な位置にバッファやキューを置く
  141. データ再取得の難しさ ->HA構成にする
  142.  
  143.  
  144. バルスはRabbitMQで対応している。
  145. 数十万〜数百万でツイートの瞬間的な急増を吸収する
  146.  
  147. 2012年9月にTwと提携
  148. 2013年12月にTwデータ提供サービス
  149.  
  150. 三ヶ月で設計実装
  151.  
  152.  
  153. OSSのよさ
  154. 1,導入が用意
  155. サーバーが1台あれば機能の検証はできる
  156.  
  157. 2。情報が手に入りやすいい
  158.  
  159. 3.ソースコードが公開されている
  160.  
  161.  
  162. 4.不具合やその対応状況が公になってることが多い
  163.  
  164. 5.多数の利用者開発者の目が光っている
  165.  
  166. 質問コーナーなし
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement