Guest User

Untitled

a guest
Sep 19th, 2018
76
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 6.36 KB | None | 0 0
  1. ## #bq_sushi & dataflow DOGRUN
  2.  
  3. ### #bq_sushi の始まり
  4.  
  5. BigQuery Analyticsの読書会
  6.  
  7. 六本木のまっちゃんという寿司屋で打ち上げが行われた
  8.  
  9. ### QA
  10.  
  11. - UDFをpythonでかけるようになりませんか
  12. - 今の所予定がない
  13. - CをコンパイルしてUDFで動かすことができる
  14.  
  15. - resource exceededが出るのが辛い
  16. - 次のq4で解決するようになる(order by で出ないようになるはず)
  17. - order byで exceededがでるのは一つのノードに集中するから、それを分散させる予定。
  18.  
  19. - apache beamのいろいろな言語をサポートしているけど、そのプライオリティはどの様になっているか(開発するときのプライオリティは?)
  20. - 基本的にはどの言語も公平に開発されている
  21. - javaが最初に開発されてその2年後にpythonが開発されたのでそのへんがありそう
  22. - まだGoのように新しい言語はパーフェクトではないが同等に動くように努力はしている
  23.  
  24. - たくさんの機能を利用したいときにはjavaを利用するのが良いのか
  25. - 1年後にはもう少し差が埋まっているだろう。現状はjavaが一番機能が多い。
  26. - いまはpythonでもstreamingができるのでgapは埋まっているはず
  27. - 次のクオータではpython3も動くように鳴る
  28.  
  29. - いつgoのexperimental外れる?
  30. - はっきりは言えない
  31.  
  32. - scala, kotlinサポートはどう?
  33. - scalaはspotifyのライブラリを使えば良い
  34. - kotlinは残念ながらまだソリューションはない
  35. - お客さんでkotlinを利用している人はいる
  36.  
  37. - javaの有償化で、今後はどう考えるか
  38. - 現状はgoogleがjavaをサポートするので安心して、でも将来はpythonに移行する可能性もゼロではない
  39.  
  40. - bqが安くて驚いてる。今後も頑張ってください。
  41. -
  42.  
  43. - bqmlのモデルをgcsをexportできるように鳴るのか
  44. - ml.waitsという機能ですでに利用できるようになっている
  45. - ドキュメントにもすでに乗っているよ
  46. - pythonのpandas形式でできる
  47. - 一度exportすればpythonでも動かせる
  48.  
  49. < ここちょっと聞き漏らし >
  50.  
  51. - 今後なにが提供されるか。ランダムフォレストとか。
  52. - 特定のお客さんにランダムフォレストなどを試してもらっている。
  53.  
  54. - 任意のDocker Imageで実行できるように鳴るのはいつ頃?
  55. - 一応カスタムコンテナを利用できるようにする予定はあるけど、具体的にいつとは言えない?
  56.  
  57. - ポータビリティフレームワークと関係だったりします?
  58. - 関係ある
  59.  
  60. - 中小企業向けにslotを減らして安価なflat-rateを提供してほしい。
  61. - お客様からそういう要望があるが、スピードが遅くなってしまうのでなんのためのフラットレート?となってしまうので今は考えていない。
  62. - デフォルトでは2000スロット、非常の多くのリソースが確保されている。スロットを減らしても良いexperienceであってほしいと思っている。この辺は改善を目指しており、妥協はしたくない。
  63.  
  64. - 東京リージョンを利用するときにロケーションを指定せずにクエリしたい
  65. - いいニュース!それもう先週にできてるよ!
  66.  
  67. - BQ Geo viz と datastudioの連携は考えている?
  68. - 具体的なロードマップはないけど、Datastudioがgio vizに対応することはあるかも
  69.  
  70. - bqmlをtfのように可視化する予定は?
  71. - tfと全く同じということはないと思うが要望があるのは理解しているので現在頑張っている
  72.  
  73. - スケジュールクエリがnew uiに対応していない
  74. - 今はできない、いつかは言えないが対応はしている
  75.  
  76. - dataflowをプリエンプティブルvmで動かしたい
  77. - アナウンスできる内容ではないが、取り組んではいる
  78.  
  79. - shuffle vmは日本で使えるようになる予定は?
  80. - 明日の朝を楽しみにしてて
  81.  
  82. - whth句で1つのテーブルを何度もスキャンしていますが、これは1度しか課金されないですよね?
  83. - BQに関しては一度だけです。
  84.  
  85. - patitionfieldを利用したテーブルでもpartition_timeをりようできるようにしてほしい(エイリアスのような)、マイグレーションコストが高いので
  86. - (とばす)
  87.  
  88. - UDFをプロジェクト単位で保存できるようにしてほしい。
  89. - 取り組んではいますが時期は言えない
  90.  
  91. - テーブル名とカラム名にマルチバイトを使いたい
  92. - このリクエストを聞いたのは初めてだが、サポートできない理由がない
  93. - Datastudioでリネームするてもあるよ
  94.  
  95. - csvのファイルの取り込み時に日付/時間のフォーマットオプションを指定したい
  96. - フェデレーテッドクエリを使うという方法がある
  97. - いまロードのオペレーションを良いものにしようとする取り組みを行っている。
  98. - viewのなかでパースするという方法はあるかもしれないですね。(stringとして入れておいて)
  99.  
  100. - orcファイルでのロードで決めたカラム名でロードしたいけどできないか。
  101. - まだ今後数ヶ月でEAPとなるものだけど、orcに対してフェデレーテッドクエリ使う or viewを使うというので対応できるのではないか。
  102.  
  103. - group by rollup で cube というファイルがほしいができるか
  104. - 今のところないですが、リクエストがたくさん来るときには考えたい
  105.  
  106. - リクエストはどこに投げればいい?
  107. - BQのpublic bug trackerを利用すればいい
  108.  
  109. < ここちょっと聞き漏らし>
  110.  
  111. - マネージドでサーバレスな方向にいくが、最終的にVMでやらなくてはならないことはどのへんが残るのか。
  112. - トランスフォームするものはworkerそれ以外はバックエンドに流れてい
  113. - 明日のセッションでそのへん説明するのでぜひ来てください。(ワーカー、バックエンド)
  114.  
  115. - BQのシャッフルと同じか?
  116. - 共通している部分は多いが、コード的には共有している部分はあるが異なるものと考えてもらって良い。
Add Comment
Please, Sign In to add comment