Advertisement
Guest User

k_explicit

a guest
Feb 24th, 2017
286
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
C 1.86 KB | None | 0 0
  1. //
  2. // Generated by NVIDIA NVVM Compiler
  3. //
  4. // Compiler Build ID: CL-21458526
  5. // Driver 375.26
  6. // Based on LLVM 3.4svn
  7. //
  8.  
  9. .version 5.0
  10. .target sm_35, texmode_independent
  11. .address_size 64
  12.  
  13.     // .globl   init_z
  14. .const .align 4 .u32 pyopencl_defeat_cache_6d4f024526da42f9951e1dd4b5a94d35;
  15.  
  16. .entry init_z(
  17.     .param .u64 .ptr .global .align 8 init_z_param_0
  18. )
  19. {
  20.     .reg .b32   %r<15>;
  21.     .reg .b64   %rd<9>;
  22.  
  23.  
  24.     ld.param.u64    %rd1, [init_z_param_0];
  25.     mov.b32 %r1, %envreg3;
  26.     mov.u32     %r2, %ntid.x;
  27.     mov.u32     %r3, %ctaid.x;
  28.     mad.lo.s32  %r4, %r3, %r2, %r1;
  29.     mov.u32     %r5, %tid.x;
  30.     add.s32     %r6, %r4, %r5;
  31.     mov.b32 %r7, %envreg4;
  32.     mov.u32     %r8, %ntid.y;
  33.     mov.u32     %r9, %ctaid.y;
  34.     mad.lo.s32  %r10, %r9, %r8, %r7;
  35.     mov.u32     %r11, %tid.y;
  36.     add.s32     %r12, %r10, %r11;
  37.     cvt.u64.u32 %rd2, %r12;
  38.     mov.b32 %r13, %envreg7;
  39.     mul.lo.s32  %r14, %r8, %r13;
  40.     mul.wide.s32    %rd3, %r14, %r6;
  41.     add.s64     %rd4, %rd3, %rd2;
  42.     cvt.s64.s32     %rd5, %rd4;
  43.     shl.b64     %rd6, %rd5, 3;
  44.     add.s64     %rd7, %rd1, %rd6;
  45.     mov.u64     %rd8, 4613937818241073152;
  46.     st.global.u64   [%rd7], %rd8;
  47.     ret;
  48. }
  49.  
  50.     // .globl   root
  51. .entry root(
  52.     .param .u64 .ptr .global .align 8 root_param_0
  53. )
  54. {
  55.     .reg .b32   %r<15>;
  56.     .reg .b64   %rd<9>;
  57.  
  58.  
  59.     ld.param.u64    %rd1, [root_param_0];
  60.     mov.b32 %r1, %envreg3;
  61.     mov.u32     %r2, %ntid.x;
  62.     mov.u32     %r3, %ctaid.x;
  63.     mad.lo.s32  %r4, %r3, %r2, %r1;
  64.     mov.u32     %r5, %tid.x;
  65.     add.s32     %r6, %r4, %r5;
  66.     mov.b32 %r7, %envreg4;
  67.     mov.u32     %r8, %ntid.y;
  68.     mov.u32     %r9, %ctaid.y;
  69.     mad.lo.s32  %r10, %r9, %r8, %r7;
  70.     mov.u32     %r11, %tid.y;
  71.     add.s32     %r12, %r10, %r11;
  72.     cvt.u64.u32 %rd2, %r12;
  73.     mov.b32 %r13, %envreg7;
  74.     mul.lo.s32  %r14, %r8, %r13;
  75.     mul.wide.s32    %rd3, %r14, %r6;
  76.     add.s64     %rd4, %rd3, %rd2;
  77.     cvt.s64.s32     %rd5, %rd4;
  78.     shl.b64     %rd6, %rd5, 3;
  79.     add.s64     %rd7, %rd1, %rd6;
  80.     mov.u64     %rd8, 4613937818241073152;
  81.     st.global.u64   [%rd7], %rd8;
  82.     ret;
  83. }
  84.  
  85.  
  86. \00\00
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement