Advertisement
Guest User

Untitled

a guest
Sep 22nd, 2017
160
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
LLVM 1.50 KB | None | 0 0
  1. ======================== INT========================
  2.  
  3. //
  4. // Generated by NVIDIA LLVM Compiler 4.0
  5. //
  6.  
  7. .version 2.2
  8. .target sm_21, texmode_independent
  9.  
  10.  
  11.  
  12. .entry kern(
  13.     .param .u32 .ptr .global .align 4 kern_param_0
  14. )
  15. {
  16.     .reg .s32   %r<12>;
  17.  
  18. _kern:
  19.     mov.u32     %r1, %tid.x;
  20.     mov.u32     %r2, %envreg3;
  21.     add.s32     %r3, %r1, %r2;
  22.     mov.u32     %r4, %ctaid.x;
  23.     mov.u32     %r5, %ntid.x;
  24.     mad.lo.s32  %r6, %r4, %r5, %r3;
  25.     shl.b32     %r7, %r6, 2;
  26.     ld.param.u32    %r8, [kern_param_0];
  27.     add.s32     %r9, %r8, %r7;
  28.     ld.global.u32   %r10, [%r9];
  29.     add.s32     %r11, %r10, 1784293664;
  30.     st.global.u32   [%r9], %r11;
  31.     ret;
  32. }
  33.  
  34.  
  35.  
  36. ======================== FLOAT ========================
  37.  
  38. //
  39. // Generated by NVIDIA LLVM Compiler 4.0
  40. //
  41.  
  42. .version 2.2
  43. .target sm_21, texmode_independent
  44.  
  45.  
  46.  
  47. .entry kern(
  48.     .param .u32 .ptr .global .align 4 kern_param_0
  49. )
  50. {
  51.     .reg .f32   %f<6>;
  52.     .reg .pred  %p<2>;
  53.     .reg .s32   %r<14>;
  54.  
  55. _kern:
  56.     mov.u32     %r5, %tid.x;
  57.     mov.u32     %r6, %envreg3;
  58.     add.s32     %r7, %r5, %r6;
  59.     mov.u32     %r8, %ctaid.x;
  60.     mov.u32     %r9, %ntid.x;
  61.     mad.lo.s32  %r10, %r8, %r9, %r7;
  62.     shl.b32     %r11, %r10, 2;
  63.     ld.param.u32    %r12, [kern_param_0];
  64.     add.s32     %r1, %r12, %r11;
  65.     ld.global.f32   %f5, [%r1];
  66.     mov.u32     %r13, 0;
  67.  
  68. BB1_1:                                                      // %._crit_edge
  69.     mov.u32     %r2, %r13;
  70.     add.s32     %r3, %r2, 1;
  71.     cvt.rn.f32.s32  %f4, %r2;
  72.     add.rn.f32  %f5, %f5, %f4;
  73.     setp.ne.s32     %p1, %r3, 1000001;
  74.     mov.u32     %r13, %r3;
  75.     @%p1 bra    BB1_1;
  76.  
  77. BB1_2:
  78.     st.global.f32   [%r1], %f5;
  79.     ret;
  80. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement