Guest User

Untitled

a guest
Oct 21st, 2017
93
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 2.30 KB | None | 0 0
  1. ; Function Attrs: nounwind
  2. define dllexport amdgpu_kernel void @default_function__kernel0(float addrspace(1)* noalias nocapture readonly, float addrspace(1)* noalias nocapture) local_unnamed_addr #0 {
  3. entry:
  4. %2 = tail call i32 @llvm.amdgcn.workgroup.id.x()
  5. %3 = tail call i32 @llvm.amdgcn.workitem.id.x()
  6. %4 = ashr i32 %3, 4
  7. %5 = srem i32 %4, 16
  8. %6 = shl nsw i32 %5, 6
  9. %7 = srem i32 %3, 16
  10. %8 = lshr i32 %3, 8
  11. %9 = shl i32 %2, 1
  12. %10 = add i32 %9, %8
  13. %11 = shl i32 %10, 9
  14. %12 = add nsw i32 %11, %7
  15. %13 = shl i32 %12, 1
  16. %14 = add nsw i32 %13, %6
  17. %15 = sext i32 %14 to i64
  18. %16 = getelementptr inbounds float, float addrspace(1)* %0, i64 %15
  19. %17 = load float, float addrspace(1)* %16, align 4, !tbaa !2
  20. %18 = fadd float %17, 0.000000e+00
  21. %19 = or i64 %15, 1
  22. %20 = getelementptr inbounds float, float addrspace(1)* %0, i64 %19
  23. %21 = load float, float addrspace(1)* %20, align 4, !tbaa !2
  24. %22 = fadd float %18, %21
  25. %23 = add nsw i64 %15, 32
  26. %24 = getelementptr inbounds float, float addrspace(1)* %0, i64 %23
  27. %25 = load float, float addrspace(1)* %24, align 4, !tbaa !2
  28. %26 = fadd float %22, %25
  29. %27 = add nsw i64 %15, 33
  30. %28 = getelementptr inbounds float, float addrspace(1)* %0, i64 %27
  31. %29 = load float, float addrspace(1)* %28, align 4, !tbaa !2
  32. %30 = fadd float %26, %29
  33. %31 = shl nsw i32 %5, 4
  34. %32 = add nsw i32 %31, %7
  35. %33 = shl i32 %2, 9
  36. %34 = add i32 %33, %3
  37. %35 = and i32 %34, -256
  38. %36 = add nsw i32 %32, %35
  39. %37 = fmul float %30, 2.500000e-01
  40. %38 = fcmp ogt float %37, 0.000000e+00
  41. %39 = select i1 %38, float %37, float 0.000000e+00
  42. %40 = sext i32 %36 to i64
  43. %41 = getelementptr inbounds float, float addrspace(1)* %1, i64 %40
  44. store float %39, float addrspace(1)* %41, align 4, !tbaa !6
  45. ret void
  46. }
  47.  
  48. ; Function Attrs: nounwind readnone speculatable
  49. declare i32 @llvm.amdgcn.workgroup.id.x() #1
  50.  
  51. ; Function Attrs: nounwind readnone speculatable
  52. declare i32 @llvm.amdgcn.workitem.id.x() #1
  53.  
  54. attributes #0 = { nounwind }
  55. attributes #1 = { nounwind readnone speculatable }
  56.  
  57. !opencl.ocl.version = !{!0}
  58. !llvm.ident = !{!1}
  59.  
  60. !0 = !{i32 2, i32 0}
  61. !1 = !{!"clang version 5.0.0 "}
  62. !2 = !{!3, !3, i64 0}
  63. !3 = !{!"float32", !4, i64 0}
  64. !4 = !{!"0x7ff3b0ea4f90", !5, i64 0}
  65. !5 = !{!"tvm-tbaa"}
  66. !6 = !{!7, !7, i64 0}
  67. !7 = !{!"float32", !8, i64 0}
  68. !8 = !{!"0x7ff3b0f88010", !5, i64 0}
Add Comment
Please, Sign In to add comment