Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- ; Function Attrs: nounwind
- define dllexport amdgpu_kernel void @default_function__kernel0(float addrspace(1)* noalias nocapture readonly, float addrspace(1)* noalias nocapture) local_unnamed_addr #0 {
- entry:
- %2 = tail call i32 @llvm.amdgcn.workgroup.id.x()
- %3 = tail call i32 @llvm.amdgcn.workitem.id.x()
- %4 = ashr i32 %3, 4
- %5 = srem i32 %4, 16
- %6 = shl nsw i32 %5, 6
- %7 = srem i32 %3, 16
- %8 = lshr i32 %3, 8
- %9 = shl i32 %2, 1
- %10 = add i32 %9, %8
- %11 = shl i32 %10, 9
- %12 = add nsw i32 %11, %7
- %13 = shl i32 %12, 1
- %14 = add nsw i32 %13, %6
- %15 = sext i32 %14 to i64
- %16 = getelementptr inbounds float, float addrspace(1)* %0, i64 %15
- %17 = load float, float addrspace(1)* %16, align 4, !tbaa !2
- %18 = fadd float %17, 0.000000e+00
- %19 = or i64 %15, 1
- %20 = getelementptr inbounds float, float addrspace(1)* %0, i64 %19
- %21 = load float, float addrspace(1)* %20, align 4, !tbaa !2
- %22 = fadd float %18, %21
- %23 = add nsw i64 %15, 32
- %24 = getelementptr inbounds float, float addrspace(1)* %0, i64 %23
- %25 = load float, float addrspace(1)* %24, align 4, !tbaa !2
- %26 = fadd float %22, %25
- %27 = add nsw i64 %15, 33
- %28 = getelementptr inbounds float, float addrspace(1)* %0, i64 %27
- %29 = load float, float addrspace(1)* %28, align 4, !tbaa !2
- %30 = fadd float %26, %29
- %31 = shl nsw i32 %5, 4
- %32 = add nsw i32 %31, %7
- %33 = shl i32 %2, 9
- %34 = add i32 %33, %3
- %35 = and i32 %34, -256
- %36 = add nsw i32 %32, %35
- %37 = fmul float %30, 2.500000e-01
- %38 = fcmp ogt float %37, 0.000000e+00
- %39 = select i1 %38, float %37, float 0.000000e+00
- %40 = sext i32 %36 to i64
- %41 = getelementptr inbounds float, float addrspace(1)* %1, i64 %40
- store float %39, float addrspace(1)* %41, align 4, !tbaa !6
- ret void
- }
- ; Function Attrs: nounwind readnone speculatable
- declare i32 @llvm.amdgcn.workgroup.id.x() #1
- ; Function Attrs: nounwind readnone speculatable
- declare i32 @llvm.amdgcn.workitem.id.x() #1
- attributes #0 = { nounwind }
- attributes #1 = { nounwind readnone speculatable }
- !opencl.ocl.version = !{!0}
- !llvm.ident = !{!1}
- !0 = !{i32 2, i32 0}
- !1 = !{!"clang version 5.0.0 "}
- !2 = !{!3, !3, i64 0}
- !3 = !{!"float32", !4, i64 0}
- !4 = !{!"0x7ff3b0ea4f90", !5, i64 0}
- !5 = !{!"tvm-tbaa"}
- !6 = !{!7, !7, i64 0}
- !7 = !{!"float32", !8, i64 0}
- !8 = !{!"0x7ff3b0f88010", !5, i64 0}
Add Comment
Please, Sign In to add comment