Advertisement
AxelDavy

Extra big shader

May 25th, 2015
691
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
text 296.45 KB | None | 0 0
  1. define void @main([6 x <16 x i8>] addrspace(2)* byval, [17 x <16 x i8>] addrspace(2)* byval, [17 x <4 x i32>] addrspace(2)* byval, [34 x <8 x i32>] addrspace(2)* byval, float inreg, i32 inreg, <2 x i32>, <2 x i32>, <2 x i32>, <3 x i32>, <2 x i32>, <2 x i32>, <2 x i32>, float, float, float, float, float, float, i32, float, float) #0 {
  2. main_body:
  3. %22 = getelementptr [17 x <16 x i8>], [17 x <16 x i8>] addrspace(2)* %1, i64 0, i64 0
  4. %23 = load <16 x i8>, <16 x i8> addrspace(2)* %22, align 16, !tbaa !0
  5. %24 = call float @llvm.SI.load.const(<16 x i8> %23, i32 0)
  6. %25 = call float @llvm.SI.load.const(<16 x i8> %23, i32 12)
  7. %26 = call float @llvm.SI.load.const(<16 x i8> %23, i32 16)
  8. %27 = call float @llvm.SI.load.const(<16 x i8> %23, i32 20)
  9. %28 = call float @llvm.SI.load.const(<16 x i8> %23, i32 24)
  10. %29 = call float @llvm.SI.load.const(<16 x i8> %23, i32 28)
  11. %30 = call float @llvm.SI.load.const(<16 x i8> %23, i32 32)
  12. %31 = call float @llvm.SI.load.const(<16 x i8> %23, i32 40)
  13. %32 = call float @llvm.SI.load.const(<16 x i8> %23, i32 44)
  14. %33 = call float @llvm.SI.load.const(<16 x i8> %23, i32 48)
  15. %34 = call float @llvm.SI.load.const(<16 x i8> %23, i32 64)
  16. %35 = call float @llvm.SI.load.const(<16 x i8> %23, i32 80)
  17. %36 = call float @llvm.SI.load.const(<16 x i8> %23, i32 96)
  18. %37 = getelementptr [34 x <8 x i32>], [34 x <8 x i32>] addrspace(2)* %3, i64 0, i64 0
  19. %38 = load <8 x i32>, <8 x i32> addrspace(2)* %37, align 32, !tbaa !0
  20. %39 = getelementptr [17 x <4 x i32>], [17 x <4 x i32>] addrspace(2)* %2, i64 0, i64 0
  21. %40 = load <4 x i32>, <4 x i32> addrspace(2)* %39, align 16, !tbaa !0
  22. %41 = getelementptr [34 x <8 x i32>], [34 x <8 x i32>] addrspace(2)* %3, i64 0, i64 1
  23. %42 = load <8 x i32>, <8 x i32> addrspace(2)* %41, align 32, !tbaa !0
  24. %43 = getelementptr [17 x <4 x i32>], [17 x <4 x i32>] addrspace(2)* %2, i64 0, i64 1
  25. %44 = load <4 x i32>, <4 x i32> addrspace(2)* %43, align 16, !tbaa !0
  26. %45 = getelementptr [34 x <8 x i32>], [34 x <8 x i32>] addrspace(2)* %3, i64 0, i64 2
  27. %46 = bitcast <8 x i32> addrspace(2)* %45 to <32 x i8> addrspace(2)*
  28. %47 = load <32 x i8>, <32 x i8> addrspace(2)* %46, align 32, !tbaa !0
  29. %48 = getelementptr [17 x <4 x i32>], [17 x <4 x i32>] addrspace(2)* %2, i64 0, i64 2
  30. %49 = bitcast <4 x i32> addrspace(2)* %48 to <16 x i8> addrspace(2)*
  31. %50 = load <16 x i8>, <16 x i8> addrspace(2)* %49, align 16, !tbaa !0
  32. %51 = call float @llvm.SI.fs.interp(i32 0, i32 0, i32 %5, <2 x i32> %7)
  33. %52 = call float @llvm.SI.fs.interp(i32 1, i32 0, i32 %5, <2 x i32> %7)
  34. %53 = call float @llvm.SI.fs.interp(i32 0, i32 1, i32 %5, <2 x i32> %7)
  35. %54 = call float @llvm.SI.fs.interp(i32 1, i32 1, i32 %5, <2 x i32> %7)
  36. %55 = call float @llvm.SI.fs.interp(i32 0, i32 2, i32 %5, <2 x i32> %7)
  37. %56 = call float @llvm.SI.fs.interp(i32 1, i32 2, i32 %5, <2 x i32> %7)
  38. %57 = call float @llvm.SI.fs.interp(i32 2, i32 2, i32 %5, <2 x i32> %7)
  39. %58 = fmul float %51, 0.000000e+00
  40. %59 = bitcast float %51 to i32
  41. %60 = bitcast float %52 to i32
  42. %61 = bitcast float %58 to i32
  43. %62 = insertelement <4 x i32> undef, i32 %59, i32 0
  44. %63 = insertelement <4 x i32> %62, i32 %60, i32 1
  45. %64 = insertelement <4 x i32> %63, i32 %61, i32 2
  46. %65 = bitcast <8 x i32> %38 to <32 x i8>
  47. %66 = bitcast <4 x i32> %40 to <16 x i8>
  48. %67 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %64, <32 x i8> %65, <16 x i8> %66, i32 2)
  49. %68 = extractelement <4 x float> %67, i32 0
  50. %69 = extractelement <4 x float> %67, i32 1
  51. %70 = extractelement <4 x float> %67, i32 2
  52. %71 = extractelement <4 x float> %67, i32 3
  53. %72 = fmul float %71, %71
  54. %73 = fdiv float 1.000000e+00, %72
  55. %74 = fmul float %73, %31
  56. %75 = call float @llvm.minnum.f32(float %30, float %74)
  57. %76 = bitcast float %53 to i32
  58. %77 = bitcast float %54 to i32
  59. %78 = insertelement <2 x i32> undef, i32 %76, i32 0
  60. %79 = insertelement <2 x i32> %78, i32 %77, i32 1
  61. %80 = call <4 x float> @llvm.SI.sample.v2i32(<2 x i32> %79, <32 x i8> %47, <16 x i8> %50, i32 2)
  62. %81 = extractelement <4 x float> %80, i32 0
  63. %82 = extractelement <4 x float> %80, i32 1
  64. %83 = fmul float %81, 2.000000e+00
  65. %84 = fadd float %83, -1.000000e+00
  66. %85 = fmul float %82, 2.000000e+00
  67. %86 = fadd float %85, -1.000000e+00
  68. %87 = fmul float %75, %84
  69. %88 = fmul float %75, %86
  70. %89 = fmul float %88, %24
  71. %90 = fmul float %89, %25
  72. %91 = fmul float %55, %55
  73. %92 = fmul float %56, %56
  74. %93 = fadd float %92, %91
  75. %94 = fmul float %57, %57
  76. %95 = fadd float %93, %94
  77. %96 = call float @llvm.AMDGPU.rsq.clamped.f32(float %95)
  78. %97 = call float @llvm.minnum.f32(float %96, float 0x47EFFFFFE0000000)
  79. %98 = fmul float %55, %97
  80. %99 = fmul float %56, %97
  81. %100 = fmul float %57, %97
  82. %101 = fmul float %72, %98
  83. %102 = fmul float %72, %99
  84. %103 = fmul float %72, %100
  85. %104 = fdiv float 1.000000e+00, %26
  86. %105 = fdiv float 1.000000e+00, %27
  87. %106 = fadd float %104, %104
  88. %107 = fadd float %105, %105
  89. %108 = fadd float %28, -1.000000e+00
  90. %109 = fadd float %29, -1.000000e+00
  91. %110 = fmul float %104, %108
  92. %111 = fmul float %105, %109
  93. %112 = fcmp ogt float %75, 0x3FA47AE140000000
  94. br i1 %112, label %IF, label %ELSE
  95.  
  96. IF: ; preds = %main_body
  97. %113 = fmul float %87, 0x3F50624DE0000000
  98. %114 = fadd float %113, %88
  99. %115 = fmul float %90, 0x3F50624DE0000000
  100. %116 = fsub float %115, %87
  101. %117 = fmul float %87, 0x3F50624DE0000000
  102. %118 = fadd float %117, %88
  103. %119 = fmul float %90, 0x3F50624DE0000000
  104. %120 = fsub float %119, %87
  105. %121 = fmul float %118, 0x3FE2147AE0000000
  106. %122 = fadd float %121, %51
  107. %123 = fmul float %120, 0x3FE2147AE0000000
  108. %124 = fadd float %123, %52
  109. %125 = fmul float %114, 0x3FDB53F7C0000000
  110. %126 = fadd float %125, %51
  111. %127 = fmul float %116, 0x3FDB53F7C0000000
  112. %128 = fadd float %127, %52
  113. %129 = call float @llvm.AMDIL.clamp.(float %126, float 0.000000e+00, float 1.000000e+00)
  114. %130 = call float @llvm.AMDIL.clamp.(float %128, float 0.000000e+00, float 1.000000e+00)
  115. %131 = bitcast float %129 to i32
  116. %132 = bitcast float %130 to i32
  117. %133 = insertelement <4 x i32> undef, i32 %131, i32 0
  118. %134 = insertelement <4 x i32> %133, i32 %132, i32 1
  119. %135 = insertelement <4 x i32> %134, i32 0, i32 2
  120. %136 = bitcast <8 x i32> %38 to <32 x i8>
  121. %137 = bitcast <4 x i32> %40 to <16 x i8>
  122. %138 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %135, <32 x i8> %136, <16 x i8> %137, i32 2)
  123. %139 = extractelement <4 x float> %138, i32 0
  124. %140 = extractelement <4 x float> %138, i32 1
  125. %141 = extractelement <4 x float> %138, i32 2
  126. %142 = extractelement <4 x float> %138, i32 3
  127. %143 = fmul float %142, %142
  128. %144 = fmul float %129, %106
  129. %145 = fadd float %144, %110
  130. %146 = fmul float %130, %107
  131. %147 = fadd float %146, %111
  132. %148 = fmul float %145, %145
  133. %149 = fmul float %147, %147
  134. %150 = fadd float %149, %148
  135. %151 = fadd float %150, 1.000000e+00
  136. %152 = call float @fabs(float %151)
  137. %153 = call float @llvm.AMDGPU.rsq.clamped.f32(float %152)
  138. %154 = call float @llvm.minnum.f32(float %153, float 0x47EFFFFFE0000000)
  139. %155 = fmul float %154, %145
  140. %156 = fmul float %154, %147
  141. %157 = fmul float %154, %143
  142. %158 = fmul float %155, %143
  143. %159 = fsub float %158, %101
  144. %160 = fmul float %156, %143
  145. %161 = fsub float %160, %102
  146. %162 = fsub float -0.000000e+00, %103
  147. %163 = fsub float %162, %157
  148. %164 = fmul float %159, %159
  149. %165 = fmul float %161, %161
  150. %166 = fadd float %165, %164
  151. %167 = fmul float %163, %163
  152. %168 = fadd float %166, %167
  153. %169 = fmul float %32, %168
  154. %170 = fsub float 1.000000e+00, %169
  155. %171 = call float @llvm.AMDIL.clamp.(float %170, float 0.000000e+00, float 1.000000e+00)
  156. %172 = call float @fabs(float %168)
  157. %173 = call float @llvm.AMDGPU.rsq.clamped.f32(float %172)
  158. %174 = call float @llvm.minnum.f32(float %173, float 0x47EFFFFFE0000000)
  159. %175 = fmul float %174, %159
  160. %176 = fmul float %174, %161
  161. %177 = fmul float %174, %163
  162. %178 = fmul float %175, %139
  163. %179 = fmul float %176, %140
  164. %180 = fadd float %179, %178
  165. %181 = fmul float %177, %141
  166. %182 = fadd float %180, %181
  167. %183 = fsub float %33, %182
  168. %184 = call float @llvm.AMDIL.clamp.(float %183, float 0.000000e+00, float 1.000000e+00)
  169. %185 = fmul float %175, %68
  170. %186 = fmul float %176, %69
  171. %187 = fadd float %186, %185
  172. %188 = fmul float %177, %70
  173. %189 = fadd float %187, %188
  174. %190 = fadd float %189, %34
  175. %191 = call float @llvm.AMDIL.clamp.(float %190, float 0.000000e+00, float 1.000000e+00)
  176. %192 = fmul float %184, %191
  177. %193 = fmul float %192, %171
  178. %194 = bitcast float %129 to i32
  179. %195 = bitcast float %130 to i32
  180. %196 = insertelement <4 x i32> undef, i32 %194, i32 0
  181. %197 = insertelement <4 x i32> %196, i32 %195, i32 1
  182. %198 = insertelement <4 x i32> %197, i32 0, i32 2
  183. %199 = bitcast <8 x i32> %42 to <32 x i8>
  184. %200 = bitcast <4 x i32> %44 to <16 x i8>
  185. %201 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %198, <32 x i8> %199, <16 x i8> %200, i32 2)
  186. %202 = extractelement <4 x float> %201, i32 0
  187. %203 = extractelement <4 x float> %201, i32 1
  188. %204 = extractelement <4 x float> %201, i32 2
  189. %205 = call float @llvm.AMDIL.clamp.(float %122, float 0.000000e+00, float 1.000000e+00)
  190. %206 = call float @llvm.AMDIL.clamp.(float %124, float 0.000000e+00, float 1.000000e+00)
  191. %207 = bitcast float %205 to i32
  192. %208 = bitcast float %206 to i32
  193. %209 = insertelement <4 x i32> undef, i32 %207, i32 0
  194. %210 = insertelement <4 x i32> %209, i32 %208, i32 1
  195. %211 = insertelement <4 x i32> %210, i32 0, i32 2
  196. %212 = bitcast <8 x i32> %38 to <32 x i8>
  197. %213 = bitcast <4 x i32> %40 to <16 x i8>
  198. %214 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %211, <32 x i8> %212, <16 x i8> %213, i32 2)
  199. %215 = extractelement <4 x float> %214, i32 0
  200. %216 = extractelement <4 x float> %214, i32 1
  201. %217 = extractelement <4 x float> %214, i32 2
  202. %218 = extractelement <4 x float> %214, i32 3
  203. %219 = fmul float %218, %218
  204. %220 = fmul float %205, %106
  205. %221 = fadd float %220, %110
  206. %222 = fmul float %206, %107
  207. %223 = fadd float %222, %111
  208. %224 = fmul float %221, %221
  209. %225 = fmul float %223, %223
  210. %226 = fadd float %225, %224
  211. %227 = fadd float %226, 1.000000e+00
  212. %228 = call float @fabs(float %227)
  213. %229 = call float @llvm.AMDGPU.rsq.clamped.f32(float %228)
  214. %230 = call float @llvm.minnum.f32(float %229, float 0x47EFFFFFE0000000)
  215. %231 = fmul float %230, %221
  216. %232 = fmul float %230, %223
  217. %233 = fmul float %230, %219
  218. %234 = fmul float %231, %219
  219. %235 = fsub float %234, %101
  220. %236 = fmul float %232, %219
  221. %237 = fsub float %236, %102
  222. %238 = fsub float -0.000000e+00, %103
  223. %239 = fsub float %238, %233
  224. %240 = fmul float %235, %235
  225. %241 = fmul float %237, %237
  226. %242 = fadd float %241, %240
  227. %243 = fmul float %239, %239
  228. %244 = fadd float %242, %243
  229. %245 = fmul float %32, %244
  230. %246 = fsub float 1.000000e+00, %245
  231. %247 = call float @llvm.AMDIL.clamp.(float %246, float 0.000000e+00, float 1.000000e+00)
  232. %248 = call float @fabs(float %244)
  233. %249 = call float @llvm.AMDGPU.rsq.clamped.f32(float %248)
  234. %250 = call float @llvm.minnum.f32(float %249, float 0x47EFFFFFE0000000)
  235. %251 = fmul float %235, %250
  236. %252 = fmul float %237, %250
  237. %253 = fmul float %239, %250
  238. %254 = fmul float %251, %215
  239. %255 = fmul float %252, %216
  240. %256 = fadd float %255, %254
  241. %257 = fmul float %253, %217
  242. %258 = fadd float %256, %257
  243. %259 = fsub float %33, %258
  244. %260 = call float @llvm.AMDIL.clamp.(float %259, float 0.000000e+00, float 1.000000e+00)
  245. %261 = fmul float %251, %68
  246. %262 = fmul float %252, %69
  247. %263 = fadd float %262, %261
  248. %264 = fmul float %253, %70
  249. %265 = fadd float %263, %264
  250. %266 = fadd float %265, %34
  251. %267 = call float @llvm.AMDIL.clamp.(float %266, float 0.000000e+00, float 1.000000e+00)
  252. %268 = fmul float %267, %260
  253. %269 = fmul float %268, %247
  254. %270 = bitcast float %205 to i32
  255. %271 = bitcast float %206 to i32
  256. %272 = insertelement <4 x i32> undef, i32 %270, i32 0
  257. %273 = insertelement <4 x i32> %272, i32 %271, i32 1
  258. %274 = insertelement <4 x i32> %273, i32 0, i32 2
  259. %275 = bitcast <8 x i32> %42 to <32 x i8>
  260. %276 = bitcast <4 x i32> %44 to <16 x i8>
  261. %277 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %274, <32 x i8> %275, <16 x i8> %276, i32 2)
  262. %278 = extractelement <4 x float> %277, i32 0
  263. %279 = extractelement <4 x float> %277, i32 1
  264. %280 = extractelement <4 x float> %277, i32 2
  265. %281 = fmul float %269, %278
  266. %282 = fmul float %269, %279
  267. %283 = fmul float %269, %280
  268. %284 = fmul float %202, %193
  269. %285 = fadd float %284, %281
  270. %286 = fmul float %203, %193
  271. %287 = fadd float %286, %282
  272. %288 = fmul float %204, %193
  273. %289 = fadd float %288, %283
  274. %290 = fmul float %88, 0x3FE86A7F00000000
  275. %291 = fmul float %87, 0xBFE86A7F00000000
  276. %292 = fmul float %88, 0x3FE3439580000000
  277. %293 = fmul float %87, 0xBFE3439580000000
  278. %294 = fmul float %87, 0x3FE4AC0840000000
  279. %295 = fadd float %294, %290
  280. %296 = fmul float %90, 0x3FE4AC0840000000
  281. %297 = fadd float %296, %291
  282. %298 = fmul float %87, 0x3FE4AC0840000000
  283. %299 = fadd float %298, %290
  284. %300 = fmul float %90, 0x3FE4AC0840000000
  285. %301 = fadd float %300, %291
  286. %302 = fmul float %299, 0x3FE5168720000000
  287. %303 = fadd float %302, %51
  288. %304 = fmul float %301, 0x3FE5168720000000
  289. %305 = fadd float %304, %52
  290. %306 = fmul float %295, 0x3FD0624DE0000000
  291. %307 = fadd float %306, %51
  292. %308 = fmul float %297, 0x3FD0624DE0000000
  293. %309 = fadd float %308, %52
  294. %310 = call float @llvm.AMDIL.clamp.(float %307, float 0.000000e+00, float 1.000000e+00)
  295. %311 = call float @llvm.AMDIL.clamp.(float %309, float 0.000000e+00, float 1.000000e+00)
  296. %312 = bitcast float %310 to i32
  297. %313 = bitcast float %311 to i32
  298. %314 = insertelement <4 x i32> undef, i32 %312, i32 0
  299. %315 = insertelement <4 x i32> %314, i32 %313, i32 1
  300. %316 = insertelement <4 x i32> %315, i32 0, i32 2
  301. %317 = bitcast <8 x i32> %38 to <32 x i8>
  302. %318 = bitcast <4 x i32> %40 to <16 x i8>
  303. %319 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %316, <32 x i8> %317, <16 x i8> %318, i32 2)
  304. %320 = extractelement <4 x float> %319, i32 0
  305. %321 = extractelement <4 x float> %319, i32 1
  306. %322 = extractelement <4 x float> %319, i32 2
  307. %323 = extractelement <4 x float> %319, i32 3
  308. %324 = fmul float %323, %323
  309. %325 = fmul float %310, %106
  310. %326 = fadd float %325, %110
  311. %327 = fmul float %311, %107
  312. %328 = fadd float %327, %111
  313. %329 = fmul float %326, %326
  314. %330 = fmul float %328, %328
  315. %331 = fadd float %330, %329
  316. %332 = fadd float %331, 1.000000e+00
  317. %333 = call float @fabs(float %332)
  318. %334 = call float @llvm.AMDGPU.rsq.clamped.f32(float %333)
  319. %335 = call float @llvm.minnum.f32(float %334, float 0x47EFFFFFE0000000)
  320. %336 = fmul float %335, %326
  321. %337 = fmul float %335, %328
  322. %338 = fmul float %335, %324
  323. %339 = fmul float %336, %324
  324. %340 = fsub float %339, %101
  325. %341 = fmul float %337, %324
  326. %342 = fsub float %341, %102
  327. %343 = fsub float -0.000000e+00, %103
  328. %344 = fsub float %343, %338
  329. %345 = fmul float %340, %340
  330. %346 = fmul float %342, %342
  331. %347 = fadd float %346, %345
  332. %348 = fmul float %344, %344
  333. %349 = fadd float %347, %348
  334. %350 = fmul float %32, %349
  335. %351 = fsub float 1.000000e+00, %350
  336. %352 = call float @llvm.AMDIL.clamp.(float %351, float 0.000000e+00, float 1.000000e+00)
  337. %353 = call float @fabs(float %349)
  338. %354 = call float @llvm.AMDGPU.rsq.clamped.f32(float %353)
  339. %355 = call float @llvm.minnum.f32(float %354, float 0x47EFFFFFE0000000)
  340. %356 = fmul float %355, %340
  341. %357 = fmul float %355, %342
  342. %358 = fmul float %355, %344
  343. %359 = fmul float %356, %320
  344. %360 = fmul float %357, %321
  345. %361 = fadd float %360, %359
  346. %362 = fmul float %358, %322
  347. %363 = fadd float %361, %362
  348. %364 = fsub float %33, %363
  349. %365 = call float @llvm.AMDIL.clamp.(float %364, float 0.000000e+00, float 1.000000e+00)
  350. %366 = fmul float %356, %68
  351. %367 = fmul float %357, %69
  352. %368 = fadd float %367, %366
  353. %369 = fmul float %358, %70
  354. %370 = fadd float %368, %369
  355. %371 = fadd float %370, %34
  356. %372 = call float @llvm.AMDIL.clamp.(float %371, float 0.000000e+00, float 1.000000e+00)
  357. %373 = fmul float %365, %372
  358. %374 = fmul float %373, %352
  359. %375 = bitcast float %310 to i32
  360. %376 = bitcast float %311 to i32
  361. %377 = insertelement <4 x i32> undef, i32 %375, i32 0
  362. %378 = insertelement <4 x i32> %377, i32 %376, i32 1
  363. %379 = insertelement <4 x i32> %378, i32 0, i32 2
  364. %380 = bitcast <8 x i32> %42 to <32 x i8>
  365. %381 = bitcast <4 x i32> %44 to <16 x i8>
  366. %382 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %379, <32 x i8> %380, <16 x i8> %381, i32 2)
  367. %383 = extractelement <4 x float> %382, i32 0
  368. %384 = extractelement <4 x float> %382, i32 1
  369. %385 = extractelement <4 x float> %382, i32 2
  370. %386 = fmul float %383, %374
  371. %387 = fadd float %386, %285
  372. %388 = fmul float %384, %374
  373. %389 = fadd float %388, %287
  374. %390 = fmul float %385, %374
  375. %391 = fadd float %390, %289
  376. %392 = call float @llvm.AMDIL.clamp.(float %303, float 0.000000e+00, float 1.000000e+00)
  377. %393 = call float @llvm.AMDIL.clamp.(float %305, float 0.000000e+00, float 1.000000e+00)
  378. %394 = bitcast float %392 to i32
  379. %395 = bitcast float %393 to i32
  380. %396 = insertelement <4 x i32> undef, i32 %394, i32 0
  381. %397 = insertelement <4 x i32> %396, i32 %395, i32 1
  382. %398 = insertelement <4 x i32> %397, i32 0, i32 2
  383. %399 = bitcast <8 x i32> %38 to <32 x i8>
  384. %400 = bitcast <4 x i32> %40 to <16 x i8>
  385. %401 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %398, <32 x i8> %399, <16 x i8> %400, i32 2)
  386. %402 = extractelement <4 x float> %401, i32 0
  387. %403 = extractelement <4 x float> %401, i32 1
  388. %404 = extractelement <4 x float> %401, i32 2
  389. %405 = extractelement <4 x float> %401, i32 3
  390. %406 = fmul float %405, %405
  391. %407 = fmul float %392, %106
  392. %408 = fadd float %407, %110
  393. %409 = fmul float %393, %107
  394. %410 = fadd float %409, %111
  395. %411 = fmul float %408, %408
  396. %412 = fmul float %410, %410
  397. %413 = fadd float %412, %411
  398. %414 = fadd float %413, 1.000000e+00
  399. %415 = call float @fabs(float %414)
  400. %416 = call float @llvm.AMDGPU.rsq.clamped.f32(float %415)
  401. %417 = call float @llvm.minnum.f32(float %416, float 0x47EFFFFFE0000000)
  402. %418 = fmul float %417, %408
  403. %419 = fmul float %417, %410
  404. %420 = fmul float %417, %406
  405. %421 = fmul float %418, %406
  406. %422 = fsub float %421, %101
  407. %423 = fmul float %419, %406
  408. %424 = fsub float %423, %102
  409. %425 = fsub float -0.000000e+00, %103
  410. %426 = fsub float %425, %420
  411. %427 = fmul float %422, %422
  412. %428 = fmul float %424, %424
  413. %429 = fadd float %428, %427
  414. %430 = fmul float %426, %426
  415. %431 = fadd float %429, %430
  416. %432 = fmul float %32, %431
  417. %433 = fsub float 1.000000e+00, %432
  418. %434 = call float @llvm.AMDIL.clamp.(float %433, float 0.000000e+00, float 1.000000e+00)
  419. %435 = call float @fabs(float %431)
  420. %436 = call float @llvm.AMDGPU.rsq.clamped.f32(float %435)
  421. %437 = call float @llvm.minnum.f32(float %436, float 0x47EFFFFFE0000000)
  422. %438 = fmul float %437, %422
  423. %439 = fmul float %437, %424
  424. %440 = fmul float %437, %426
  425. %441 = fmul float %438, %402
  426. %442 = fmul float %439, %403
  427. %443 = fadd float %442, %441
  428. %444 = fmul float %440, %404
  429. %445 = fadd float %443, %444
  430. %446 = fsub float %33, %445
  431. %447 = call float @llvm.AMDIL.clamp.(float %446, float 0.000000e+00, float 1.000000e+00)
  432. %448 = fmul float %438, %68
  433. %449 = fmul float %439, %69
  434. %450 = fadd float %449, %448
  435. %451 = fmul float %440, %70
  436. %452 = fadd float %450, %451
  437. %453 = fadd float %452, %34
  438. %454 = call float @llvm.AMDIL.clamp.(float %453, float 0.000000e+00, float 1.000000e+00)
  439. %455 = fmul float %447, %454
  440. %456 = fmul float %455, %434
  441. %457 = bitcast float %392 to i32
  442. %458 = bitcast float %393 to i32
  443. %459 = insertelement <4 x i32> undef, i32 %457, i32 0
  444. %460 = insertelement <4 x i32> %459, i32 %458, i32 1
  445. %461 = insertelement <4 x i32> %460, i32 0, i32 2
  446. %462 = bitcast <8 x i32> %42 to <32 x i8>
  447. %463 = bitcast <4 x i32> %44 to <16 x i8>
  448. %464 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %461, <32 x i8> %462, <16 x i8> %463, i32 2)
  449. %465 = extractelement <4 x float> %464, i32 0
  450. %466 = extractelement <4 x float> %464, i32 1
  451. %467 = extractelement <4 x float> %464, i32 2
  452. %468 = fmul float %465, %456
  453. %469 = fadd float %468, %387
  454. %470 = fmul float %466, %456
  455. %471 = fadd float %470, %389
  456. %472 = fmul float %467, %456
  457. %473 = fadd float %472, %391
  458. %474 = fmul float %87, 0x3FE9893740000000
  459. %475 = fadd float %474, %292
  460. %476 = fmul float %90, 0x3FE9893740000000
  461. %477 = fadd float %476, %293
  462. %478 = fmul float %87, 0x3FE9893740000000
  463. %479 = fadd float %478, %292
  464. %480 = fmul float %90, 0x3FE9893740000000
  465. %481 = fadd float %480, %293
  466. %482 = fmul float %479, 0x3FEBCED920000000
  467. %483 = fadd float %482, %51
  468. %484 = fmul float %481, 0x3FEBCED920000000
  469. %485 = fadd float %484, %52
  470. %486 = fmul float %475, 0x3FCB22D0E0000000
  471. %487 = fadd float %486, %51
  472. %488 = fmul float %477, 0x3FCB22D0E0000000
  473. %489 = fadd float %488, %52
  474. %490 = call float @llvm.AMDIL.clamp.(float %487, float 0.000000e+00, float 1.000000e+00)
  475. %491 = call float @llvm.AMDIL.clamp.(float %489, float 0.000000e+00, float 1.000000e+00)
  476. %492 = bitcast float %490 to i32
  477. %493 = bitcast float %491 to i32
  478. %494 = insertelement <4 x i32> undef, i32 %492, i32 0
  479. %495 = insertelement <4 x i32> %494, i32 %493, i32 1
  480. %496 = insertelement <4 x i32> %495, i32 0, i32 2
  481. %497 = bitcast <8 x i32> %38 to <32 x i8>
  482. %498 = bitcast <4 x i32> %40 to <16 x i8>
  483. %499 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %496, <32 x i8> %497, <16 x i8> %498, i32 2)
  484. %500 = extractelement <4 x float> %499, i32 0
  485. %501 = extractelement <4 x float> %499, i32 1
  486. %502 = extractelement <4 x float> %499, i32 2
  487. %503 = extractelement <4 x float> %499, i32 3
  488. %504 = fmul float %503, %503
  489. %505 = fmul float %490, %106
  490. %506 = fadd float %505, %110
  491. %507 = fmul float %491, %107
  492. %508 = fadd float %507, %111
  493. %509 = fmul float %506, %506
  494. %510 = fmul float %508, %508
  495. %511 = fadd float %510, %509
  496. %512 = fadd float %511, 1.000000e+00
  497. %513 = call float @fabs(float %512)
  498. %514 = call float @llvm.AMDGPU.rsq.clamped.f32(float %513)
  499. %515 = call float @llvm.minnum.f32(float %514, float 0x47EFFFFFE0000000)
  500. %516 = fmul float %515, %506
  501. %517 = fmul float %515, %508
  502. %518 = fmul float %515, %504
  503. %519 = fmul float %516, %504
  504. %520 = fsub float %519, %101
  505. %521 = fmul float %517, %504
  506. %522 = fsub float %521, %102
  507. %523 = fsub float -0.000000e+00, %103
  508. %524 = fsub float %523, %518
  509. %525 = fmul float %520, %520
  510. %526 = fmul float %522, %522
  511. %527 = fadd float %526, %525
  512. %528 = fmul float %524, %524
  513. %529 = fadd float %527, %528
  514. %530 = fmul float %32, %529
  515. %531 = fsub float 1.000000e+00, %530
  516. %532 = call float @llvm.AMDIL.clamp.(float %531, float 0.000000e+00, float 1.000000e+00)
  517. %533 = call float @fabs(float %529)
  518. %534 = call float @llvm.AMDGPU.rsq.clamped.f32(float %533)
  519. %535 = call float @llvm.minnum.f32(float %534, float 0x47EFFFFFE0000000)
  520. %536 = fmul float %535, %520
  521. %537 = fmul float %535, %522
  522. %538 = fmul float %535, %524
  523. %539 = fmul float %536, %500
  524. %540 = fmul float %537, %501
  525. %541 = fadd float %540, %539
  526. %542 = fmul float %538, %502
  527. %543 = fadd float %541, %542
  528. %544 = fsub float %33, %543
  529. %545 = call float @llvm.AMDIL.clamp.(float %544, float 0.000000e+00, float 1.000000e+00)
  530. %546 = fmul float %536, %68
  531. %547 = fmul float %537, %69
  532. %548 = fadd float %547, %546
  533. %549 = fmul float %538, %70
  534. %550 = fadd float %548, %549
  535. %551 = fadd float %550, %34
  536. %552 = call float @llvm.AMDIL.clamp.(float %551, float 0.000000e+00, float 1.000000e+00)
  537. %553 = fmul float %545, %552
  538. %554 = fmul float %553, %532
  539. %555 = bitcast float %490 to i32
  540. %556 = bitcast float %491 to i32
  541. %557 = insertelement <4 x i32> undef, i32 %555, i32 0
  542. %558 = insertelement <4 x i32> %557, i32 %556, i32 1
  543. %559 = insertelement <4 x i32> %558, i32 0, i32 2
  544. %560 = bitcast <8 x i32> %42 to <32 x i8>
  545. %561 = bitcast <4 x i32> %44 to <16 x i8>
  546. %562 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %559, <32 x i8> %560, <16 x i8> %561, i32 2)
  547. %563 = extractelement <4 x float> %562, i32 0
  548. %564 = extractelement <4 x float> %562, i32 1
  549. %565 = extractelement <4 x float> %562, i32 2
  550. %566 = fmul float %563, %554
  551. %567 = fadd float %566, %469
  552. %568 = fmul float %564, %554
  553. %569 = fadd float %568, %471
  554. %570 = fmul float %565, %554
  555. %571 = fadd float %570, %473
  556. %572 = call float @llvm.AMDIL.clamp.(float %483, float 0.000000e+00, float 1.000000e+00)
  557. %573 = call float @llvm.AMDIL.clamp.(float %485, float 0.000000e+00, float 1.000000e+00)
  558. %574 = bitcast float %572 to i32
  559. %575 = bitcast float %573 to i32
  560. %576 = insertelement <4 x i32> undef, i32 %574, i32 0
  561. %577 = insertelement <4 x i32> %576, i32 %575, i32 1
  562. %578 = insertelement <4 x i32> %577, i32 0, i32 2
  563. %579 = bitcast <8 x i32> %38 to <32 x i8>
  564. %580 = bitcast <4 x i32> %40 to <16 x i8>
  565. %581 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %578, <32 x i8> %579, <16 x i8> %580, i32 2)
  566. %582 = extractelement <4 x float> %581, i32 0
  567. %583 = extractelement <4 x float> %581, i32 1
  568. %584 = extractelement <4 x float> %581, i32 2
  569. %585 = extractelement <4 x float> %581, i32 3
  570. %586 = fmul float %585, %585
  571. %587 = fmul float %572, %106
  572. %588 = fadd float %587, %110
  573. %589 = fmul float %573, %107
  574. %590 = fadd float %589, %111
  575. %591 = fmul float %588, %588
  576. %592 = fmul float %590, %590
  577. %593 = fadd float %592, %591
  578. %594 = fadd float %593, 1.000000e+00
  579. %595 = call float @fabs(float %594)
  580. %596 = call float @llvm.AMDGPU.rsq.clamped.f32(float %595)
  581. %597 = call float @llvm.minnum.f32(float %596, float 0x47EFFFFFE0000000)
  582. %598 = fmul float %597, %588
  583. %599 = fmul float %597, %590
  584. %600 = fmul float %597, %586
  585. %601 = fmul float %598, %586
  586. %602 = fsub float %601, %101
  587. %603 = fmul float %599, %586
  588. %604 = fsub float %603, %102
  589. %605 = fsub float -0.000000e+00, %103
  590. %606 = fsub float %605, %600
  591. %607 = fmul float %602, %602
  592. %608 = fmul float %604, %604
  593. %609 = fadd float %608, %607
  594. %610 = fmul float %606, %606
  595. %611 = fadd float %609, %610
  596. %612 = fmul float %32, %611
  597. %613 = fsub float 1.000000e+00, %612
  598. %614 = call float @llvm.AMDIL.clamp.(float %613, float 0.000000e+00, float 1.000000e+00)
  599. %615 = call float @fabs(float %611)
  600. %616 = call float @llvm.AMDGPU.rsq.clamped.f32(float %615)
  601. %617 = call float @llvm.minnum.f32(float %616, float 0x47EFFFFFE0000000)
  602. %618 = fmul float %617, %602
  603. %619 = fmul float %617, %604
  604. %620 = fmul float %617, %606
  605. %621 = fmul float %618, %582
  606. %622 = fmul float %619, %583
  607. %623 = fadd float %622, %621
  608. %624 = fmul float %620, %584
  609. %625 = fadd float %623, %624
  610. %626 = fsub float %33, %625
  611. %627 = call float @llvm.AMDIL.clamp.(float %626, float 0.000000e+00, float 1.000000e+00)
  612. %628 = fmul float %618, %68
  613. %629 = fmul float %619, %69
  614. %630 = fadd float %629, %628
  615. %631 = fmul float %620, %70
  616. %632 = fadd float %630, %631
  617. %633 = fadd float %632, %34
  618. %634 = call float @llvm.AMDIL.clamp.(float %633, float 0.000000e+00, float 1.000000e+00)
  619. %635 = fmul float %627, %634
  620. %636 = fmul float %635, %614
  621. %637 = bitcast float %572 to i32
  622. %638 = bitcast float %573 to i32
  623. %639 = insertelement <4 x i32> undef, i32 %637, i32 0
  624. %640 = insertelement <4 x i32> %639, i32 %638, i32 1
  625. %641 = insertelement <4 x i32> %640, i32 0, i32 2
  626. %642 = bitcast <8 x i32> %42 to <32 x i8>
  627. %643 = bitcast <4 x i32> %44 to <16 x i8>
  628. %644 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %641, <32 x i8> %642, <16 x i8> %643, i32 2)
  629. %645 = extractelement <4 x float> %644, i32 0
  630. %646 = extractelement <4 x float> %644, i32 1
  631. %647 = extractelement <4 x float> %644, i32 2
  632. %648 = fmul float %645, %636
  633. %649 = fadd float %648, %567
  634. %650 = fmul float %646, %636
  635. %651 = fadd float %650, %569
  636. %652 = fmul float %647, %636
  637. %653 = fadd float %652, %571
  638. %654 = fmul float %88, 0x3FBD70A3E0000000
  639. %655 = fmul float %87, 0xBFBD70A3E0000000
  640. %656 = fmul float %88, 0xBFB5C28F60000000
  641. %657 = fmul float %87, 0x3FB5C28F60000000
  642. %658 = fmul float %87, 0x3FEFC6A7E0000000
  643. %659 = fadd float %658, %654
  644. %660 = fmul float %90, 0x3FEFC6A7E0000000
  645. %661 = fadd float %660, %655
  646. %662 = fmul float %87, 0x3FEFC6A7E0000000
  647. %663 = fadd float %662, %654
  648. %664 = fmul float %90, 0x3FEFC6A7E0000000
  649. %665 = fadd float %664, %655
  650. %666 = fmul float %663, 0x3FE69FBE80000000
  651. %667 = fadd float %666, %51
  652. %668 = fmul float %665, 0x3FE69FBE80000000
  653. %669 = fadd float %668, %52
  654. %670 = fmul float %659, 0x3FDD4FDF40000000
  655. %671 = fadd float %670, %51
  656. %672 = fmul float %661, 0x3FDD4FDF40000000
  657. %673 = fadd float %672, %52
  658. %674 = call float @llvm.AMDIL.clamp.(float %671, float 0.000000e+00, float 1.000000e+00)
  659. %675 = call float @llvm.AMDIL.clamp.(float %673, float 0.000000e+00, float 1.000000e+00)
  660. %676 = bitcast float %674 to i32
  661. %677 = bitcast float %675 to i32
  662. %678 = insertelement <4 x i32> undef, i32 %676, i32 0
  663. %679 = insertelement <4 x i32> %678, i32 %677, i32 1
  664. %680 = insertelement <4 x i32> %679, i32 0, i32 2
  665. %681 = bitcast <8 x i32> %38 to <32 x i8>
  666. %682 = bitcast <4 x i32> %40 to <16 x i8>
  667. %683 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %680, <32 x i8> %681, <16 x i8> %682, i32 2)
  668. %684 = extractelement <4 x float> %683, i32 0
  669. %685 = extractelement <4 x float> %683, i32 1
  670. %686 = extractelement <4 x float> %683, i32 2
  671. %687 = extractelement <4 x float> %683, i32 3
  672. %688 = fmul float %687, %687
  673. %689 = fmul float %674, %106
  674. %690 = fadd float %689, %110
  675. %691 = fmul float %675, %107
  676. %692 = fadd float %691, %111
  677. %693 = fmul float %690, %690
  678. %694 = fmul float %692, %692
  679. %695 = fadd float %694, %693
  680. %696 = fadd float %695, 1.000000e+00
  681. %697 = call float @fabs(float %696)
  682. %698 = call float @llvm.AMDGPU.rsq.clamped.f32(float %697)
  683. %699 = call float @llvm.minnum.f32(float %698, float 0x47EFFFFFE0000000)
  684. %700 = fmul float %699, %690
  685. %701 = fmul float %699, %692
  686. %702 = fmul float %699, %688
  687. %703 = fmul float %700, %688
  688. %704 = fsub float %703, %101
  689. %705 = fmul float %701, %688
  690. %706 = fsub float %705, %102
  691. %707 = fsub float -0.000000e+00, %103
  692. %708 = fsub float %707, %702
  693. %709 = fmul float %704, %704
  694. %710 = fmul float %706, %706
  695. %711 = fadd float %710, %709
  696. %712 = fmul float %708, %708
  697. %713 = fadd float %711, %712
  698. %714 = fmul float %32, %713
  699. %715 = fsub float 1.000000e+00, %714
  700. %716 = call float @llvm.AMDIL.clamp.(float %715, float 0.000000e+00, float 1.000000e+00)
  701. %717 = call float @fabs(float %713)
  702. %718 = call float @llvm.AMDGPU.rsq.clamped.f32(float %717)
  703. %719 = call float @llvm.minnum.f32(float %718, float 0x47EFFFFFE0000000)
  704. %720 = fmul float %719, %704
  705. %721 = fmul float %719, %706
  706. %722 = fmul float %719, %708
  707. %723 = fmul float %720, %684
  708. %724 = fmul float %721, %685
  709. %725 = fadd float %724, %723
  710. %726 = fmul float %722, %686
  711. %727 = fadd float %725, %726
  712. %728 = fsub float %33, %727
  713. %729 = call float @llvm.AMDIL.clamp.(float %728, float 0.000000e+00, float 1.000000e+00)
  714. %730 = fmul float %720, %68
  715. %731 = fmul float %721, %69
  716. %732 = fadd float %731, %730
  717. %733 = fmul float %722, %70
  718. %734 = fadd float %732, %733
  719. %735 = fadd float %734, %34
  720. %736 = call float @llvm.AMDIL.clamp.(float %735, float 0.000000e+00, float 1.000000e+00)
  721. %737 = fmul float %729, %736
  722. %738 = fmul float %737, %716
  723. %739 = bitcast float %674 to i32
  724. %740 = bitcast float %675 to i32
  725. %741 = insertelement <4 x i32> undef, i32 %739, i32 0
  726. %742 = insertelement <4 x i32> %741, i32 %740, i32 1
  727. %743 = insertelement <4 x i32> %742, i32 0, i32 2
  728. %744 = bitcast <8 x i32> %42 to <32 x i8>
  729. %745 = bitcast <4 x i32> %44 to <16 x i8>
  730. %746 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %743, <32 x i8> %744, <16 x i8> %745, i32 2)
  731. %747 = extractelement <4 x float> %746, i32 0
  732. %748 = extractelement <4 x float> %746, i32 1
  733. %749 = extractelement <4 x float> %746, i32 2
  734. %750 = fmul float %747, %738
  735. %751 = fadd float %750, %649
  736. %752 = fmul float %748, %738
  737. %753 = fadd float %752, %651
  738. %754 = fmul float %749, %738
  739. %755 = fadd float %754, %653
  740. %756 = call float @llvm.AMDIL.clamp.(float %667, float 0.000000e+00, float 1.000000e+00)
  741. %757 = call float @llvm.AMDIL.clamp.(float %669, float 0.000000e+00, float 1.000000e+00)
  742. %758 = bitcast float %756 to i32
  743. %759 = bitcast float %757 to i32
  744. %760 = insertelement <4 x i32> undef, i32 %758, i32 0
  745. %761 = insertelement <4 x i32> %760, i32 %759, i32 1
  746. %762 = insertelement <4 x i32> %761, i32 0, i32 2
  747. %763 = bitcast <8 x i32> %38 to <32 x i8>
  748. %764 = bitcast <4 x i32> %40 to <16 x i8>
  749. %765 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %762, <32 x i8> %763, <16 x i8> %764, i32 2)
  750. %766 = extractelement <4 x float> %765, i32 0
  751. %767 = extractelement <4 x float> %765, i32 1
  752. %768 = extractelement <4 x float> %765, i32 2
  753. %769 = extractelement <4 x float> %765, i32 3
  754. %770 = fmul float %769, %769
  755. %771 = fmul float %756, %106
  756. %772 = fadd float %771, %110
  757. %773 = fmul float %757, %107
  758. %774 = fadd float %773, %111
  759. %775 = fmul float %772, %772
  760. %776 = fmul float %774, %774
  761. %777 = fadd float %776, %775
  762. %778 = fadd float %777, 1.000000e+00
  763. %779 = call float @fabs(float %778)
  764. %780 = call float @llvm.AMDGPU.rsq.clamped.f32(float %779)
  765. %781 = call float @llvm.minnum.f32(float %780, float 0x47EFFFFFE0000000)
  766. %782 = fmul float %781, %772
  767. %783 = fmul float %781, %774
  768. %784 = fmul float %781, %770
  769. %785 = fmul float %782, %770
  770. %786 = fsub float %785, %101
  771. %787 = fmul float %783, %770
  772. %788 = fsub float %787, %102
  773. %789 = fsub float -0.000000e+00, %103
  774. %790 = fsub float %789, %784
  775. %791 = fmul float %786, %786
  776. %792 = fmul float %788, %788
  777. %793 = fadd float %792, %791
  778. %794 = fmul float %790, %790
  779. %795 = fadd float %793, %794
  780. %796 = fmul float %32, %795
  781. %797 = fsub float 1.000000e+00, %796
  782. %798 = call float @llvm.AMDIL.clamp.(float %797, float 0.000000e+00, float 1.000000e+00)
  783. %799 = call float @fabs(float %795)
  784. %800 = call float @llvm.AMDGPU.rsq.clamped.f32(float %799)
  785. %801 = call float @llvm.minnum.f32(float %800, float 0x47EFFFFFE0000000)
  786. %802 = fmul float %801, %786
  787. %803 = fmul float %801, %788
  788. %804 = fmul float %801, %790
  789. %805 = fmul float %802, %766
  790. %806 = fmul float %803, %767
  791. %807 = fadd float %806, %805
  792. %808 = fmul float %804, %768
  793. %809 = fadd float %807, %808
  794. %810 = fsub float %33, %809
  795. %811 = call float @llvm.AMDIL.clamp.(float %810, float 0.000000e+00, float 1.000000e+00)
  796. %812 = fmul float %802, %68
  797. %813 = fmul float %803, %69
  798. %814 = fadd float %813, %812
  799. %815 = fmul float %804, %70
  800. %816 = fadd float %814, %815
  801. %817 = fadd float %816, %34
  802. %818 = call float @llvm.AMDIL.clamp.(float %817, float 0.000000e+00, float 1.000000e+00)
  803. %819 = fmul float %811, %818
  804. %820 = fmul float %819, %798
  805. %821 = bitcast float %756 to i32
  806. %822 = bitcast float %757 to i32
  807. %823 = insertelement <4 x i32> undef, i32 %821, i32 0
  808. %824 = insertelement <4 x i32> %823, i32 %822, i32 1
  809. %825 = insertelement <4 x i32> %824, i32 0, i32 2
  810. %826 = bitcast <8 x i32> %42 to <32 x i8>
  811. %827 = bitcast <4 x i32> %44 to <16 x i8>
  812. %828 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %825, <32 x i8> %826, <16 x i8> %827, i32 2)
  813. %829 = extractelement <4 x float> %828, i32 0
  814. %830 = extractelement <4 x float> %828, i32 1
  815. %831 = extractelement <4 x float> %828, i32 2
  816. %832 = fmul float %829, %820
  817. %833 = fadd float %832, %751
  818. %834 = fmul float %830, %820
  819. %835 = fadd float %834, %753
  820. %836 = fmul float %831, %820
  821. %837 = fadd float %836, %755
  822. %838 = fmul float %87, 0x3FEFDF3B60000000
  823. %839 = fadd float %838, %656
  824. %840 = fmul float %90, 0x3FEFDF3B60000000
  825. %841 = fadd float %840, %657
  826. %842 = fmul float %87, 0x3FEFDF3B60000000
  827. %843 = fadd float %842, %656
  828. %844 = fmul float %90, 0x3FEFDF3B60000000
  829. %845 = fadd float %844, %657
  830. %846 = fmul float %843, 0x3FEC51EB80000000
  831. %847 = fadd float %846, %51
  832. %848 = fmul float %845, 0x3FEC51EB80000000
  833. %849 = fadd float %848, %52
  834. %850 = fmul float %839, 0x3FCBA5E360000000
  835. %851 = fadd float %850, %51
  836. %852 = fmul float %841, 0x3FCBA5E360000000
  837. %853 = fadd float %852, %52
  838. %854 = call float @llvm.AMDIL.clamp.(float %851, float 0.000000e+00, float 1.000000e+00)
  839. %855 = call float @llvm.AMDIL.clamp.(float %853, float 0.000000e+00, float 1.000000e+00)
  840. %856 = bitcast float %854 to i32
  841. %857 = bitcast float %855 to i32
  842. %858 = insertelement <4 x i32> undef, i32 %856, i32 0
  843. %859 = insertelement <4 x i32> %858, i32 %857, i32 1
  844. %860 = insertelement <4 x i32> %859, i32 0, i32 2
  845. %861 = bitcast <8 x i32> %38 to <32 x i8>
  846. %862 = bitcast <4 x i32> %40 to <16 x i8>
  847. %863 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %860, <32 x i8> %861, <16 x i8> %862, i32 2)
  848. %864 = extractelement <4 x float> %863, i32 0
  849. %865 = extractelement <4 x float> %863, i32 1
  850. %866 = extractelement <4 x float> %863, i32 2
  851. %867 = extractelement <4 x float> %863, i32 3
  852. %868 = fmul float %867, %867
  853. %869 = fmul float %854, %106
  854. %870 = fadd float %869, %110
  855. %871 = fmul float %855, %107
  856. %872 = fadd float %871, %111
  857. %873 = fmul float %870, %870
  858. %874 = fmul float %872, %872
  859. %875 = fadd float %874, %873
  860. %876 = fadd float %875, 1.000000e+00
  861. %877 = call float @fabs(float %876)
  862. %878 = call float @llvm.AMDGPU.rsq.clamped.f32(float %877)
  863. %879 = call float @llvm.minnum.f32(float %878, float 0x47EFFFFFE0000000)
  864. %880 = fmul float %879, %870
  865. %881 = fmul float %879, %872
  866. %882 = fmul float %879, %868
  867. %883 = fmul float %880, %868
  868. %884 = fsub float %883, %101
  869. %885 = fmul float %881, %868
  870. %886 = fsub float %885, %102
  871. %887 = fsub float -0.000000e+00, %103
  872. %888 = fsub float %887, %882
  873. %889 = fmul float %884, %884
  874. %890 = fmul float %886, %886
  875. %891 = fadd float %890, %889
  876. %892 = fmul float %888, %888
  877. %893 = fadd float %891, %892
  878. %894 = fmul float %32, %893
  879. %895 = fsub float 1.000000e+00, %894
  880. %896 = call float @llvm.AMDIL.clamp.(float %895, float 0.000000e+00, float 1.000000e+00)
  881. %897 = call float @fabs(float %893)
  882. %898 = call float @llvm.AMDGPU.rsq.clamped.f32(float %897)
  883. %899 = call float @llvm.minnum.f32(float %898, float 0x47EFFFFFE0000000)
  884. %900 = fmul float %899, %884
  885. %901 = fmul float %899, %886
  886. %902 = fmul float %899, %888
  887. %903 = fmul float %900, %864
  888. %904 = fmul float %901, %865
  889. %905 = fadd float %904, %903
  890. %906 = fmul float %902, %866
  891. %907 = fadd float %905, %906
  892. %908 = fsub float %33, %907
  893. %909 = call float @llvm.AMDIL.clamp.(float %908, float 0.000000e+00, float 1.000000e+00)
  894. %910 = fmul float %900, %68
  895. %911 = fmul float %901, %69
  896. %912 = fadd float %911, %910
  897. %913 = fmul float %902, %70
  898. %914 = fadd float %912, %913
  899. %915 = fadd float %914, %34
  900. %916 = call float @llvm.AMDIL.clamp.(float %915, float 0.000000e+00, float 1.000000e+00)
  901. %917 = fmul float %909, %916
  902. %918 = fmul float %917, %896
  903. %919 = bitcast float %854 to i32
  904. %920 = bitcast float %855 to i32
  905. %921 = insertelement <4 x i32> undef, i32 %919, i32 0
  906. %922 = insertelement <4 x i32> %921, i32 %920, i32 1
  907. %923 = insertelement <4 x i32> %922, i32 0, i32 2
  908. %924 = bitcast <8 x i32> %42 to <32 x i8>
  909. %925 = bitcast <4 x i32> %44 to <16 x i8>
  910. %926 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %923, <32 x i8> %924, <16 x i8> %925, i32 2)
  911. %927 = extractelement <4 x float> %926, i32 0
  912. %928 = extractelement <4 x float> %926, i32 1
  913. %929 = extractelement <4 x float> %926, i32 2
  914. %930 = fmul float %927, %918
  915. %931 = fadd float %930, %833
  916. %932 = fmul float %928, %918
  917. %933 = fadd float %932, %835
  918. %934 = fmul float %929, %918
  919. %935 = fadd float %934, %837
  920. %936 = call float @llvm.AMDIL.clamp.(float %847, float 0.000000e+00, float 1.000000e+00)
  921. %937 = call float @llvm.AMDIL.clamp.(float %849, float 0.000000e+00, float 1.000000e+00)
  922. %938 = bitcast float %936 to i32
  923. %939 = bitcast float %937 to i32
  924. %940 = insertelement <4 x i32> undef, i32 %938, i32 0
  925. %941 = insertelement <4 x i32> %940, i32 %939, i32 1
  926. %942 = insertelement <4 x i32> %941, i32 0, i32 2
  927. %943 = bitcast <8 x i32> %38 to <32 x i8>
  928. %944 = bitcast <4 x i32> %40 to <16 x i8>
  929. %945 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %942, <32 x i8> %943, <16 x i8> %944, i32 2)
  930. %946 = extractelement <4 x float> %945, i32 0
  931. %947 = extractelement <4 x float> %945, i32 1
  932. %948 = extractelement <4 x float> %945, i32 2
  933. %949 = extractelement <4 x float> %945, i32 3
  934. %950 = fmul float %949, %949
  935. %951 = fmul float %936, %106
  936. %952 = fadd float %951, %110
  937. %953 = fmul float %937, %107
  938. %954 = fadd float %953, %111
  939. %955 = fmul float %952, %952
  940. %956 = fmul float %954, %954
  941. %957 = fadd float %956, %955
  942. %958 = fadd float %957, 1.000000e+00
  943. %959 = call float @fabs(float %958)
  944. %960 = call float @llvm.AMDGPU.rsq.clamped.f32(float %959)
  945. %961 = call float @llvm.minnum.f32(float %960, float 0x47EFFFFFE0000000)
  946. %962 = fmul float %961, %952
  947. %963 = fmul float %961, %954
  948. %964 = fmul float %961, %950
  949. %965 = fmul float %962, %950
  950. %966 = fsub float %965, %101
  951. %967 = fmul float %963, %950
  952. %968 = fsub float %967, %102
  953. %969 = fsub float -0.000000e+00, %103
  954. %970 = fsub float %969, %964
  955. %971 = fmul float %966, %966
  956. %972 = fmul float %968, %968
  957. %973 = fadd float %972, %971
  958. %974 = fmul float %970, %970
  959. %975 = fadd float %973, %974
  960. %976 = fmul float %32, %975
  961. %977 = fsub float 1.000000e+00, %976
  962. %978 = call float @llvm.AMDIL.clamp.(float %977, float 0.000000e+00, float 1.000000e+00)
  963. %979 = call float @fabs(float %975)
  964. %980 = call float @llvm.AMDGPU.rsq.clamped.f32(float %979)
  965. %981 = call float @llvm.minnum.f32(float %980, float 0x47EFFFFFE0000000)
  966. %982 = fmul float %981, %966
  967. %983 = fmul float %981, %968
  968. %984 = fmul float %981, %970
  969. %985 = fmul float %982, %946
  970. %986 = fmul float %983, %947
  971. %987 = fadd float %986, %985
  972. %988 = fmul float %984, %948
  973. %989 = fadd float %987, %988
  974. %990 = fsub float %33, %989
  975. %991 = call float @llvm.AMDIL.clamp.(float %990, float 0.000000e+00, float 1.000000e+00)
  976. %992 = fmul float %982, %68
  977. %993 = fmul float %983, %69
  978. %994 = fadd float %993, %992
  979. %995 = fmul float %984, %70
  980. %996 = fadd float %994, %995
  981. %997 = fadd float %996, %34
  982. %998 = call float @llvm.AMDIL.clamp.(float %997, float 0.000000e+00, float 1.000000e+00)
  983. %999 = fmul float %991, %998
  984. %1000 = fmul float %999, %978
  985. %1001 = bitcast float %936 to i32
  986. %1002 = bitcast float %937 to i32
  987. %1003 = insertelement <4 x i32> undef, i32 %1001, i32 0
  988. %1004 = insertelement <4 x i32> %1003, i32 %1002, i32 1
  989. %1005 = insertelement <4 x i32> %1004, i32 0, i32 2
  990. %1006 = bitcast <8 x i32> %42 to <32 x i8>
  991. %1007 = bitcast <4 x i32> %44 to <16 x i8>
  992. %1008 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1005, <32 x i8> %1006, <16 x i8> %1007, i32 2)
  993. %1009 = extractelement <4 x float> %1008, i32 0
  994. %1010 = extractelement <4 x float> %1008, i32 1
  995. %1011 = extractelement <4 x float> %1008, i32 2
  996. %1012 = fmul float %1009, %1000
  997. %1013 = fadd float %1012, %931
  998. %1014 = fmul float %1010, %1000
  999. %1015 = fadd float %1014, %933
  1000. %1016 = fmul float %1011, %1000
  1001. %1017 = fadd float %1016, %935
  1002. %1018 = fmul float %88, 0xBFDBF7CEE0000000
  1003. %1019 = fmul float %87, 0x3FDBF7CEE0000000
  1004. %1020 = fmul float %88, 0xBFECCCCCC0000000
  1005. %1021 = fmul float %87, 0x3FECCCCCC0000000
  1006. %1022 = fmul float %87, 0x3FECC49BA0000000
  1007. %1023 = fadd float %1022, %1018
  1008. %1024 = fmul float %90, 0x3FECC49BA0000000
  1009. %1025 = fadd float %1024, %1019
  1010. %1026 = fmul float %87, 0x3FECC49BA0000000
  1011. %1027 = fadd float %1026, %1018
  1012. %1028 = fmul float %90, 0x3FECC49BA0000000
  1013. %1029 = fadd float %1028, %1019
  1014. %1030 = fmul float %1027, 0x3FEF3B6460000000
  1015. %1031 = fadd float %1030, %51
  1016. %1032 = fmul float %1029, 0x3FEF3B6460000000
  1017. %1033 = fadd float %1032, %52
  1018. %1034 = fmul float %1023, 0x3FDFCED920000000
  1019. %1035 = fadd float %1034, %51
  1020. %1036 = fmul float %1025, 0x3FDFCED920000000
  1021. %1037 = fadd float %1036, %52
  1022. %1038 = call float @llvm.AMDIL.clamp.(float %1035, float 0.000000e+00, float 1.000000e+00)
  1023. %1039 = call float @llvm.AMDIL.clamp.(float %1037, float 0.000000e+00, float 1.000000e+00)
  1024. %1040 = bitcast float %1038 to i32
  1025. %1041 = bitcast float %1039 to i32
  1026. %1042 = insertelement <4 x i32> undef, i32 %1040, i32 0
  1027. %1043 = insertelement <4 x i32> %1042, i32 %1041, i32 1
  1028. %1044 = insertelement <4 x i32> %1043, i32 0, i32 2
  1029. %1045 = bitcast <8 x i32> %38 to <32 x i8>
  1030. %1046 = bitcast <4 x i32> %40 to <16 x i8>
  1031. %1047 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1044, <32 x i8> %1045, <16 x i8> %1046, i32 2)
  1032. %1048 = extractelement <4 x float> %1047, i32 0
  1033. %1049 = extractelement <4 x float> %1047, i32 1
  1034. %1050 = extractelement <4 x float> %1047, i32 2
  1035. %1051 = extractelement <4 x float> %1047, i32 3
  1036. %1052 = fmul float %1051, %1051
  1037. %1053 = fmul float %1038, %106
  1038. %1054 = fadd float %1053, %110
  1039. %1055 = fmul float %1039, %107
  1040. %1056 = fadd float %1055, %111
  1041. %1057 = fmul float %1054, %1054
  1042. %1058 = fmul float %1056, %1056
  1043. %1059 = fadd float %1058, %1057
  1044. %1060 = fadd float %1059, 1.000000e+00
  1045. %1061 = call float @fabs(float %1060)
  1046. %1062 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1061)
  1047. %1063 = call float @llvm.minnum.f32(float %1062, float 0x47EFFFFFE0000000)
  1048. %1064 = fmul float %1063, %1054
  1049. %1065 = fmul float %1063, %1056
  1050. %1066 = fmul float %1063, %1052
  1051. %1067 = fmul float %1064, %1052
  1052. %1068 = fsub float %1067, %101
  1053. %1069 = fmul float %1065, %1052
  1054. %1070 = fsub float %1069, %102
  1055. %1071 = fsub float -0.000000e+00, %103
  1056. %1072 = fsub float %1071, %1066
  1057. %1073 = fmul float %1068, %1068
  1058. %1074 = fmul float %1070, %1070
  1059. %1075 = fadd float %1074, %1073
  1060. %1076 = fmul float %1072, %1072
  1061. %1077 = fadd float %1075, %1076
  1062. %1078 = fmul float %32, %1077
  1063. %1079 = fsub float 1.000000e+00, %1078
  1064. %1080 = call float @llvm.AMDIL.clamp.(float %1079, float 0.000000e+00, float 1.000000e+00)
  1065. %1081 = call float @fabs(float %1077)
  1066. %1082 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1081)
  1067. %1083 = call float @llvm.minnum.f32(float %1082, float 0x47EFFFFFE0000000)
  1068. %1084 = fmul float %1083, %1068
  1069. %1085 = fmul float %1083, %1070
  1070. %1086 = fmul float %1083, %1072
  1071. %1087 = fmul float %1084, %1048
  1072. %1088 = fmul float %1085, %1049
  1073. %1089 = fadd float %1088, %1087
  1074. %1090 = fmul float %1086, %1050
  1075. %1091 = fadd float %1089, %1090
  1076. %1092 = fsub float %33, %1091
  1077. %1093 = call float @llvm.AMDIL.clamp.(float %1092, float 0.000000e+00, float 1.000000e+00)
  1078. %1094 = fmul float %1084, %68
  1079. %1095 = fmul float %1085, %69
  1080. %1096 = fadd float %1095, %1094
  1081. %1097 = fmul float %1086, %70
  1082. %1098 = fadd float %1096, %1097
  1083. %1099 = fadd float %1098, %34
  1084. %1100 = call float @llvm.AMDIL.clamp.(float %1099, float 0.000000e+00, float 1.000000e+00)
  1085. %1101 = fmul float %1093, %1100
  1086. %1102 = fmul float %1101, %1080
  1087. %1103 = bitcast float %1038 to i32
  1088. %1104 = bitcast float %1039 to i32
  1089. %1105 = insertelement <4 x i32> undef, i32 %1103, i32 0
  1090. %1106 = insertelement <4 x i32> %1105, i32 %1104, i32 1
  1091. %1107 = insertelement <4 x i32> %1106, i32 0, i32 2
  1092. %1108 = bitcast <8 x i32> %42 to <32 x i8>
  1093. %1109 = bitcast <4 x i32> %44 to <16 x i8>
  1094. %1110 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1107, <32 x i8> %1108, <16 x i8> %1109, i32 2)
  1095. %1111 = extractelement <4 x float> %1110, i32 0
  1096. %1112 = extractelement <4 x float> %1110, i32 1
  1097. %1113 = extractelement <4 x float> %1110, i32 2
  1098. %1114 = fmul float %1111, %1102
  1099. %1115 = fadd float %1114, %1013
  1100. %1116 = fmul float %1112, %1102
  1101. %1117 = fadd float %1116, %1015
  1102. %1118 = fmul float %1113, %1102
  1103. %1119 = fadd float %1118, %1017
  1104. %1120 = call float @llvm.AMDIL.clamp.(float %1031, float 0.000000e+00, float 1.000000e+00)
  1105. %1121 = call float @llvm.AMDIL.clamp.(float %1033, float 0.000000e+00, float 1.000000e+00)
  1106. %1122 = bitcast float %1120 to i32
  1107. %1123 = bitcast float %1121 to i32
  1108. %1124 = insertelement <4 x i32> undef, i32 %1122, i32 0
  1109. %1125 = insertelement <4 x i32> %1124, i32 %1123, i32 1
  1110. %1126 = insertelement <4 x i32> %1125, i32 0, i32 2
  1111. %1127 = bitcast <8 x i32> %38 to <32 x i8>
  1112. %1128 = bitcast <4 x i32> %40 to <16 x i8>
  1113. %1129 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1126, <32 x i8> %1127, <16 x i8> %1128, i32 2)
  1114. %1130 = extractelement <4 x float> %1129, i32 0
  1115. %1131 = extractelement <4 x float> %1129, i32 1
  1116. %1132 = extractelement <4 x float> %1129, i32 2
  1117. %1133 = extractelement <4 x float> %1129, i32 3
  1118. %1134 = fmul float %1133, %1133
  1119. %1135 = fmul float %1120, %106
  1120. %1136 = fadd float %1135, %110
  1121. %1137 = fmul float %1121, %107
  1122. %1138 = fadd float %1137, %111
  1123. %1139 = fmul float %1136, %1136
  1124. %1140 = fmul float %1138, %1138
  1125. %1141 = fadd float %1140, %1139
  1126. %1142 = fadd float %1141, 1.000000e+00
  1127. %1143 = call float @fabs(float %1142)
  1128. %1144 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1143)
  1129. %1145 = call float @llvm.minnum.f32(float %1144, float 0x47EFFFFFE0000000)
  1130. %1146 = fmul float %1145, %1136
  1131. %1147 = fmul float %1145, %1138
  1132. %1148 = fmul float %1145, %1134
  1133. %1149 = fmul float %1146, %1134
  1134. %1150 = fsub float %1149, %101
  1135. %1151 = fmul float %1147, %1134
  1136. %1152 = fsub float %1151, %102
  1137. %1153 = fsub float -0.000000e+00, %103
  1138. %1154 = fsub float %1153, %1148
  1139. %1155 = fmul float %1150, %1150
  1140. %1156 = fmul float %1152, %1152
  1141. %1157 = fadd float %1156, %1155
  1142. %1158 = fmul float %1154, %1154
  1143. %1159 = fadd float %1157, %1158
  1144. %1160 = fmul float %32, %1159
  1145. %1161 = fsub float 1.000000e+00, %1160
  1146. %1162 = call float @llvm.AMDIL.clamp.(float %1161, float 0.000000e+00, float 1.000000e+00)
  1147. %1163 = call float @fabs(float %1159)
  1148. %1164 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1163)
  1149. %1165 = call float @llvm.minnum.f32(float %1164, float 0x47EFFFFFE0000000)
  1150. %1166 = fmul float %1165, %1150
  1151. %1167 = fmul float %1165, %1152
  1152. %1168 = fmul float %1165, %1154
  1153. %1169 = fmul float %1166, %1130
  1154. %1170 = fmul float %1167, %1131
  1155. %1171 = fadd float %1170, %1169
  1156. %1172 = fmul float %1168, %1132
  1157. %1173 = fadd float %1171, %1172
  1158. %1174 = fsub float %33, %1173
  1159. %1175 = call float @llvm.AMDIL.clamp.(float %1174, float 0.000000e+00, float 1.000000e+00)
  1160. %1176 = fmul float %1166, %68
  1161. %1177 = fmul float %1167, %69
  1162. %1178 = fadd float %1177, %1176
  1163. %1179 = fmul float %1168, %70
  1164. %1180 = fadd float %1178, %1179
  1165. %1181 = fadd float %1180, %34
  1166. %1182 = call float @llvm.AMDIL.clamp.(float %1181, float 0.000000e+00, float 1.000000e+00)
  1167. %1183 = fmul float %1175, %1182
  1168. %1184 = fmul float %1183, %1162
  1169. %1185 = bitcast float %1120 to i32
  1170. %1186 = bitcast float %1121 to i32
  1171. %1187 = insertelement <4 x i32> undef, i32 %1185, i32 0
  1172. %1188 = insertelement <4 x i32> %1187, i32 %1186, i32 1
  1173. %1189 = insertelement <4 x i32> %1188, i32 0, i32 2
  1174. %1190 = bitcast <8 x i32> %42 to <32 x i8>
  1175. %1191 = bitcast <4 x i32> %44 to <16 x i8>
  1176. %1192 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1189, <32 x i8> %1190, <16 x i8> %1191, i32 2)
  1177. %1193 = extractelement <4 x float> %1192, i32 0
  1178. %1194 = extractelement <4 x float> %1192, i32 1
  1179. %1195 = extractelement <4 x float> %1192, i32 2
  1180. %1196 = fmul float %1193, %1184
  1181. %1197 = fadd float %1196, %1115
  1182. %1198 = fmul float %1194, %1184
  1183. %1199 = fadd float %1198, %1117
  1184. %1200 = fmul float %1195, %1184
  1185. %1201 = fadd float %1200, %1119
  1186. %1202 = fmul float %87, 0x3FDBE76C80000000
  1187. %1203 = fadd float %1202, %1020
  1188. %1204 = fmul float %90, 0x3FDBE76C80000000
  1189. %1205 = fadd float %1204, %1021
  1190. %1206 = fmul float %87, 0x3FDBE76C80000000
  1191. %1207 = fadd float %1206, %1020
  1192. %1208 = fmul float %90, 0x3FDBE76C80000000
  1193. %1209 = fadd float %1208, %1021
  1194. %1210 = fmul float %1207, 0x3FE36C8B40000000
  1195. %1211 = fadd float %1210, %51
  1196. %1212 = fmul float %1209, 0x3FE36C8B40000000
  1197. %1213 = fadd float %1212, %52
  1198. %1214 = fmul float %1203, 0x3FE1604180000000
  1199. %1215 = fadd float %1214, %51
  1200. %1216 = fmul float %1205, 0x3FE1604180000000
  1201. %1217 = fadd float %1216, %52
  1202. %1218 = call float @llvm.AMDIL.clamp.(float %1215, float 0.000000e+00, float 1.000000e+00)
  1203. %1219 = call float @llvm.AMDIL.clamp.(float %1217, float 0.000000e+00, float 1.000000e+00)
  1204. %1220 = bitcast float %1218 to i32
  1205. %1221 = bitcast float %1219 to i32
  1206. %1222 = insertelement <4 x i32> undef, i32 %1220, i32 0
  1207. %1223 = insertelement <4 x i32> %1222, i32 %1221, i32 1
  1208. %1224 = insertelement <4 x i32> %1223, i32 0, i32 2
  1209. %1225 = bitcast <8 x i32> %38 to <32 x i8>
  1210. %1226 = bitcast <4 x i32> %40 to <16 x i8>
  1211. %1227 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1224, <32 x i8> %1225, <16 x i8> %1226, i32 2)
  1212. %1228 = extractelement <4 x float> %1227, i32 0
  1213. %1229 = extractelement <4 x float> %1227, i32 1
  1214. %1230 = extractelement <4 x float> %1227, i32 2
  1215. %1231 = extractelement <4 x float> %1227, i32 3
  1216. %1232 = fmul float %1231, %1231
  1217. %1233 = fmul float %1218, %106
  1218. %1234 = fadd float %1233, %110
  1219. %1235 = fmul float %1219, %107
  1220. %1236 = fadd float %1235, %111
  1221. %1237 = fmul float %1234, %1234
  1222. %1238 = fmul float %1236, %1236
  1223. %1239 = fadd float %1238, %1237
  1224. %1240 = fadd float %1239, 1.000000e+00
  1225. %1241 = call float @fabs(float %1240)
  1226. %1242 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1241)
  1227. %1243 = call float @llvm.minnum.f32(float %1242, float 0x47EFFFFFE0000000)
  1228. %1244 = fmul float %1243, %1234
  1229. %1245 = fmul float %1243, %1236
  1230. %1246 = fmul float %1243, %1232
  1231. %1247 = fmul float %1244, %1232
  1232. %1248 = fsub float %1247, %101
  1233. %1249 = fmul float %1245, %1232
  1234. %1250 = fsub float %1249, %102
  1235. %1251 = fsub float -0.000000e+00, %103
  1236. %1252 = fsub float %1251, %1246
  1237. %1253 = fmul float %1248, %1248
  1238. %1254 = fmul float %1250, %1250
  1239. %1255 = fadd float %1254, %1253
  1240. %1256 = fmul float %1252, %1252
  1241. %1257 = fadd float %1255, %1256
  1242. %1258 = fmul float %32, %1257
  1243. %1259 = fsub float 1.000000e+00, %1258
  1244. %1260 = call float @llvm.AMDIL.clamp.(float %1259, float 0.000000e+00, float 1.000000e+00)
  1245. %1261 = call float @fabs(float %1257)
  1246. %1262 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1261)
  1247. %1263 = call float @llvm.minnum.f32(float %1262, float 0x47EFFFFFE0000000)
  1248. %1264 = fmul float %1263, %1248
  1249. %1265 = fmul float %1263, %1250
  1250. %1266 = fmul float %1263, %1252
  1251. %1267 = fmul float %1264, %1228
  1252. %1268 = fmul float %1265, %1229
  1253. %1269 = fadd float %1268, %1267
  1254. %1270 = fmul float %1266, %1230
  1255. %1271 = fadd float %1269, %1270
  1256. %1272 = fsub float %33, %1271
  1257. %1273 = call float @llvm.AMDIL.clamp.(float %1272, float 0.000000e+00, float 1.000000e+00)
  1258. %1274 = fmul float %1264, %68
  1259. %1275 = fmul float %1265, %69
  1260. %1276 = fadd float %1275, %1274
  1261. %1277 = fmul float %1266, %70
  1262. %1278 = fadd float %1276, %1277
  1263. %1279 = fadd float %1278, %34
  1264. %1280 = call float @llvm.AMDIL.clamp.(float %1279, float 0.000000e+00, float 1.000000e+00)
  1265. %1281 = fmul float %1273, %1280
  1266. %1282 = fmul float %1281, %1260
  1267. %1283 = bitcast float %1218 to i32
  1268. %1284 = bitcast float %1219 to i32
  1269. %1285 = insertelement <4 x i32> undef, i32 %1283, i32 0
  1270. %1286 = insertelement <4 x i32> %1285, i32 %1284, i32 1
  1271. %1287 = insertelement <4 x i32> %1286, i32 0, i32 2
  1272. %1288 = bitcast <8 x i32> %42 to <32 x i8>
  1273. %1289 = bitcast <4 x i32> %44 to <16 x i8>
  1274. %1290 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1287, <32 x i8> %1288, <16 x i8> %1289, i32 2)
  1275. %1291 = extractelement <4 x float> %1290, i32 0
  1276. %1292 = extractelement <4 x float> %1290, i32 1
  1277. %1293 = extractelement <4 x float> %1290, i32 2
  1278. %1294 = fmul float %1291, %1282
  1279. %1295 = fadd float %1294, %1197
  1280. %1296 = fmul float %1292, %1282
  1281. %1297 = fadd float %1296, %1199
  1282. %1298 = fmul float %1293, %1282
  1283. %1299 = fadd float %1298, %1201
  1284. %1300 = call float @llvm.AMDIL.clamp.(float %1211, float 0.000000e+00, float 1.000000e+00)
  1285. %1301 = call float @llvm.AMDIL.clamp.(float %1213, float 0.000000e+00, float 1.000000e+00)
  1286. %1302 = bitcast float %1300 to i32
  1287. %1303 = bitcast float %1301 to i32
  1288. %1304 = insertelement <4 x i32> undef, i32 %1302, i32 0
  1289. %1305 = insertelement <4 x i32> %1304, i32 %1303, i32 1
  1290. %1306 = insertelement <4 x i32> %1305, i32 0, i32 2
  1291. %1307 = bitcast <8 x i32> %38 to <32 x i8>
  1292. %1308 = bitcast <4 x i32> %40 to <16 x i8>
  1293. %1309 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1306, <32 x i8> %1307, <16 x i8> %1308, i32 2)
  1294. %1310 = extractelement <4 x float> %1309, i32 0
  1295. %1311 = extractelement <4 x float> %1309, i32 1
  1296. %1312 = extractelement <4 x float> %1309, i32 2
  1297. %1313 = extractelement <4 x float> %1309, i32 3
  1298. %1314 = fmul float %1313, %1313
  1299. %1315 = fmul float %1300, %106
  1300. %1316 = fadd float %1315, %110
  1301. %1317 = fmul float %1301, %107
  1302. %1318 = fadd float %1317, %111
  1303. %1319 = fmul float %1316, %1316
  1304. %1320 = fmul float %1318, %1318
  1305. %1321 = fadd float %1320, %1319
  1306. %1322 = fadd float %1321, 1.000000e+00
  1307. %1323 = call float @fabs(float %1322)
  1308. %1324 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1323)
  1309. %1325 = call float @llvm.minnum.f32(float %1324, float 0x47EFFFFFE0000000)
  1310. %1326 = fmul float %1325, %1316
  1311. %1327 = fmul float %1325, %1318
  1312. %1328 = fmul float %1325, %1314
  1313. %1329 = fmul float %1326, %1314
  1314. %1330 = fsub float %1329, %101
  1315. %1331 = fmul float %1327, %1314
  1316. %1332 = fsub float %1331, %102
  1317. %1333 = fsub float -0.000000e+00, %103
  1318. %1334 = fsub float %1333, %1328
  1319. %1335 = fmul float %1330, %1330
  1320. %1336 = fmul float %1332, %1332
  1321. %1337 = fadd float %1336, %1335
  1322. %1338 = fmul float %1334, %1334
  1323. %1339 = fadd float %1337, %1338
  1324. %1340 = fmul float %32, %1339
  1325. %1341 = fsub float 1.000000e+00, %1340
  1326. %1342 = call float @llvm.AMDIL.clamp.(float %1341, float 0.000000e+00, float 1.000000e+00)
  1327. %1343 = call float @fabs(float %1339)
  1328. %1344 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1343)
  1329. %1345 = call float @llvm.minnum.f32(float %1344, float 0x47EFFFFFE0000000)
  1330. %1346 = fmul float %1345, %1330
  1331. %1347 = fmul float %1345, %1332
  1332. %1348 = fmul float %1345, %1334
  1333. %1349 = fmul float %1346, %1310
  1334. %1350 = fmul float %1347, %1311
  1335. %1351 = fadd float %1350, %1349
  1336. %1352 = fmul float %1348, %1312
  1337. %1353 = fadd float %1351, %1352
  1338. %1354 = fsub float %33, %1353
  1339. %1355 = call float @llvm.AMDIL.clamp.(float %1354, float 0.000000e+00, float 1.000000e+00)
  1340. %1356 = fmul float %1346, %68
  1341. %1357 = fmul float %1347, %69
  1342. %1358 = fadd float %1357, %1356
  1343. %1359 = fmul float %1348, %70
  1344. %1360 = fadd float %1358, %1359
  1345. %1361 = fadd float %1360, %34
  1346. %1362 = call float @llvm.AMDIL.clamp.(float %1361, float 0.000000e+00, float 1.000000e+00)
  1347. %1363 = fmul float %1355, %1362
  1348. %1364 = fmul float %1363, %1342
  1349. %1365 = bitcast float %1300 to i32
  1350. %1366 = bitcast float %1301 to i32
  1351. %1367 = insertelement <4 x i32> undef, i32 %1365, i32 0
  1352. %1368 = insertelement <4 x i32> %1367, i32 %1366, i32 1
  1353. %1369 = insertelement <4 x i32> %1368, i32 0, i32 2
  1354. %1370 = bitcast <8 x i32> %42 to <32 x i8>
  1355. %1371 = bitcast <4 x i32> %44 to <16 x i8>
  1356. %1372 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1369, <32 x i8> %1370, <16 x i8> %1371, i32 2)
  1357. %1373 = extractelement <4 x float> %1372, i32 0
  1358. %1374 = extractelement <4 x float> %1372, i32 1
  1359. %1375 = extractelement <4 x float> %1372, i32 2
  1360. %1376 = fmul float %1373, %1364
  1361. %1377 = fadd float %1376, %1295
  1362. %1378 = fmul float %1374, %1364
  1363. %1379 = fadd float %1378, %1297
  1364. %1380 = fmul float %1375, %1364
  1365. %1381 = fadd float %1380, %1299
  1366. %1382 = fmul float %88, 0xBFEE978D40000000
  1367. %1383 = fmul float %87, 0x3FEE978D40000000
  1368. %1384 = fmul float %87, 0x3F50624DE0000000
  1369. %1385 = fsub float %1384, %88
  1370. %1386 = fmul float %90, 0x3F50624DE0000000
  1371. %1387 = fadd float %1386, %87
  1372. %1388 = fmul float %87, 0x3F50624DE0000000
  1373. %1389 = fsub float %1388, %88
  1374. %1390 = fmul float %90, 0x3F50624DE0000000
  1375. %1391 = fadd float %1390, %87
  1376. %1392 = fmul float %1389, 0x3FE6E978E0000000
  1377. %1393 = fadd float %1392, %51
  1378. %1394 = fmul float %1391, 0x3FE6E978E0000000
  1379. %1395 = fadd float %1394, %52
  1380. %1396 = fmul float %1385, 0x3FC9168720000000
  1381. %1397 = fadd float %1396, %51
  1382. %1398 = fmul float %1387, 0x3FC9168720000000
  1383. %1399 = fadd float %1398, %52
  1384. %1400 = call float @llvm.AMDIL.clamp.(float %1397, float 0.000000e+00, float 1.000000e+00)
  1385. %1401 = call float @llvm.AMDIL.clamp.(float %1399, float 0.000000e+00, float 1.000000e+00)
  1386. %1402 = bitcast float %1400 to i32
  1387. %1403 = bitcast float %1401 to i32
  1388. %1404 = insertelement <4 x i32> undef, i32 %1402, i32 0
  1389. %1405 = insertelement <4 x i32> %1404, i32 %1403, i32 1
  1390. %1406 = insertelement <4 x i32> %1405, i32 0, i32 2
  1391. %1407 = bitcast <8 x i32> %38 to <32 x i8>
  1392. %1408 = bitcast <4 x i32> %40 to <16 x i8>
  1393. %1409 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1406, <32 x i8> %1407, <16 x i8> %1408, i32 2)
  1394. %1410 = extractelement <4 x float> %1409, i32 0
  1395. %1411 = extractelement <4 x float> %1409, i32 1
  1396. %1412 = extractelement <4 x float> %1409, i32 2
  1397. %1413 = extractelement <4 x float> %1409, i32 3
  1398. %1414 = fmul float %1413, %1413
  1399. %1415 = fmul float %1400, %106
  1400. %1416 = fadd float %1415, %110
  1401. %1417 = fmul float %1401, %107
  1402. %1418 = fadd float %1417, %111
  1403. %1419 = fmul float %1416, %1416
  1404. %1420 = fmul float %1418, %1418
  1405. %1421 = fadd float %1420, %1419
  1406. %1422 = fadd float %1421, 1.000000e+00
  1407. %1423 = call float @fabs(float %1422)
  1408. %1424 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1423)
  1409. %1425 = call float @llvm.minnum.f32(float %1424, float 0x47EFFFFFE0000000)
  1410. %1426 = fmul float %1425, %1416
  1411. %1427 = fmul float %1425, %1418
  1412. %1428 = fmul float %1425, %1414
  1413. %1429 = fmul float %1426, %1414
  1414. %1430 = fsub float %1429, %101
  1415. %1431 = fmul float %1427, %1414
  1416. %1432 = fsub float %1431, %102
  1417. %1433 = fsub float -0.000000e+00, %103
  1418. %1434 = fsub float %1433, %1428
  1419. %1435 = fmul float %1430, %1430
  1420. %1436 = fmul float %1432, %1432
  1421. %1437 = fadd float %1436, %1435
  1422. %1438 = fmul float %1434, %1434
  1423. %1439 = fadd float %1437, %1438
  1424. %1440 = fmul float %32, %1439
  1425. %1441 = fsub float 1.000000e+00, %1440
  1426. %1442 = call float @llvm.AMDIL.clamp.(float %1441, float 0.000000e+00, float 1.000000e+00)
  1427. %1443 = call float @fabs(float %1439)
  1428. %1444 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1443)
  1429. %1445 = call float @llvm.minnum.f32(float %1444, float 0x47EFFFFFE0000000)
  1430. %1446 = fmul float %1445, %1430
  1431. %1447 = fmul float %1445, %1432
  1432. %1448 = fmul float %1445, %1434
  1433. %1449 = fmul float %1446, %1410
  1434. %1450 = fmul float %1447, %1411
  1435. %1451 = fadd float %1450, %1449
  1436. %1452 = fmul float %1448, %1412
  1437. %1453 = fadd float %1451, %1452
  1438. %1454 = fsub float %33, %1453
  1439. %1455 = call float @llvm.AMDIL.clamp.(float %1454, float 0.000000e+00, float 1.000000e+00)
  1440. %1456 = fmul float %1446, %68
  1441. %1457 = fmul float %1447, %69
  1442. %1458 = fadd float %1457, %1456
  1443. %1459 = fmul float %1448, %70
  1444. %1460 = fadd float %1458, %1459
  1445. %1461 = fadd float %1460, %34
  1446. %1462 = call float @llvm.AMDIL.clamp.(float %1461, float 0.000000e+00, float 1.000000e+00)
  1447. %1463 = fmul float %1455, %1462
  1448. %1464 = fmul float %1463, %1442
  1449. %1465 = bitcast float %1400 to i32
  1450. %1466 = bitcast float %1401 to i32
  1451. %1467 = insertelement <4 x i32> undef, i32 %1465, i32 0
  1452. %1468 = insertelement <4 x i32> %1467, i32 %1466, i32 1
  1453. %1469 = insertelement <4 x i32> %1468, i32 0, i32 2
  1454. %1470 = bitcast <8 x i32> %42 to <32 x i8>
  1455. %1471 = bitcast <4 x i32> %44 to <16 x i8>
  1456. %1472 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1469, <32 x i8> %1470, <16 x i8> %1471, i32 2)
  1457. %1473 = extractelement <4 x float> %1472, i32 0
  1458. %1474 = extractelement <4 x float> %1472, i32 1
  1459. %1475 = extractelement <4 x float> %1472, i32 2
  1460. %1476 = fmul float %1473, %1464
  1461. %1477 = fadd float %1476, %1377
  1462. %1478 = fmul float %1474, %1464
  1463. %1479 = fadd float %1478, %1379
  1464. %1480 = fmul float %1475, %1464
  1465. %1481 = fadd float %1480, %1381
  1466. %1482 = call float @llvm.AMDIL.clamp.(float %1393, float 0.000000e+00, float 1.000000e+00)
  1467. %1483 = call float @llvm.AMDIL.clamp.(float %1395, float 0.000000e+00, float 1.000000e+00)
  1468. %1484 = bitcast float %1482 to i32
  1469. %1485 = bitcast float %1483 to i32
  1470. %1486 = insertelement <4 x i32> undef, i32 %1484, i32 0
  1471. %1487 = insertelement <4 x i32> %1486, i32 %1485, i32 1
  1472. %1488 = insertelement <4 x i32> %1487, i32 0, i32 2
  1473. %1489 = bitcast <8 x i32> %38 to <32 x i8>
  1474. %1490 = bitcast <4 x i32> %40 to <16 x i8>
  1475. %1491 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1488, <32 x i8> %1489, <16 x i8> %1490, i32 2)
  1476. %1492 = extractelement <4 x float> %1491, i32 0
  1477. %1493 = extractelement <4 x float> %1491, i32 1
  1478. %1494 = extractelement <4 x float> %1491, i32 2
  1479. %1495 = extractelement <4 x float> %1491, i32 3
  1480. %1496 = fmul float %1495, %1495
  1481. %1497 = fmul float %1482, %106
  1482. %1498 = fadd float %1497, %110
  1483. %1499 = fmul float %1483, %107
  1484. %1500 = fadd float %1499, %111
  1485. %1501 = fmul float %1498, %1498
  1486. %1502 = fmul float %1500, %1500
  1487. %1503 = fadd float %1502, %1501
  1488. %1504 = fadd float %1503, 1.000000e+00
  1489. %1505 = call float @fabs(float %1504)
  1490. %1506 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1505)
  1491. %1507 = call float @llvm.minnum.f32(float %1506, float 0x47EFFFFFE0000000)
  1492. %1508 = fmul float %1507, %1498
  1493. %1509 = fmul float %1507, %1500
  1494. %1510 = fmul float %1507, %1496
  1495. %1511 = fmul float %1508, %1496
  1496. %1512 = fsub float %1511, %101
  1497. %1513 = fmul float %1509, %1496
  1498. %1514 = fsub float %1513, %102
  1499. %1515 = fsub float -0.000000e+00, %103
  1500. %1516 = fsub float %1515, %1510
  1501. %1517 = fmul float %1512, %1512
  1502. %1518 = fmul float %1514, %1514
  1503. %1519 = fadd float %1518, %1517
  1504. %1520 = fmul float %1516, %1516
  1505. %1521 = fadd float %1519, %1520
  1506. %1522 = fmul float %32, %1521
  1507. %1523 = fsub float 1.000000e+00, %1522
  1508. %1524 = call float @llvm.AMDIL.clamp.(float %1523, float 0.000000e+00, float 1.000000e+00)
  1509. %1525 = call float @fabs(float %1521)
  1510. %1526 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1525)
  1511. %1527 = call float @llvm.minnum.f32(float %1526, float 0x47EFFFFFE0000000)
  1512. %1528 = fmul float %1527, %1512
  1513. %1529 = fmul float %1527, %1514
  1514. %1530 = fmul float %1527, %1516
  1515. %1531 = fmul float %1528, %1492
  1516. %1532 = fmul float %1529, %1493
  1517. %1533 = fadd float %1532, %1531
  1518. %1534 = fmul float %1530, %1494
  1519. %1535 = fadd float %1533, %1534
  1520. %1536 = fsub float %33, %1535
  1521. %1537 = call float @llvm.AMDIL.clamp.(float %1536, float 0.000000e+00, float 1.000000e+00)
  1522. %1538 = fmul float %1528, %68
  1523. %1539 = fmul float %1529, %69
  1524. %1540 = fadd float %1539, %1538
  1525. %1541 = fmul float %1530, %70
  1526. %1542 = fadd float %1540, %1541
  1527. %1543 = fadd float %1542, %34
  1528. %1544 = call float @llvm.AMDIL.clamp.(float %1543, float 0.000000e+00, float 1.000000e+00)
  1529. %1545 = fmul float %1537, %1544
  1530. %1546 = fmul float %1545, %1524
  1531. %1547 = bitcast float %1482 to i32
  1532. %1548 = bitcast float %1483 to i32
  1533. %1549 = insertelement <4 x i32> undef, i32 %1547, i32 0
  1534. %1550 = insertelement <4 x i32> %1549, i32 %1548, i32 1
  1535. %1551 = insertelement <4 x i32> %1550, i32 0, i32 2
  1536. %1552 = bitcast <8 x i32> %42 to <32 x i8>
  1537. %1553 = bitcast <4 x i32> %44 to <16 x i8>
  1538. %1554 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1551, <32 x i8> %1552, <16 x i8> %1553, i32 2)
  1539. %1555 = extractelement <4 x float> %1554, i32 0
  1540. %1556 = extractelement <4 x float> %1554, i32 1
  1541. %1557 = extractelement <4 x float> %1554, i32 2
  1542. %1558 = fmul float %1555, %1546
  1543. %1559 = fadd float %1558, %1477
  1544. %1560 = fmul float %1556, %1546
  1545. %1561 = fadd float %1560, %1479
  1546. %1562 = fmul float %1557, %1546
  1547. %1563 = fadd float %1562, %1481
  1548. %1564 = fmul float %87, 0xBFD2C08320000000
  1549. %1565 = fadd float %1564, %1382
  1550. %1566 = fmul float %90, 0xBFD2C08320000000
  1551. %1567 = fadd float %1566, %1383
  1552. %1568 = fmul float %87, 0xBFD2C08320000000
  1553. %1569 = fadd float %1568, %1382
  1554. %1570 = fmul float %90, 0xBFD2C08320000000
  1555. %1571 = fadd float %1570, %1383
  1556. %1572 = fmul float %1569, 0x3FE224DD20000000
  1557. %1573 = fadd float %1572, %51
  1558. %1574 = fmul float %1571, 0x3FE224DD20000000
  1559. %1575 = fadd float %1574, %52
  1560. %1576 = fmul float %1565, 0x3FCB020C40000000
  1561. %1577 = fadd float %1576, %51
  1562. %1578 = fmul float %1567, 0x3FCB020C40000000
  1563. %1579 = fadd float %1578, %52
  1564. %1580 = call float @llvm.AMDIL.clamp.(float %1577, float 0.000000e+00, float 1.000000e+00)
  1565. %1581 = call float @llvm.AMDIL.clamp.(float %1579, float 0.000000e+00, float 1.000000e+00)
  1566. %1582 = bitcast float %1580 to i32
  1567. %1583 = bitcast float %1581 to i32
  1568. %1584 = insertelement <4 x i32> undef, i32 %1582, i32 0
  1569. %1585 = insertelement <4 x i32> %1584, i32 %1583, i32 1
  1570. %1586 = insertelement <4 x i32> %1585, i32 0, i32 2
  1571. %1587 = bitcast <8 x i32> %38 to <32 x i8>
  1572. %1588 = bitcast <4 x i32> %40 to <16 x i8>
  1573. %1589 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1586, <32 x i8> %1587, <16 x i8> %1588, i32 2)
  1574. %1590 = extractelement <4 x float> %1589, i32 0
  1575. %1591 = extractelement <4 x float> %1589, i32 1
  1576. %1592 = extractelement <4 x float> %1589, i32 2
  1577. %1593 = extractelement <4 x float> %1589, i32 3
  1578. %1594 = fmul float %1593, %1593
  1579. %1595 = fmul float %1580, %106
  1580. %1596 = fadd float %1595, %110
  1581. %1597 = fmul float %1581, %107
  1582. %1598 = fadd float %1597, %111
  1583. %1599 = fmul float %1596, %1596
  1584. %1600 = fmul float %1598, %1598
  1585. %1601 = fadd float %1600, %1599
  1586. %1602 = fadd float %1601, 1.000000e+00
  1587. %1603 = call float @fabs(float %1602)
  1588. %1604 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1603)
  1589. %1605 = call float @llvm.minnum.f32(float %1604, float 0x47EFFFFFE0000000)
  1590. %1606 = fmul float %1605, %1596
  1591. %1607 = fmul float %1605, %1598
  1592. %1608 = fmul float %1605, %1594
  1593. %1609 = fmul float %1606, %1594
  1594. %1610 = fsub float %1609, %101
  1595. %1611 = fmul float %1607, %1594
  1596. %1612 = fsub float %1611, %102
  1597. %1613 = fsub float -0.000000e+00, %103
  1598. %1614 = fsub float %1613, %1608
  1599. %1615 = fmul float %1610, %1610
  1600. %1616 = fmul float %1612, %1612
  1601. %1617 = fadd float %1616, %1615
  1602. %1618 = fmul float %1614, %1614
  1603. %1619 = fadd float %1617, %1618
  1604. %1620 = fmul float %32, %1619
  1605. %1621 = fsub float 1.000000e+00, %1620
  1606. %1622 = call float @llvm.AMDIL.clamp.(float %1621, float 0.000000e+00, float 1.000000e+00)
  1607. %1623 = call float @fabs(float %1619)
  1608. %1624 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1623)
  1609. %1625 = call float @llvm.minnum.f32(float %1624, float 0x47EFFFFFE0000000)
  1610. %1626 = fmul float %1625, %1610
  1611. %1627 = fmul float %1625, %1612
  1612. %1628 = fmul float %1625, %1614
  1613. %1629 = fmul float %1626, %1590
  1614. %1630 = fmul float %1627, %1591
  1615. %1631 = fadd float %1630, %1629
  1616. %1632 = fmul float %1628, %1592
  1617. %1633 = fadd float %1631, %1632
  1618. %1634 = fsub float %33, %1633
  1619. %1635 = call float @llvm.AMDIL.clamp.(float %1634, float 0.000000e+00, float 1.000000e+00)
  1620. %1636 = fmul float %1626, %68
  1621. %1637 = fmul float %1627, %69
  1622. %1638 = fadd float %1637, %1636
  1623. %1639 = fmul float %1628, %70
  1624. %1640 = fadd float %1638, %1639
  1625. %1641 = fadd float %1640, %34
  1626. %1642 = call float @llvm.AMDIL.clamp.(float %1641, float 0.000000e+00, float 1.000000e+00)
  1627. %1643 = fmul float %1635, %1642
  1628. %1644 = fmul float %1643, %1622
  1629. %1645 = bitcast float %1580 to i32
  1630. %1646 = bitcast float %1581 to i32
  1631. %1647 = insertelement <4 x i32> undef, i32 %1645, i32 0
  1632. %1648 = insertelement <4 x i32> %1647, i32 %1646, i32 1
  1633. %1649 = insertelement <4 x i32> %1648, i32 0, i32 2
  1634. %1650 = bitcast <8 x i32> %42 to <32 x i8>
  1635. %1651 = bitcast <4 x i32> %44 to <16 x i8>
  1636. %1652 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1649, <32 x i8> %1650, <16 x i8> %1651, i32 2)
  1637. %1653 = extractelement <4 x float> %1652, i32 0
  1638. %1654 = extractelement <4 x float> %1652, i32 1
  1639. %1655 = extractelement <4 x float> %1652, i32 2
  1640. %1656 = fmul float %1653, %1644
  1641. %1657 = fadd float %1656, %1559
  1642. %1658 = fmul float %1654, %1644
  1643. %1659 = fadd float %1658, %1561
  1644. %1660 = fmul float %1655, %1644
  1645. %1661 = fadd float %1660, %1563
  1646. %1662 = call float @llvm.AMDIL.clamp.(float %1573, float 0.000000e+00, float 1.000000e+00)
  1647. %1663 = call float @llvm.AMDIL.clamp.(float %1575, float 0.000000e+00, float 1.000000e+00)
  1648. %1664 = bitcast float %1662 to i32
  1649. %1665 = bitcast float %1663 to i32
  1650. %1666 = insertelement <4 x i32> undef, i32 %1664, i32 0
  1651. %1667 = insertelement <4 x i32> %1666, i32 %1665, i32 1
  1652. %1668 = insertelement <4 x i32> %1667, i32 0, i32 2
  1653. %1669 = bitcast <8 x i32> %38 to <32 x i8>
  1654. %1670 = bitcast <4 x i32> %40 to <16 x i8>
  1655. %1671 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1668, <32 x i8> %1669, <16 x i8> %1670, i32 2)
  1656. %1672 = extractelement <4 x float> %1671, i32 0
  1657. %1673 = extractelement <4 x float> %1671, i32 1
  1658. %1674 = extractelement <4 x float> %1671, i32 2
  1659. %1675 = extractelement <4 x float> %1671, i32 3
  1660. %1676 = fmul float %1675, %1675
  1661. %1677 = fmul float %1662, %106
  1662. %1678 = fadd float %1677, %110
  1663. %1679 = fmul float %1663, %107
  1664. %1680 = fadd float %1679, %111
  1665. %1681 = fmul float %1678, %1678
  1666. %1682 = fmul float %1680, %1680
  1667. %1683 = fadd float %1682, %1681
  1668. %1684 = fadd float %1683, 1.000000e+00
  1669. %1685 = call float @fabs(float %1684)
  1670. %1686 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1685)
  1671. %1687 = call float @llvm.minnum.f32(float %1686, float 0x47EFFFFFE0000000)
  1672. %1688 = fmul float %1687, %1678
  1673. %1689 = fmul float %1687, %1680
  1674. %1690 = fmul float %1687, %1676
  1675. %1691 = fmul float %1688, %1676
  1676. %1692 = fsub float %1691, %101
  1677. %1693 = fmul float %1689, %1676
  1678. %1694 = fsub float %1693, %102
  1679. %1695 = fsub float -0.000000e+00, %103
  1680. %1696 = fsub float %1695, %1690
  1681. %1697 = fmul float %1692, %1692
  1682. %1698 = fmul float %1694, %1694
  1683. %1699 = fadd float %1698, %1697
  1684. %1700 = fmul float %1696, %1696
  1685. %1701 = fadd float %1699, %1700
  1686. %1702 = fmul float %32, %1701
  1687. %1703 = fsub float 1.000000e+00, %1702
  1688. %1704 = call float @llvm.AMDIL.clamp.(float %1703, float 0.000000e+00, float 1.000000e+00)
  1689. %1705 = call float @fabs(float %1701)
  1690. %1706 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1705)
  1691. %1707 = call float @llvm.minnum.f32(float %1706, float 0x47EFFFFFE0000000)
  1692. %1708 = fmul float %1707, %1692
  1693. %1709 = fmul float %1707, %1694
  1694. %1710 = fmul float %1707, %1696
  1695. %1711 = fmul float %1708, %1672
  1696. %1712 = fmul float %1709, %1673
  1697. %1713 = fadd float %1712, %1711
  1698. %1714 = fmul float %1710, %1674
  1699. %1715 = fadd float %1713, %1714
  1700. %1716 = fsub float %33, %1715
  1701. %1717 = call float @llvm.AMDIL.clamp.(float %1716, float 0.000000e+00, float 1.000000e+00)
  1702. %1718 = fmul float %1708, %68
  1703. %1719 = fmul float %1709, %69
  1704. %1720 = fadd float %1719, %1718
  1705. %1721 = fmul float %1710, %70
  1706. %1722 = fadd float %1720, %1721
  1707. %1723 = fadd float %1722, %34
  1708. %1724 = call float @llvm.AMDIL.clamp.(float %1723, float 0.000000e+00, float 1.000000e+00)
  1709. %1725 = fmul float %1717, %1724
  1710. %1726 = fmul float %1725, %1704
  1711. %1727 = bitcast float %1662 to i32
  1712. %1728 = bitcast float %1663 to i32
  1713. %1729 = insertelement <4 x i32> undef, i32 %1727, i32 0
  1714. %1730 = insertelement <4 x i32> %1729, i32 %1728, i32 1
  1715. %1731 = insertelement <4 x i32> %1730, i32 0, i32 2
  1716. %1732 = bitcast <8 x i32> %42 to <32 x i8>
  1717. %1733 = bitcast <4 x i32> %44 to <16 x i8>
  1718. %1734 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1731, <32 x i8> %1732, <16 x i8> %1733, i32 2)
  1719. %1735 = extractelement <4 x float> %1734, i32 0
  1720. %1736 = extractelement <4 x float> %1734, i32 1
  1721. %1737 = extractelement <4 x float> %1734, i32 2
  1722. %1738 = fmul float %1735, %1726
  1723. %1739 = fadd float %1738, %1657
  1724. %1740 = fmul float %1736, %1726
  1725. %1741 = fadd float %1740, %1659
  1726. %1742 = fmul float %1737, %1726
  1727. %1743 = fadd float %1742, %1661
  1728. %1744 = fmul float %88, 0xBFEB9DB220000000
  1729. %1745 = fmul float %87, 0x3FEB9DB220000000
  1730. %1746 = fmul float %88, 0xBFE66E9780000000
  1731. %1747 = fmul float %87, 0x3FE66E9780000000
  1732. %1748 = fmul float %87, 0xBFE03126E0000000
  1733. %1749 = fadd float %1748, %1744
  1734. %1750 = fmul float %90, 0xBFE03126E0000000
  1735. %1751 = fadd float %1750, %1745
  1736. %1752 = fmul float %87, 0xBFE03126E0000000
  1737. %1753 = fadd float %1752, %1744
  1738. %1754 = fmul float %90, 0xBFE03126E0000000
  1739. %1755 = fadd float %1754, %1745
  1740. %1756 = fmul float %1753, 0x3FE4ED9160000000
  1741. %1757 = fadd float %1756, %51
  1742. %1758 = fmul float %1755, 0x3FE4ED9160000000
  1743. %1759 = fadd float %1758, %52
  1744. %1760 = fmul float %1749, 0x3FD2B020C0000000
  1745. %1761 = fadd float %1760, %51
  1746. %1762 = fmul float %1751, 0x3FD2B020C0000000
  1747. %1763 = fadd float %1762, %52
  1748. %1764 = call float @llvm.AMDIL.clamp.(float %1761, float 0.000000e+00, float 1.000000e+00)
  1749. %1765 = call float @llvm.AMDIL.clamp.(float %1763, float 0.000000e+00, float 1.000000e+00)
  1750. %1766 = bitcast float %1764 to i32
  1751. %1767 = bitcast float %1765 to i32
  1752. %1768 = insertelement <4 x i32> undef, i32 %1766, i32 0
  1753. %1769 = insertelement <4 x i32> %1768, i32 %1767, i32 1
  1754. %1770 = insertelement <4 x i32> %1769, i32 0, i32 2
  1755. %1771 = bitcast <8 x i32> %38 to <32 x i8>
  1756. %1772 = bitcast <4 x i32> %40 to <16 x i8>
  1757. %1773 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1770, <32 x i8> %1771, <16 x i8> %1772, i32 2)
  1758. %1774 = extractelement <4 x float> %1773, i32 0
  1759. %1775 = extractelement <4 x float> %1773, i32 1
  1760. %1776 = extractelement <4 x float> %1773, i32 2
  1761. %1777 = extractelement <4 x float> %1773, i32 3
  1762. %1778 = fmul float %1777, %1777
  1763. %1779 = fmul float %1764, %106
  1764. %1780 = fadd float %1779, %110
  1765. %1781 = fmul float %1765, %107
  1766. %1782 = fadd float %1781, %111
  1767. %1783 = fmul float %1780, %1780
  1768. %1784 = fmul float %1782, %1782
  1769. %1785 = fadd float %1784, %1783
  1770. %1786 = fadd float %1785, 1.000000e+00
  1771. %1787 = call float @fabs(float %1786)
  1772. %1788 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1787)
  1773. %1789 = call float @llvm.minnum.f32(float %1788, float 0x47EFFFFFE0000000)
  1774. %1790 = fmul float %1789, %1780
  1775. %1791 = fmul float %1789, %1782
  1776. %1792 = fmul float %1789, %1778
  1777. %1793 = fmul float %1790, %1778
  1778. %1794 = fsub float %1793, %101
  1779. %1795 = fmul float %1791, %1778
  1780. %1796 = fsub float %1795, %102
  1781. %1797 = fsub float -0.000000e+00, %103
  1782. %1798 = fsub float %1797, %1792
  1783. %1799 = fmul float %1794, %1794
  1784. %1800 = fmul float %1796, %1796
  1785. %1801 = fadd float %1800, %1799
  1786. %1802 = fmul float %1798, %1798
  1787. %1803 = fadd float %1801, %1802
  1788. %1804 = fmul float %32, %1803
  1789. %1805 = fsub float 1.000000e+00, %1804
  1790. %1806 = call float @llvm.AMDIL.clamp.(float %1805, float 0.000000e+00, float 1.000000e+00)
  1791. %1807 = call float @fabs(float %1803)
  1792. %1808 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1807)
  1793. %1809 = call float @llvm.minnum.f32(float %1808, float 0x47EFFFFFE0000000)
  1794. %1810 = fmul float %1809, %1794
  1795. %1811 = fmul float %1809, %1796
  1796. %1812 = fmul float %1809, %1798
  1797. %1813 = fmul float %1810, %1774
  1798. %1814 = fmul float %1811, %1775
  1799. %1815 = fadd float %1814, %1813
  1800. %1816 = fmul float %1812, %1776
  1801. %1817 = fadd float %1815, %1816
  1802. %1818 = fsub float %33, %1817
  1803. %1819 = call float @llvm.AMDIL.clamp.(float %1818, float 0.000000e+00, float 1.000000e+00)
  1804. %1820 = fmul float %1810, %68
  1805. %1821 = fmul float %1811, %69
  1806. %1822 = fadd float %1821, %1820
  1807. %1823 = fmul float %1812, %70
  1808. %1824 = fadd float %1822, %1823
  1809. %1825 = fadd float %1824, %34
  1810. %1826 = call float @llvm.AMDIL.clamp.(float %1825, float 0.000000e+00, float 1.000000e+00)
  1811. %1827 = fmul float %1819, %1826
  1812. %1828 = fmul float %1827, %1806
  1813. %1829 = bitcast float %1764 to i32
  1814. %1830 = bitcast float %1765 to i32
  1815. %1831 = insertelement <4 x i32> undef, i32 %1829, i32 0
  1816. %1832 = insertelement <4 x i32> %1831, i32 %1830, i32 1
  1817. %1833 = insertelement <4 x i32> %1832, i32 0, i32 2
  1818. %1834 = bitcast <8 x i32> %42 to <32 x i8>
  1819. %1835 = bitcast <4 x i32> %44 to <16 x i8>
  1820. %1836 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1833, <32 x i8> %1834, <16 x i8> %1835, i32 2)
  1821. %1837 = extractelement <4 x float> %1836, i32 0
  1822. %1838 = extractelement <4 x float> %1836, i32 1
  1823. %1839 = extractelement <4 x float> %1836, i32 2
  1824. %1840 = fmul float %1837, %1828
  1825. %1841 = fadd float %1840, %1739
  1826. %1842 = fmul float %1838, %1828
  1827. %1843 = fadd float %1842, %1741
  1828. %1844 = fmul float %1839, %1828
  1829. %1845 = fadd float %1844, %1743
  1830. %1846 = call float @llvm.AMDIL.clamp.(float %1757, float 0.000000e+00, float 1.000000e+00)
  1831. %1847 = call float @llvm.AMDIL.clamp.(float %1759, float 0.000000e+00, float 1.000000e+00)
  1832. %1848 = bitcast float %1846 to i32
  1833. %1849 = bitcast float %1847 to i32
  1834. %1850 = insertelement <4 x i32> undef, i32 %1848, i32 0
  1835. %1851 = insertelement <4 x i32> %1850, i32 %1849, i32 1
  1836. %1852 = insertelement <4 x i32> %1851, i32 0, i32 2
  1837. %1853 = bitcast <8 x i32> %38 to <32 x i8>
  1838. %1854 = bitcast <4 x i32> %40 to <16 x i8>
  1839. %1855 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1852, <32 x i8> %1853, <16 x i8> %1854, i32 2)
  1840. %1856 = extractelement <4 x float> %1855, i32 0
  1841. %1857 = extractelement <4 x float> %1855, i32 1
  1842. %1858 = extractelement <4 x float> %1855, i32 2
  1843. %1859 = extractelement <4 x float> %1855, i32 3
  1844. %1860 = fmul float %1859, %1859
  1845. %1861 = fmul float %1846, %106
  1846. %1862 = fadd float %1861, %110
  1847. %1863 = fmul float %1847, %107
  1848. %1864 = fadd float %1863, %111
  1849. %1865 = fmul float %1862, %1862
  1850. %1866 = fmul float %1864, %1864
  1851. %1867 = fadd float %1866, %1865
  1852. %1868 = fadd float %1867, 1.000000e+00
  1853. %1869 = call float @fabs(float %1868)
  1854. %1870 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1869)
  1855. %1871 = call float @llvm.minnum.f32(float %1870, float 0x47EFFFFFE0000000)
  1856. %1872 = fmul float %1871, %1862
  1857. %1873 = fmul float %1871, %1864
  1858. %1874 = fmul float %1871, %1860
  1859. %1875 = fmul float %1872, %1860
  1860. %1876 = fsub float %1875, %101
  1861. %1877 = fmul float %1873, %1860
  1862. %1878 = fsub float %1877, %102
  1863. %1879 = fsub float -0.000000e+00, %103
  1864. %1880 = fsub float %1879, %1874
  1865. %1881 = fmul float %1876, %1876
  1866. %1882 = fmul float %1878, %1878
  1867. %1883 = fadd float %1882, %1881
  1868. %1884 = fmul float %1880, %1880
  1869. %1885 = fadd float %1883, %1884
  1870. %1886 = fmul float %32, %1885
  1871. %1887 = fsub float 1.000000e+00, %1886
  1872. %1888 = call float @llvm.AMDIL.clamp.(float %1887, float 0.000000e+00, float 1.000000e+00)
  1873. %1889 = call float @fabs(float %1885)
  1874. %1890 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1889)
  1875. %1891 = call float @llvm.minnum.f32(float %1890, float 0x47EFFFFFE0000000)
  1876. %1892 = fmul float %1891, %1876
  1877. %1893 = fmul float %1891, %1878
  1878. %1894 = fmul float %1891, %1880
  1879. %1895 = fmul float %1892, %1856
  1880. %1896 = fmul float %1893, %1857
  1881. %1897 = fadd float %1896, %1895
  1882. %1898 = fmul float %1894, %1858
  1883. %1899 = fadd float %1897, %1898
  1884. %1900 = fsub float %33, %1899
  1885. %1901 = call float @llvm.AMDIL.clamp.(float %1900, float 0.000000e+00, float 1.000000e+00)
  1886. %1902 = fmul float %1892, %68
  1887. %1903 = fmul float %1893, %69
  1888. %1904 = fadd float %1903, %1902
  1889. %1905 = fmul float %1894, %70
  1890. %1906 = fadd float %1904, %1905
  1891. %1907 = fadd float %1906, %34
  1892. %1908 = call float @llvm.AMDIL.clamp.(float %1907, float 0.000000e+00, float 1.000000e+00)
  1893. %1909 = fmul float %1901, %1908
  1894. %1910 = fmul float %1909, %1888
  1895. %1911 = bitcast float %1846 to i32
  1896. %1912 = bitcast float %1847 to i32
  1897. %1913 = insertelement <4 x i32> undef, i32 %1911, i32 0
  1898. %1914 = insertelement <4 x i32> %1913, i32 %1912, i32 1
  1899. %1915 = insertelement <4 x i32> %1914, i32 0, i32 2
  1900. %1916 = bitcast <8 x i32> %42 to <32 x i8>
  1901. %1917 = bitcast <4 x i32> %44 to <16 x i8>
  1902. %1918 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1915, <32 x i8> %1916, <16 x i8> %1917, i32 2)
  1903. %1919 = extractelement <4 x float> %1918, i32 0
  1904. %1920 = extractelement <4 x float> %1918, i32 1
  1905. %1921 = extractelement <4 x float> %1918, i32 2
  1906. %1922 = fmul float %1919, %1910
  1907. %1923 = fadd float %1922, %1841
  1908. %1924 = fmul float %1920, %1910
  1909. %1925 = fadd float %1924, %1843
  1910. %1926 = fmul float %1921, %1910
  1911. %1927 = fadd float %1926, %1845
  1912. %1928 = fmul float %87, 0xBFE6D0E560000000
  1913. %1929 = fadd float %1928, %1746
  1914. %1930 = fmul float %90, 0xBFE6D0E560000000
  1915. %1931 = fadd float %1930, %1747
  1916. %1932 = fmul float %87, 0xBFE6D0E560000000
  1917. %1933 = fadd float %1932, %1746
  1918. %1934 = fmul float %90, 0xBFE6D0E560000000
  1919. %1935 = fadd float %1934, %1747
  1920. %1936 = fmul float %1933, 0x3FE9810620000000
  1921. %1937 = fadd float %1936, %51
  1922. %1938 = fmul float %1935, 0x3FE9810620000000
  1923. %1939 = fadd float %1938, %52
  1924. %1940 = fmul float %1929, 0x3FD0A3D700000000
  1925. %1941 = fadd float %1940, %51
  1926. %1942 = fmul float %1931, 0x3FD0A3D700000000
  1927. %1943 = fadd float %1942, %52
  1928. %1944 = call float @llvm.AMDIL.clamp.(float %1941, float 0.000000e+00, float 1.000000e+00)
  1929. %1945 = call float @llvm.AMDIL.clamp.(float %1943, float 0.000000e+00, float 1.000000e+00)
  1930. %1946 = bitcast float %1944 to i32
  1931. %1947 = bitcast float %1945 to i32
  1932. %1948 = insertelement <4 x i32> undef, i32 %1946, i32 0
  1933. %1949 = insertelement <4 x i32> %1948, i32 %1947, i32 1
  1934. %1950 = insertelement <4 x i32> %1949, i32 0, i32 2
  1935. %1951 = bitcast <8 x i32> %38 to <32 x i8>
  1936. %1952 = bitcast <4 x i32> %40 to <16 x i8>
  1937. %1953 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %1950, <32 x i8> %1951, <16 x i8> %1952, i32 2)
  1938. %1954 = extractelement <4 x float> %1953, i32 0
  1939. %1955 = extractelement <4 x float> %1953, i32 1
  1940. %1956 = extractelement <4 x float> %1953, i32 2
  1941. %1957 = extractelement <4 x float> %1953, i32 3
  1942. %1958 = fmul float %1957, %1957
  1943. %1959 = fmul float %1944, %106
  1944. %1960 = fadd float %1959, %110
  1945. %1961 = fmul float %1945, %107
  1946. %1962 = fadd float %1961, %111
  1947. %1963 = fmul float %1960, %1960
  1948. %1964 = fmul float %1962, %1962
  1949. %1965 = fadd float %1964, %1963
  1950. %1966 = fadd float %1965, 1.000000e+00
  1951. %1967 = call float @fabs(float %1966)
  1952. %1968 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1967)
  1953. %1969 = call float @llvm.minnum.f32(float %1968, float 0x47EFFFFFE0000000)
  1954. %1970 = fmul float %1969, %1960
  1955. %1971 = fmul float %1969, %1962
  1956. %1972 = fmul float %1969, %1958
  1957. %1973 = fmul float %1970, %1958
  1958. %1974 = fsub float %1973, %101
  1959. %1975 = fmul float %1971, %1958
  1960. %1976 = fsub float %1975, %102
  1961. %1977 = fsub float -0.000000e+00, %103
  1962. %1978 = fsub float %1977, %1972
  1963. %1979 = fmul float %1974, %1974
  1964. %1980 = fmul float %1976, %1976
  1965. %1981 = fadd float %1980, %1979
  1966. %1982 = fmul float %1978, %1978
  1967. %1983 = fadd float %1981, %1982
  1968. %1984 = fmul float %32, %1983
  1969. %1985 = fsub float 1.000000e+00, %1984
  1970. %1986 = call float @llvm.AMDIL.clamp.(float %1985, float 0.000000e+00, float 1.000000e+00)
  1971. %1987 = call float @fabs(float %1983)
  1972. %1988 = call float @llvm.AMDGPU.rsq.clamped.f32(float %1987)
  1973. %1989 = call float @llvm.minnum.f32(float %1988, float 0x47EFFFFFE0000000)
  1974. %1990 = fmul float %1989, %1974
  1975. %1991 = fmul float %1989, %1976
  1976. %1992 = fmul float %1989, %1978
  1977. %1993 = fmul float %1990, %1954
  1978. %1994 = fmul float %1991, %1955
  1979. %1995 = fadd float %1994, %1993
  1980. %1996 = fmul float %1992, %1956
  1981. %1997 = fadd float %1995, %1996
  1982. %1998 = fsub float %33, %1997
  1983. %1999 = call float @llvm.AMDIL.clamp.(float %1998, float 0.000000e+00, float 1.000000e+00)
  1984. %2000 = fmul float %1990, %68
  1985. %2001 = fmul float %1991, %69
  1986. %2002 = fadd float %2001, %2000
  1987. %2003 = fmul float %1992, %70
  1988. %2004 = fadd float %2002, %2003
  1989. %2005 = fadd float %2004, %34
  1990. %2006 = call float @llvm.AMDIL.clamp.(float %2005, float 0.000000e+00, float 1.000000e+00)
  1991. %2007 = fmul float %1999, %2006
  1992. %2008 = fmul float %2007, %1986
  1993. %2009 = bitcast float %1944 to i32
  1994. %2010 = bitcast float %1945 to i32
  1995. %2011 = insertelement <4 x i32> undef, i32 %2009, i32 0
  1996. %2012 = insertelement <4 x i32> %2011, i32 %2010, i32 1
  1997. %2013 = insertelement <4 x i32> %2012, i32 0, i32 2
  1998. %2014 = bitcast <8 x i32> %42 to <32 x i8>
  1999. %2015 = bitcast <4 x i32> %44 to <16 x i8>
  2000. %2016 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2013, <32 x i8> %2014, <16 x i8> %2015, i32 2)
  2001. %2017 = extractelement <4 x float> %2016, i32 0
  2002. %2018 = extractelement <4 x float> %2016, i32 1
  2003. %2019 = extractelement <4 x float> %2016, i32 2
  2004. %2020 = fmul float %2017, %2008
  2005. %2021 = fadd float %2020, %1923
  2006. %2022 = fmul float %2018, %2008
  2007. %2023 = fadd float %2022, %1925
  2008. %2024 = fmul float %2019, %2008
  2009. %2025 = fadd float %2024, %1927
  2010. %2026 = call float @llvm.AMDIL.clamp.(float %1937, float 0.000000e+00, float 1.000000e+00)
  2011. %2027 = call float @llvm.AMDIL.clamp.(float %1939, float 0.000000e+00, float 1.000000e+00)
  2012. %2028 = bitcast float %2026 to i32
  2013. %2029 = bitcast float %2027 to i32
  2014. %2030 = insertelement <4 x i32> undef, i32 %2028, i32 0
  2015. %2031 = insertelement <4 x i32> %2030, i32 %2029, i32 1
  2016. %2032 = insertelement <4 x i32> %2031, i32 0, i32 2
  2017. %2033 = bitcast <8 x i32> %38 to <32 x i8>
  2018. %2034 = bitcast <4 x i32> %40 to <16 x i8>
  2019. %2035 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2032, <32 x i8> %2033, <16 x i8> %2034, i32 2)
  2020. %2036 = extractelement <4 x float> %2035, i32 0
  2021. %2037 = extractelement <4 x float> %2035, i32 1
  2022. %2038 = extractelement <4 x float> %2035, i32 2
  2023. %2039 = extractelement <4 x float> %2035, i32 3
  2024. %2040 = fmul float %2039, %2039
  2025. %2041 = fmul float %2026, %106
  2026. %2042 = fadd float %2041, %110
  2027. %2043 = fmul float %2027, %107
  2028. %2044 = fadd float %2043, %111
  2029. %2045 = fmul float %2042, %2042
  2030. %2046 = fmul float %2044, %2044
  2031. %2047 = fadd float %2046, %2045
  2032. %2048 = fadd float %2047, 1.000000e+00
  2033. %2049 = call float @fabs(float %2048)
  2034. %2050 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2049)
  2035. %2051 = call float @llvm.minnum.f32(float %2050, float 0x47EFFFFFE0000000)
  2036. %2052 = fmul float %2051, %2042
  2037. %2053 = fmul float %2051, %2044
  2038. %2054 = fmul float %2051, %2040
  2039. %2055 = fmul float %2052, %2040
  2040. %2056 = fsub float %2055, %101
  2041. %2057 = fmul float %2053, %2040
  2042. %2058 = fsub float %2057, %102
  2043. %2059 = fsub float -0.000000e+00, %103
  2044. %2060 = fsub float %2059, %2054
  2045. %2061 = fmul float %2056, %2056
  2046. %2062 = fmul float %2058, %2058
  2047. %2063 = fadd float %2062, %2061
  2048. %2064 = fmul float %2060, %2060
  2049. %2065 = fadd float %2063, %2064
  2050. %2066 = fmul float %32, %2065
  2051. %2067 = fsub float 1.000000e+00, %2066
  2052. %2068 = call float @llvm.AMDIL.clamp.(float %2067, float 0.000000e+00, float 1.000000e+00)
  2053. %2069 = call float @fabs(float %2065)
  2054. %2070 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2069)
  2055. %2071 = call float @llvm.minnum.f32(float %2070, float 0x47EFFFFFE0000000)
  2056. %2072 = fmul float %2071, %2056
  2057. %2073 = fmul float %2071, %2058
  2058. %2074 = fmul float %2071, %2060
  2059. %2075 = fmul float %2072, %2036
  2060. %2076 = fmul float %2073, %2037
  2061. %2077 = fadd float %2076, %2075
  2062. %2078 = fmul float %2074, %2038
  2063. %2079 = fadd float %2077, %2078
  2064. %2080 = fsub float %33, %2079
  2065. %2081 = call float @llvm.AMDIL.clamp.(float %2080, float 0.000000e+00, float 1.000000e+00)
  2066. %2082 = fmul float %2072, %68
  2067. %2083 = fmul float %2073, %69
  2068. %2084 = fadd float %2083, %2082
  2069. %2085 = fmul float %2074, %70
  2070. %2086 = fadd float %2084, %2085
  2071. %2087 = fadd float %2086, %34
  2072. %2088 = call float @llvm.AMDIL.clamp.(float %2087, float 0.000000e+00, float 1.000000e+00)
  2073. %2089 = fmul float %2081, %2088
  2074. %2090 = fmul float %2089, %2068
  2075. %2091 = bitcast float %2026 to i32
  2076. %2092 = bitcast float %2027 to i32
  2077. %2093 = insertelement <4 x i32> undef, i32 %2091, i32 0
  2078. %2094 = insertelement <4 x i32> %2093, i32 %2092, i32 1
  2079. %2095 = insertelement <4 x i32> %2094, i32 0, i32 2
  2080. %2096 = bitcast <8 x i32> %42 to <32 x i8>
  2081. %2097 = bitcast <4 x i32> %44 to <16 x i8>
  2082. %2098 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2095, <32 x i8> %2096, <16 x i8> %2097, i32 2)
  2083. %2099 = extractelement <4 x float> %2098, i32 0
  2084. %2100 = extractelement <4 x float> %2098, i32 1
  2085. %2101 = extractelement <4 x float> %2098, i32 2
  2086. %2102 = fmul float %2099, %2090
  2087. %2103 = fadd float %2102, %2021
  2088. %2104 = fmul float %2100, %2090
  2089. %2105 = fadd float %2104, %2023
  2090. %2106 = fmul float %2101, %2090
  2091. %2107 = fadd float %2106, %2025
  2092. %2108 = fmul float %88, 0x3FD6147AE0000000
  2093. %2109 = fmul float %87, 0xBFD6147AE0000000
  2094. %2110 = fmul float %88, 0xBF96872B00000000
  2095. %2111 = fsub float %2110, %87
  2096. %2112 = fmul float %87, 0x3F96872B00000000
  2097. %2113 = fsub float %2112, %90
  2098. %2114 = fmul float %88, 0xBF96872B00000000
  2099. %2115 = fsub float %2114, %87
  2100. %2116 = fmul float %87, 0x3F96872B00000000
  2101. %2117 = fsub float %2116, %90
  2102. %2118 = fmul float %2115, 0x3FE820C4A0000000
  2103. %2119 = fadd float %2118, %51
  2104. %2120 = fmul float %2117, 0x3FE820C4A0000000
  2105. %2121 = fadd float %2120, %52
  2106. %2122 = fmul float %2111, 0x3FE028F5C0000000
  2107. %2123 = fadd float %2122, %51
  2108. %2124 = fmul float %2113, 0x3FE028F5C0000000
  2109. %2125 = fadd float %2124, %52
  2110. %2126 = call float @llvm.AMDIL.clamp.(float %2123, float 0.000000e+00, float 1.000000e+00)
  2111. %2127 = call float @llvm.AMDIL.clamp.(float %2125, float 0.000000e+00, float 1.000000e+00)
  2112. %2128 = bitcast float %2126 to i32
  2113. %2129 = bitcast float %2127 to i32
  2114. %2130 = insertelement <4 x i32> undef, i32 %2128, i32 0
  2115. %2131 = insertelement <4 x i32> %2130, i32 %2129, i32 1
  2116. %2132 = insertelement <4 x i32> %2131, i32 0, i32 2
  2117. %2133 = bitcast <8 x i32> %38 to <32 x i8>
  2118. %2134 = bitcast <4 x i32> %40 to <16 x i8>
  2119. %2135 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2132, <32 x i8> %2133, <16 x i8> %2134, i32 2)
  2120. %2136 = extractelement <4 x float> %2135, i32 0
  2121. %2137 = extractelement <4 x float> %2135, i32 1
  2122. %2138 = extractelement <4 x float> %2135, i32 2
  2123. %2139 = extractelement <4 x float> %2135, i32 3
  2124. %2140 = fmul float %2139, %2139
  2125. %2141 = fmul float %2126, %106
  2126. %2142 = fadd float %2141, %110
  2127. %2143 = fmul float %2127, %107
  2128. %2144 = fadd float %2143, %111
  2129. %2145 = fmul float %2142, %2142
  2130. %2146 = fmul float %2144, %2144
  2131. %2147 = fadd float %2146, %2145
  2132. %2148 = fadd float %2147, 1.000000e+00
  2133. %2149 = call float @fabs(float %2148)
  2134. %2150 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2149)
  2135. %2151 = call float @llvm.minnum.f32(float %2150, float 0x47EFFFFFE0000000)
  2136. %2152 = fmul float %2151, %2142
  2137. %2153 = fmul float %2151, %2144
  2138. %2154 = fmul float %2151, %2140
  2139. %2155 = fmul float %2152, %2140
  2140. %2156 = fsub float %2155, %101
  2141. %2157 = fmul float %2153, %2140
  2142. %2158 = fsub float %2157, %102
  2143. %2159 = fsub float -0.000000e+00, %103
  2144. %2160 = fsub float %2159, %2154
  2145. %2161 = fmul float %2156, %2156
  2146. %2162 = fmul float %2158, %2158
  2147. %2163 = fadd float %2162, %2161
  2148. %2164 = fmul float %2160, %2160
  2149. %2165 = fadd float %2163, %2164
  2150. %2166 = fmul float %32, %2165
  2151. %2167 = fsub float 1.000000e+00, %2166
  2152. %2168 = call float @llvm.AMDIL.clamp.(float %2167, float 0.000000e+00, float 1.000000e+00)
  2153. %2169 = call float @fabs(float %2165)
  2154. %2170 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2169)
  2155. %2171 = call float @llvm.minnum.f32(float %2170, float 0x47EFFFFFE0000000)
  2156. %2172 = fmul float %2171, %2156
  2157. %2173 = fmul float %2171, %2158
  2158. %2174 = fmul float %2171, %2160
  2159. %2175 = fmul float %2172, %2136
  2160. %2176 = fmul float %2173, %2137
  2161. %2177 = fadd float %2176, %2175
  2162. %2178 = fmul float %2174, %2138
  2163. %2179 = fadd float %2177, %2178
  2164. %2180 = fsub float %33, %2179
  2165. %2181 = call float @llvm.AMDIL.clamp.(float %2180, float 0.000000e+00, float 1.000000e+00)
  2166. %2182 = fmul float %2172, %68
  2167. %2183 = fmul float %2173, %69
  2168. %2184 = fadd float %2183, %2182
  2169. %2185 = fmul float %2174, %70
  2170. %2186 = fadd float %2184, %2185
  2171. %2187 = fadd float %2186, %34
  2172. %2188 = call float @llvm.AMDIL.clamp.(float %2187, float 0.000000e+00, float 1.000000e+00)
  2173. %2189 = fmul float %2181, %2188
  2174. %2190 = fmul float %2189, %2168
  2175. %2191 = bitcast float %2126 to i32
  2176. %2192 = bitcast float %2127 to i32
  2177. %2193 = insertelement <4 x i32> undef, i32 %2191, i32 0
  2178. %2194 = insertelement <4 x i32> %2193, i32 %2192, i32 1
  2179. %2195 = insertelement <4 x i32> %2194, i32 0, i32 2
  2180. %2196 = bitcast <8 x i32> %42 to <32 x i8>
  2181. %2197 = bitcast <4 x i32> %44 to <16 x i8>
  2182. %2198 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2195, <32 x i8> %2196, <16 x i8> %2197, i32 2)
  2183. %2199 = extractelement <4 x float> %2198, i32 0
  2184. %2200 = extractelement <4 x float> %2198, i32 1
  2185. %2201 = extractelement <4 x float> %2198, i32 2
  2186. %2202 = fmul float %2199, %2190
  2187. %2203 = fadd float %2202, %2103
  2188. %2204 = fmul float %2200, %2190
  2189. %2205 = fadd float %2204, %2105
  2190. %2206 = fmul float %2201, %2190
  2191. %2207 = fadd float %2206, %2107
  2192. %2208 = call float @llvm.AMDIL.clamp.(float %2119, float 0.000000e+00, float 1.000000e+00)
  2193. %2209 = call float @llvm.AMDIL.clamp.(float %2121, float 0.000000e+00, float 1.000000e+00)
  2194. %2210 = bitcast float %2208 to i32
  2195. %2211 = bitcast float %2209 to i32
  2196. %2212 = insertelement <4 x i32> undef, i32 %2210, i32 0
  2197. %2213 = insertelement <4 x i32> %2212, i32 %2211, i32 1
  2198. %2214 = insertelement <4 x i32> %2213, i32 0, i32 2
  2199. %2215 = bitcast <8 x i32> %38 to <32 x i8>
  2200. %2216 = bitcast <4 x i32> %40 to <16 x i8>
  2201. %2217 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2214, <32 x i8> %2215, <16 x i8> %2216, i32 2)
  2202. %2218 = extractelement <4 x float> %2217, i32 0
  2203. %2219 = extractelement <4 x float> %2217, i32 1
  2204. %2220 = extractelement <4 x float> %2217, i32 2
  2205. %2221 = extractelement <4 x float> %2217, i32 3
  2206. %2222 = fmul float %2221, %2221
  2207. %2223 = fmul float %2208, %106
  2208. %2224 = fadd float %2223, %110
  2209. %2225 = fmul float %2209, %107
  2210. %2226 = fadd float %2225, %111
  2211. %2227 = fmul float %2224, %2224
  2212. %2228 = fmul float %2226, %2226
  2213. %2229 = fadd float %2228, %2227
  2214. %2230 = fadd float %2229, 1.000000e+00
  2215. %2231 = call float @fabs(float %2230)
  2216. %2232 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2231)
  2217. %2233 = call float @llvm.minnum.f32(float %2232, float 0x47EFFFFFE0000000)
  2218. %2234 = fmul float %2233, %2224
  2219. %2235 = fmul float %2233, %2226
  2220. %2236 = fmul float %2233, %2222
  2221. %2237 = fmul float %2234, %2222
  2222. %2238 = fsub float %2237, %101
  2223. %2239 = fmul float %2235, %2222
  2224. %2240 = fsub float %2239, %102
  2225. %2241 = fsub float -0.000000e+00, %103
  2226. %2242 = fsub float %2241, %2236
  2227. %2243 = fmul float %2238, %2238
  2228. %2244 = fmul float %2240, %2240
  2229. %2245 = fadd float %2244, %2243
  2230. %2246 = fmul float %2242, %2242
  2231. %2247 = fadd float %2245, %2246
  2232. %2248 = fmul float %32, %2247
  2233. %2249 = fsub float 1.000000e+00, %2248
  2234. %2250 = call float @llvm.AMDIL.clamp.(float %2249, float 0.000000e+00, float 1.000000e+00)
  2235. %2251 = call float @fabs(float %2247)
  2236. %2252 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2251)
  2237. %2253 = call float @llvm.minnum.f32(float %2252, float 0x47EFFFFFE0000000)
  2238. %2254 = fmul float %2253, %2238
  2239. %2255 = fmul float %2253, %2240
  2240. %2256 = fmul float %2253, %2242
  2241. %2257 = fmul float %2254, %2218
  2242. %2258 = fmul float %2255, %2219
  2243. %2259 = fadd float %2258, %2257
  2244. %2260 = fmul float %2256, %2220
  2245. %2261 = fadd float %2259, %2260
  2246. %2262 = fsub float %33, %2261
  2247. %2263 = call float @llvm.AMDIL.clamp.(float %2262, float 0.000000e+00, float 1.000000e+00)
  2248. %2264 = fmul float %2254, %68
  2249. %2265 = fmul float %2255, %69
  2250. %2266 = fadd float %2265, %2264
  2251. %2267 = fmul float %2256, %70
  2252. %2268 = fadd float %2266, %2267
  2253. %2269 = fadd float %2268, %34
  2254. %2270 = call float @llvm.AMDIL.clamp.(float %2269, float 0.000000e+00, float 1.000000e+00)
  2255. %2271 = fmul float %2263, %2270
  2256. %2272 = fmul float %2271, %2250
  2257. %2273 = bitcast float %2208 to i32
  2258. %2274 = bitcast float %2209 to i32
  2259. %2275 = insertelement <4 x i32> undef, i32 %2273, i32 0
  2260. %2276 = insertelement <4 x i32> %2275, i32 %2274, i32 1
  2261. %2277 = insertelement <4 x i32> %2276, i32 0, i32 2
  2262. %2278 = bitcast <8 x i32> %42 to <32 x i8>
  2263. %2279 = bitcast <4 x i32> %44 to <16 x i8>
  2264. %2280 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2277, <32 x i8> %2278, <16 x i8> %2279, i32 2)
  2265. %2281 = extractelement <4 x float> %2280, i32 0
  2266. %2282 = extractelement <4 x float> %2280, i32 1
  2267. %2283 = extractelement <4 x float> %2280, i32 2
  2268. %2284 = fmul float %2281, %2272
  2269. %2285 = fadd float %2284, %2203
  2270. %2286 = fmul float %2282, %2272
  2271. %2287 = fadd float %2286, %2205
  2272. %2288 = fmul float %2283, %2272
  2273. %2289 = fadd float %2288, %2207
  2274. %2290 = fmul float %87, 0xBFEE0C49C0000000
  2275. %2291 = fadd float %2290, %2108
  2276. %2292 = fmul float %90, 0xBFEE0C49C0000000
  2277. %2293 = fadd float %2292, %2109
  2278. %2294 = fmul float %87, 0xBFEE0C49C0000000
  2279. %2295 = fadd float %2294, %2108
  2280. %2296 = fmul float %90, 0xBFEE0C49C0000000
  2281. %2297 = fadd float %2296, %2109
  2282. %2298 = fmul float %2295, 0x3FEC624DE0000000
  2283. %2299 = fadd float %2298, %51
  2284. %2300 = fmul float %2297, 0x3FEC624DE0000000
  2285. %2301 = fadd float %2300, %52
  2286. %2302 = fmul float %2291, 0x3FDC189380000000
  2287. %2303 = fadd float %2302, %51
  2288. %2304 = fmul float %2293, 0x3FDC189380000000
  2289. %2305 = fadd float %2304, %52
  2290. %2306 = call float @llvm.AMDIL.clamp.(float %2303, float 0.000000e+00, float 1.000000e+00)
  2291. %2307 = call float @llvm.AMDIL.clamp.(float %2305, float 0.000000e+00, float 1.000000e+00)
  2292. %2308 = bitcast float %2306 to i32
  2293. %2309 = bitcast float %2307 to i32
  2294. %2310 = insertelement <4 x i32> undef, i32 %2308, i32 0
  2295. %2311 = insertelement <4 x i32> %2310, i32 %2309, i32 1
  2296. %2312 = insertelement <4 x i32> %2311, i32 0, i32 2
  2297. %2313 = bitcast <8 x i32> %38 to <32 x i8>
  2298. %2314 = bitcast <4 x i32> %40 to <16 x i8>
  2299. %2315 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2312, <32 x i8> %2313, <16 x i8> %2314, i32 2)
  2300. %2316 = extractelement <4 x float> %2315, i32 0
  2301. %2317 = extractelement <4 x float> %2315, i32 1
  2302. %2318 = extractelement <4 x float> %2315, i32 2
  2303. %2319 = extractelement <4 x float> %2315, i32 3
  2304. %2320 = fmul float %2319, %2319
  2305. %2321 = fmul float %2306, %106
  2306. %2322 = fadd float %2321, %110
  2307. %2323 = fmul float %2307, %107
  2308. %2324 = fadd float %2323, %111
  2309. %2325 = fmul float %2322, %2322
  2310. %2326 = fmul float %2324, %2324
  2311. %2327 = fadd float %2326, %2325
  2312. %2328 = fadd float %2327, 1.000000e+00
  2313. %2329 = call float @fabs(float %2328)
  2314. %2330 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2329)
  2315. %2331 = call float @llvm.minnum.f32(float %2330, float 0x47EFFFFFE0000000)
  2316. %2332 = fmul float %2331, %2322
  2317. %2333 = fmul float %2331, %2324
  2318. %2334 = fmul float %2331, %2320
  2319. %2335 = fmul float %2332, %2320
  2320. %2336 = fsub float %2335, %101
  2321. %2337 = fmul float %2333, %2320
  2322. %2338 = fsub float %2337, %102
  2323. %2339 = fsub float -0.000000e+00, %103
  2324. %2340 = fsub float %2339, %2334
  2325. %2341 = fmul float %2336, %2336
  2326. %2342 = fmul float %2338, %2338
  2327. %2343 = fadd float %2342, %2341
  2328. %2344 = fmul float %2340, %2340
  2329. %2345 = fadd float %2343, %2344
  2330. %2346 = fmul float %32, %2345
  2331. %2347 = fsub float 1.000000e+00, %2346
  2332. %2348 = call float @llvm.AMDIL.clamp.(float %2347, float 0.000000e+00, float 1.000000e+00)
  2333. %2349 = call float @fabs(float %2345)
  2334. %2350 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2349)
  2335. %2351 = call float @llvm.minnum.f32(float %2350, float 0x47EFFFFFE0000000)
  2336. %2352 = fmul float %2351, %2336
  2337. %2353 = fmul float %2351, %2338
  2338. %2354 = fmul float %2351, %2340
  2339. %2355 = fmul float %2352, %2316
  2340. %2356 = fmul float %2353, %2317
  2341. %2357 = fadd float %2356, %2355
  2342. %2358 = fmul float %2354, %2318
  2343. %2359 = fadd float %2357, %2358
  2344. %2360 = fsub float %33, %2359
  2345. %2361 = call float @llvm.AMDIL.clamp.(float %2360, float 0.000000e+00, float 1.000000e+00)
  2346. %2362 = fmul float %2352, %68
  2347. %2363 = fmul float %2353, %69
  2348. %2364 = fadd float %2363, %2362
  2349. %2365 = fmul float %2354, %70
  2350. %2366 = fadd float %2364, %2365
  2351. %2367 = fadd float %2366, %34
  2352. %2368 = call float @llvm.AMDIL.clamp.(float %2367, float 0.000000e+00, float 1.000000e+00)
  2353. %2369 = fmul float %2361, %2368
  2354. %2370 = fmul float %2369, %2348
  2355. %2371 = bitcast float %2306 to i32
  2356. %2372 = bitcast float %2307 to i32
  2357. %2373 = insertelement <4 x i32> undef, i32 %2371, i32 0
  2358. %2374 = insertelement <4 x i32> %2373, i32 %2372, i32 1
  2359. %2375 = insertelement <4 x i32> %2374, i32 0, i32 2
  2360. %2376 = bitcast <8 x i32> %42 to <32 x i8>
  2361. %2377 = bitcast <4 x i32> %44 to <16 x i8>
  2362. %2378 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2375, <32 x i8> %2376, <16 x i8> %2377, i32 2)
  2363. %2379 = extractelement <4 x float> %2378, i32 0
  2364. %2380 = extractelement <4 x float> %2378, i32 1
  2365. %2381 = extractelement <4 x float> %2378, i32 2
  2366. %2382 = fmul float %2379, %2370
  2367. %2383 = fadd float %2382, %2285
  2368. %2384 = fmul float %2380, %2370
  2369. %2385 = fadd float %2384, %2287
  2370. %2386 = fmul float %2381, %2370
  2371. %2387 = fadd float %2386, %2289
  2372. %2388 = call float @llvm.AMDIL.clamp.(float %2299, float 0.000000e+00, float 1.000000e+00)
  2373. %2389 = call float @llvm.AMDIL.clamp.(float %2301, float 0.000000e+00, float 1.000000e+00)
  2374. %2390 = bitcast float %2388 to i32
  2375. %2391 = bitcast float %2389 to i32
  2376. %2392 = insertelement <4 x i32> undef, i32 %2390, i32 0
  2377. %2393 = insertelement <4 x i32> %2392, i32 %2391, i32 1
  2378. %2394 = insertelement <4 x i32> %2393, i32 0, i32 2
  2379. %2395 = bitcast <8 x i32> %38 to <32 x i8>
  2380. %2396 = bitcast <4 x i32> %40 to <16 x i8>
  2381. %2397 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2394, <32 x i8> %2395, <16 x i8> %2396, i32 2)
  2382. %2398 = extractelement <4 x float> %2397, i32 0
  2383. %2399 = extractelement <4 x float> %2397, i32 1
  2384. %2400 = extractelement <4 x float> %2397, i32 2
  2385. %2401 = extractelement <4 x float> %2397, i32 3
  2386. %2402 = fmul float %2401, %2401
  2387. %2403 = fmul float %2388, %106
  2388. %2404 = fadd float %2403, %110
  2389. %2405 = fmul float %2389, %107
  2390. %2406 = fadd float %2405, %111
  2391. %2407 = fmul float %2404, %2404
  2392. %2408 = fmul float %2406, %2406
  2393. %2409 = fadd float %2408, %2407
  2394. %2410 = fadd float %2409, 1.000000e+00
  2395. %2411 = call float @fabs(float %2410)
  2396. %2412 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2411)
  2397. %2413 = call float @llvm.minnum.f32(float %2412, float 0x47EFFFFFE0000000)
  2398. %2414 = fmul float %2413, %2404
  2399. %2415 = fmul float %2413, %2406
  2400. %2416 = fmul float %2413, %2402
  2401. %2417 = fmul float %2414, %2402
  2402. %2418 = fsub float %2417, %101
  2403. %2419 = fmul float %2415, %2402
  2404. %2420 = fsub float %2419, %102
  2405. %2421 = fsub float -0.000000e+00, %103
  2406. %2422 = fsub float %2421, %2416
  2407. %2423 = fmul float %2418, %2418
  2408. %2424 = fmul float %2420, %2420
  2409. %2425 = fadd float %2424, %2423
  2410. %2426 = fmul float %2422, %2422
  2411. %2427 = fadd float %2425, %2426
  2412. %2428 = fmul float %32, %2427
  2413. %2429 = fsub float 1.000000e+00, %2428
  2414. %2430 = call float @llvm.AMDIL.clamp.(float %2429, float 0.000000e+00, float 1.000000e+00)
  2415. %2431 = call float @fabs(float %2427)
  2416. %2432 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2431)
  2417. %2433 = call float @llvm.minnum.f32(float %2432, float 0x47EFFFFFE0000000)
  2418. %2434 = fmul float %2433, %2418
  2419. %2435 = fmul float %2433, %2420
  2420. %2436 = fmul float %2433, %2422
  2421. %2437 = fmul float %2434, %2398
  2422. %2438 = fmul float %2435, %2399
  2423. %2439 = fadd float %2438, %2437
  2424. %2440 = fmul float %2436, %2400
  2425. %2441 = fadd float %2439, %2440
  2426. %2442 = fsub float %33, %2441
  2427. %2443 = call float @llvm.AMDIL.clamp.(float %2442, float 0.000000e+00, float 1.000000e+00)
  2428. %2444 = fmul float %2434, %68
  2429. %2445 = fmul float %2435, %69
  2430. %2446 = fadd float %2445, %2444
  2431. %2447 = fmul float %2436, %70
  2432. %2448 = fadd float %2446, %2447
  2433. %2449 = fadd float %2448, %34
  2434. %2450 = call float @llvm.AMDIL.clamp.(float %2449, float 0.000000e+00, float 1.000000e+00)
  2435. %2451 = fmul float %2443, %2450
  2436. %2452 = fmul float %2451, %2430
  2437. %2453 = bitcast float %2388 to i32
  2438. %2454 = bitcast float %2389 to i32
  2439. %2455 = insertelement <4 x i32> undef, i32 %2453, i32 0
  2440. %2456 = insertelement <4 x i32> %2455, i32 %2454, i32 1
  2441. %2457 = insertelement <4 x i32> %2456, i32 0, i32 2
  2442. %2458 = bitcast <8 x i32> %42 to <32 x i8>
  2443. %2459 = bitcast <4 x i32> %44 to <16 x i8>
  2444. %2460 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2457, <32 x i8> %2458, <16 x i8> %2459, i32 2)
  2445. %2461 = extractelement <4 x float> %2460, i32 0
  2446. %2462 = extractelement <4 x float> %2460, i32 1
  2447. %2463 = extractelement <4 x float> %2460, i32 2
  2448. %2464 = fmul float %2461, %2452
  2449. %2465 = fadd float %2464, %2383
  2450. %2466 = fmul float %2462, %2452
  2451. %2467 = fadd float %2466, %2385
  2452. %2468 = fmul float %2463, %2452
  2453. %2469 = fadd float %2468, %2387
  2454. %2470 = fmul float %88, 0x3FE05A1CA0000000
  2455. %2471 = fmul float %87, 0xBFE05A1CA0000000
  2456. %2472 = fmul float %88, 0x3FEBE76C80000000
  2457. %2473 = fmul float %87, 0xBFEBE76C80000000
  2458. %2474 = fmul float %87, 0xBFEB851EC0000000
  2459. %2475 = fadd float %2474, %2470
  2460. %2476 = fmul float %90, 0xBFEB851EC0000000
  2461. %2477 = fadd float %2476, %2471
  2462. %2478 = fmul float %87, 0xBFEB851EC0000000
  2463. %2479 = fadd float %2478, %2470
  2464. %2480 = fmul float %90, 0xBFEB851EC0000000
  2465. %2481 = fadd float %2480, %2471
  2466. %2482 = fmul float %2479, 0x3FE2872B00000000
  2467. %2483 = fadd float %2482, %51
  2468. %2484 = fmul float %2481, 0x3FE2872B00000000
  2469. %2485 = fadd float %2484, %52
  2470. %2486 = fmul float %2475, 0x3FD353F7C0000000
  2471. %2487 = fadd float %2486, %51
  2472. %2488 = fmul float %2477, 0x3FD353F7C0000000
  2473. %2489 = fadd float %2488, %52
  2474. %2490 = call float @llvm.AMDIL.clamp.(float %2487, float 0.000000e+00, float 1.000000e+00)
  2475. %2491 = call float @llvm.AMDIL.clamp.(float %2489, float 0.000000e+00, float 1.000000e+00)
  2476. %2492 = bitcast float %2490 to i32
  2477. %2493 = bitcast float %2491 to i32
  2478. %2494 = insertelement <4 x i32> undef, i32 %2492, i32 0
  2479. %2495 = insertelement <4 x i32> %2494, i32 %2493, i32 1
  2480. %2496 = insertelement <4 x i32> %2495, i32 0, i32 2
  2481. %2497 = bitcast <8 x i32> %38 to <32 x i8>
  2482. %2498 = bitcast <4 x i32> %40 to <16 x i8>
  2483. %2499 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2496, <32 x i8> %2497, <16 x i8> %2498, i32 2)
  2484. %2500 = extractelement <4 x float> %2499, i32 0
  2485. %2501 = extractelement <4 x float> %2499, i32 1
  2486. %2502 = extractelement <4 x float> %2499, i32 2
  2487. %2503 = extractelement <4 x float> %2499, i32 3
  2488. %2504 = fmul float %2503, %2503
  2489. %2505 = fmul float %2490, %106
  2490. %2506 = fadd float %2505, %110
  2491. %2507 = fmul float %2491, %107
  2492. %2508 = fadd float %2507, %111
  2493. %2509 = fmul float %2506, %2506
  2494. %2510 = fmul float %2508, %2508
  2495. %2511 = fadd float %2510, %2509
  2496. %2512 = fadd float %2511, 1.000000e+00
  2497. %2513 = call float @fabs(float %2512)
  2498. %2514 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2513)
  2499. %2515 = call float @llvm.minnum.f32(float %2514, float 0x47EFFFFFE0000000)
  2500. %2516 = fmul float %2515, %2506
  2501. %2517 = fmul float %2515, %2508
  2502. %2518 = fmul float %2515, %2504
  2503. %2519 = fmul float %2516, %2504
  2504. %2520 = fsub float %2519, %101
  2505. %2521 = fmul float %2517, %2504
  2506. %2522 = fsub float %2521, %102
  2507. %2523 = fsub float -0.000000e+00, %103
  2508. %2524 = fsub float %2523, %2518
  2509. %2525 = fmul float %2520, %2520
  2510. %2526 = fmul float %2522, %2522
  2511. %2527 = fadd float %2526, %2525
  2512. %2528 = fmul float %2524, %2524
  2513. %2529 = fadd float %2527, %2528
  2514. %2530 = fmul float %32, %2529
  2515. %2531 = fsub float 1.000000e+00, %2530
  2516. %2532 = call float @llvm.AMDIL.clamp.(float %2531, float 0.000000e+00, float 1.000000e+00)
  2517. %2533 = call float @fabs(float %2529)
  2518. %2534 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2533)
  2519. %2535 = call float @llvm.minnum.f32(float %2534, float 0x47EFFFFFE0000000)
  2520. %2536 = fmul float %2535, %2520
  2521. %2537 = fmul float %2535, %2522
  2522. %2538 = fmul float %2535, %2524
  2523. %2539 = fmul float %2536, %2500
  2524. %2540 = fmul float %2537, %2501
  2525. %2541 = fadd float %2540, %2539
  2526. %2542 = fmul float %2538, %2502
  2527. %2543 = fadd float %2541, %2542
  2528. %2544 = fsub float %33, %2543
  2529. %2545 = call float @llvm.AMDIL.clamp.(float %2544, float 0.000000e+00, float 1.000000e+00)
  2530. %2546 = fmul float %2536, %68
  2531. %2547 = fmul float %2537, %69
  2532. %2548 = fadd float %2547, %2546
  2533. %2549 = fmul float %2538, %70
  2534. %2550 = fadd float %2548, %2549
  2535. %2551 = fadd float %2550, %34
  2536. %2552 = call float @llvm.AMDIL.clamp.(float %2551, float 0.000000e+00, float 1.000000e+00)
  2537. %2553 = fmul float %2545, %2552
  2538. %2554 = fmul float %2553, %2532
  2539. %2555 = bitcast float %2490 to i32
  2540. %2556 = bitcast float %2491 to i32
  2541. %2557 = insertelement <4 x i32> undef, i32 %2555, i32 0
  2542. %2558 = insertelement <4 x i32> %2557, i32 %2556, i32 1
  2543. %2559 = insertelement <4 x i32> %2558, i32 0, i32 2
  2544. %2560 = bitcast <8 x i32> %42 to <32 x i8>
  2545. %2561 = bitcast <4 x i32> %44 to <16 x i8>
  2546. %2562 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2559, <32 x i8> %2560, <16 x i8> %2561, i32 2)
  2547. %2563 = extractelement <4 x float> %2562, i32 0
  2548. %2564 = extractelement <4 x float> %2562, i32 1
  2549. %2565 = extractelement <4 x float> %2562, i32 2
  2550. %2566 = fmul float %2563, %2554
  2551. %2567 = fadd float %2566, %2465
  2552. %2568 = fmul float %2564, %2554
  2553. %2569 = fadd float %2568, %2467
  2554. %2570 = fmul float %2565, %2554
  2555. %2571 = fadd float %2570, %2469
  2556. %2572 = call float @llvm.AMDIL.clamp.(float %2483, float 0.000000e+00, float 1.000000e+00)
  2557. %2573 = call float @llvm.AMDIL.clamp.(float %2485, float 0.000000e+00, float 1.000000e+00)
  2558. %2574 = bitcast float %2572 to i32
  2559. %2575 = bitcast float %2573 to i32
  2560. %2576 = insertelement <4 x i32> undef, i32 %2574, i32 0
  2561. %2577 = insertelement <4 x i32> %2576, i32 %2575, i32 1
  2562. %2578 = insertelement <4 x i32> %2577, i32 0, i32 2
  2563. %2579 = bitcast <8 x i32> %38 to <32 x i8>
  2564. %2580 = bitcast <4 x i32> %40 to <16 x i8>
  2565. %2581 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2578, <32 x i8> %2579, <16 x i8> %2580, i32 2)
  2566. %2582 = extractelement <4 x float> %2581, i32 0
  2567. %2583 = extractelement <4 x float> %2581, i32 1
  2568. %2584 = extractelement <4 x float> %2581, i32 2
  2569. %2585 = extractelement <4 x float> %2581, i32 3
  2570. %2586 = fmul float %2585, %2585
  2571. %2587 = fmul float %2572, %106
  2572. %2588 = fadd float %2587, %110
  2573. %2589 = fmul float %2573, %107
  2574. %2590 = fadd float %2589, %111
  2575. %2591 = fmul float %2588, %2588
  2576. %2592 = fmul float %2590, %2590
  2577. %2593 = fadd float %2592, %2591
  2578. %2594 = fadd float %2593, 1.000000e+00
  2579. %2595 = call float @fabs(float %2594)
  2580. %2596 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2595)
  2581. %2597 = call float @llvm.minnum.f32(float %2596, float 0x47EFFFFFE0000000)
  2582. %2598 = fmul float %2597, %2588
  2583. %2599 = fmul float %2597, %2590
  2584. %2600 = fmul float %2597, %2586
  2585. %2601 = fmul float %2598, %2586
  2586. %2602 = fsub float %2601, %101
  2587. %2603 = fmul float %2599, %2586
  2588. %2604 = fsub float %2603, %102
  2589. %2605 = fsub float -0.000000e+00, %103
  2590. %2606 = fsub float %2605, %2600
  2591. %2607 = fmul float %2602, %2602
  2592. %2608 = fmul float %2604, %2604
  2593. %2609 = fadd float %2608, %2607
  2594. %2610 = fmul float %2606, %2606
  2595. %2611 = fadd float %2609, %2610
  2596. %2612 = fmul float %32, %2611
  2597. %2613 = fsub float 1.000000e+00, %2612
  2598. %2614 = call float @llvm.AMDIL.clamp.(float %2613, float 0.000000e+00, float 1.000000e+00)
  2599. %2615 = call float @fabs(float %2611)
  2600. %2616 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2615)
  2601. %2617 = call float @llvm.minnum.f32(float %2616, float 0x47EFFFFFE0000000)
  2602. %2618 = fmul float %2617, %2602
  2603. %2619 = fmul float %2617, %2604
  2604. %2620 = fmul float %2617, %2606
  2605. %2621 = fmul float %2618, %2582
  2606. %2622 = fmul float %2619, %2583
  2607. %2623 = fadd float %2622, %2621
  2608. %2624 = fmul float %2620, %2584
  2609. %2625 = fadd float %2623, %2624
  2610. %2626 = fsub float %33, %2625
  2611. %2627 = call float @llvm.AMDIL.clamp.(float %2626, float 0.000000e+00, float 1.000000e+00)
  2612. %2628 = fmul float %2618, %68
  2613. %2629 = fmul float %2619, %69
  2614. %2630 = fadd float %2629, %2628
  2615. %2631 = fmul float %2620, %70
  2616. %2632 = fadd float %2630, %2631
  2617. %2633 = fadd float %2632, %34
  2618. %2634 = call float @llvm.AMDIL.clamp.(float %2633, float 0.000000e+00, float 1.000000e+00)
  2619. %2635 = fmul float %2627, %2634
  2620. %2636 = fmul float %2635, %2614
  2621. %2637 = bitcast float %2572 to i32
  2622. %2638 = bitcast float %2573 to i32
  2623. %2639 = insertelement <4 x i32> undef, i32 %2637, i32 0
  2624. %2640 = insertelement <4 x i32> %2639, i32 %2638, i32 1
  2625. %2641 = insertelement <4 x i32> %2640, i32 0, i32 2
  2626. %2642 = bitcast <8 x i32> %42 to <32 x i8>
  2627. %2643 = bitcast <4 x i32> %44 to <16 x i8>
  2628. %2644 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2641, <32 x i8> %2642, <16 x i8> %2643, i32 2)
  2629. %2645 = extractelement <4 x float> %2644, i32 0
  2630. %2646 = extractelement <4 x float> %2644, i32 1
  2631. %2647 = extractelement <4 x float> %2644, i32 2
  2632. %2648 = fmul float %2645, %2636
  2633. %2649 = fadd float %2648, %2567
  2634. %2650 = fmul float %2646, %2636
  2635. %2651 = fadd float %2650, %2569
  2636. %2652 = fmul float %2647, %2636
  2637. %2653 = fadd float %2652, %2571
  2638. %2654 = fmul float %87, 0xBFDF4BC6A0000000
  2639. %2655 = fadd float %2654, %2472
  2640. %2656 = fmul float %90, 0xBFDF4BC6A0000000
  2641. %2657 = fadd float %2656, %2473
  2642. %2658 = fmul float %87, 0xBFDF4BC6A0000000
  2643. %2659 = fadd float %2658, %2472
  2644. %2660 = fmul float %90, 0xBFDF4BC6A0000000
  2645. %2661 = fadd float %2660, %2473
  2646. %2662 = fmul float %2659, 0x3FEE0C49C0000000
  2647. %2663 = fadd float %2662, %51
  2648. %2664 = fmul float %2661, 0x3FEE0C49C0000000
  2649. %2665 = fadd float %2664, %52
  2650. %2666 = fmul float %2655, 0x3FD9168720000000
  2651. %2667 = fadd float %2666, %51
  2652. %2668 = fmul float %2657, 0x3FD9168720000000
  2653. %2669 = fadd float %2668, %52
  2654. %2670 = call float @llvm.AMDIL.clamp.(float %2667, float 0.000000e+00, float 1.000000e+00)
  2655. %2671 = call float @llvm.AMDIL.clamp.(float %2669, float 0.000000e+00, float 1.000000e+00)
  2656. %2672 = bitcast float %2670 to i32
  2657. %2673 = bitcast float %2671 to i32
  2658. %2674 = insertelement <4 x i32> undef, i32 %2672, i32 0
  2659. %2675 = insertelement <4 x i32> %2674, i32 %2673, i32 1
  2660. %2676 = insertelement <4 x i32> %2675, i32 0, i32 2
  2661. %2677 = bitcast <8 x i32> %38 to <32 x i8>
  2662. %2678 = bitcast <4 x i32> %40 to <16 x i8>
  2663. %2679 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2676, <32 x i8> %2677, <16 x i8> %2678, i32 2)
  2664. %2680 = extractelement <4 x float> %2679, i32 0
  2665. %2681 = extractelement <4 x float> %2679, i32 1
  2666. %2682 = extractelement <4 x float> %2679, i32 2
  2667. %2683 = extractelement <4 x float> %2679, i32 3
  2668. %2684 = fmul float %2683, %2683
  2669. %2685 = fmul float %2670, %106
  2670. %2686 = fadd float %2685, %110
  2671. %2687 = fmul float %2671, %107
  2672. %2688 = fadd float %2687, %111
  2673. %2689 = fmul float %2686, %2686
  2674. %2690 = fmul float %2688, %2688
  2675. %2691 = fadd float %2690, %2689
  2676. %2692 = fadd float %2691, 1.000000e+00
  2677. %2693 = call float @fabs(float %2692)
  2678. %2694 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2693)
  2679. %2695 = call float @llvm.minnum.f32(float %2694, float 0x47EFFFFFE0000000)
  2680. %2696 = fmul float %2695, %2686
  2681. %2697 = fmul float %2695, %2688
  2682. %2698 = fmul float %2695, %2684
  2683. %2699 = fmul float %2696, %2684
  2684. %2700 = fsub float %2699, %101
  2685. %2701 = fmul float %2697, %2684
  2686. %2702 = fsub float %2701, %102
  2687. %2703 = fsub float -0.000000e+00, %103
  2688. %2704 = fsub float %2703, %2698
  2689. %2705 = fmul float %2700, %2700
  2690. %2706 = fmul float %2702, %2702
  2691. %2707 = fadd float %2706, %2705
  2692. %2708 = fmul float %2704, %2704
  2693. %2709 = fadd float %2707, %2708
  2694. %2710 = fmul float %32, %2709
  2695. %2711 = fsub float 1.000000e+00, %2710
  2696. %2712 = call float @llvm.AMDIL.clamp.(float %2711, float 0.000000e+00, float 1.000000e+00)
  2697. %2713 = call float @fabs(float %2709)
  2698. %2714 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2713)
  2699. %2715 = call float @llvm.minnum.f32(float %2714, float 0x47EFFFFFE0000000)
  2700. %2716 = fmul float %2715, %2700
  2701. %2717 = fmul float %2715, %2702
  2702. %2718 = fmul float %2715, %2704
  2703. %2719 = fmul float %2716, %2680
  2704. %2720 = fmul float %2717, %2681
  2705. %2721 = fadd float %2720, %2719
  2706. %2722 = fmul float %2718, %2682
  2707. %2723 = fadd float %2721, %2722
  2708. %2724 = fsub float %33, %2723
  2709. %2725 = call float @llvm.AMDIL.clamp.(float %2724, float 0.000000e+00, float 1.000000e+00)
  2710. %2726 = fmul float %2716, %68
  2711. %2727 = fmul float %2717, %69
  2712. %2728 = fadd float %2727, %2726
  2713. %2729 = fmul float %2718, %70
  2714. %2730 = fadd float %2728, %2729
  2715. %2731 = fadd float %2730, %34
  2716. %2732 = call float @llvm.AMDIL.clamp.(float %2731, float 0.000000e+00, float 1.000000e+00)
  2717. %2733 = fmul float %2725, %2732
  2718. %2734 = fmul float %2733, %2712
  2719. %2735 = bitcast float %2670 to i32
  2720. %2736 = bitcast float %2671 to i32
  2721. %2737 = insertelement <4 x i32> undef, i32 %2735, i32 0
  2722. %2738 = insertelement <4 x i32> %2737, i32 %2736, i32 1
  2723. %2739 = insertelement <4 x i32> %2738, i32 0, i32 2
  2724. %2740 = bitcast <8 x i32> %42 to <32 x i8>
  2725. %2741 = bitcast <4 x i32> %44 to <16 x i8>
  2726. %2742 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2739, <32 x i8> %2740, <16 x i8> %2741, i32 2)
  2727. %2743 = extractelement <4 x float> %2742, i32 0
  2728. %2744 = extractelement <4 x float> %2742, i32 1
  2729. %2745 = extractelement <4 x float> %2742, i32 2
  2730. %2746 = fmul float %2743, %2734
  2731. %2747 = fadd float %2746, %2649
  2732. %2748 = fmul float %2744, %2734
  2733. %2749 = fadd float %2748, %2651
  2734. %2750 = fmul float %2745, %2734
  2735. %2751 = fadd float %2750, %2653
  2736. %2752 = call float @llvm.AMDIL.clamp.(float %2663, float 0.000000e+00, float 1.000000e+00)
  2737. %2753 = call float @llvm.AMDIL.clamp.(float %2665, float 0.000000e+00, float 1.000000e+00)
  2738. %2754 = bitcast float %2752 to i32
  2739. %2755 = bitcast float %2753 to i32
  2740. %2756 = insertelement <4 x i32> undef, i32 %2754, i32 0
  2741. %2757 = insertelement <4 x i32> %2756, i32 %2755, i32 1
  2742. %2758 = insertelement <4 x i32> %2757, i32 0, i32 2
  2743. %2759 = bitcast <8 x i32> %38 to <32 x i8>
  2744. %2760 = bitcast <4 x i32> %40 to <16 x i8>
  2745. %2761 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2758, <32 x i8> %2759, <16 x i8> %2760, i32 2)
  2746. %2762 = extractelement <4 x float> %2761, i32 0
  2747. %2763 = extractelement <4 x float> %2761, i32 1
  2748. %2764 = extractelement <4 x float> %2761, i32 2
  2749. %2765 = extractelement <4 x float> %2761, i32 3
  2750. %2766 = fmul float %2765, %2765
  2751. %2767 = fmul float %2752, %106
  2752. %2768 = fadd float %2767, %110
  2753. %2769 = fmul float %2753, %107
  2754. %2770 = fadd float %2769, %111
  2755. %2771 = fmul float %2768, %2768
  2756. %2772 = fmul float %2770, %2770
  2757. %2773 = fadd float %2772, %2771
  2758. %2774 = fadd float %2773, 1.000000e+00
  2759. %2775 = call float @fabs(float %2774)
  2760. %2776 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2775)
  2761. %2777 = call float @llvm.minnum.f32(float %2776, float 0x47EFFFFFE0000000)
  2762. %2778 = fmul float %2777, %2768
  2763. %2779 = fmul float %2777, %2770
  2764. %2780 = fmul float %2777, %2766
  2765. %2781 = fmul float %2778, %2766
  2766. %2782 = fsub float %2781, %101
  2767. %2783 = fmul float %2779, %2766
  2768. %2784 = fsub float %2783, %102
  2769. %2785 = fsub float -0.000000e+00, %103
  2770. %2786 = fsub float %2785, %2780
  2771. %2787 = fmul float %2782, %2782
  2772. %2788 = fmul float %2784, %2784
  2773. %2789 = fadd float %2788, %2787
  2774. %2790 = fmul float %2786, %2786
  2775. %2791 = fadd float %2789, %2790
  2776. %2792 = fmul float %32, %2791
  2777. %2793 = fsub float 1.000000e+00, %2792
  2778. %2794 = call float @llvm.AMDIL.clamp.(float %2793, float 0.000000e+00, float 1.000000e+00)
  2779. %2795 = call float @fabs(float %2791)
  2780. %2796 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2795)
  2781. %2797 = call float @llvm.minnum.f32(float %2796, float 0x47EFFFFFE0000000)
  2782. %2798 = fmul float %2797, %2782
  2783. %2799 = fmul float %2797, %2784
  2784. %2800 = fmul float %2797, %2786
  2785. %2801 = fmul float %2798, %2762
  2786. %2802 = fmul float %2799, %2763
  2787. %2803 = fadd float %2802, %2801
  2788. %2804 = fmul float %2800, %2764
  2789. %2805 = fadd float %2803, %2804
  2790. %2806 = fsub float %33, %2805
  2791. %2807 = call float @llvm.AMDIL.clamp.(float %2806, float 0.000000e+00, float 1.000000e+00)
  2792. %2808 = fmul float %2798, %68
  2793. %2809 = fmul float %2799, %69
  2794. %2810 = fadd float %2809, %2808
  2795. %2811 = fmul float %2800, %70
  2796. %2812 = fadd float %2810, %2811
  2797. %2813 = fadd float %2812, %34
  2798. %2814 = call float @llvm.AMDIL.clamp.(float %2813, float 0.000000e+00, float 1.000000e+00)
  2799. %2815 = fmul float %2807, %2814
  2800. %2816 = fmul float %2815, %2794
  2801. %2817 = bitcast float %2752 to i32
  2802. %2818 = bitcast float %2753 to i32
  2803. %2819 = insertelement <4 x i32> undef, i32 %2817, i32 0
  2804. %2820 = insertelement <4 x i32> %2819, i32 %2818, i32 1
  2805. %2821 = insertelement <4 x i32> %2820, i32 0, i32 2
  2806. %2822 = bitcast <8 x i32> %42 to <32 x i8>
  2807. %2823 = bitcast <4 x i32> %44 to <16 x i8>
  2808. %2824 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2821, <32 x i8> %2822, <16 x i8> %2823, i32 2)
  2809. %2825 = extractelement <4 x float> %2824, i32 0
  2810. %2826 = extractelement <4 x float> %2824, i32 1
  2811. %2827 = extractelement <4 x float> %2824, i32 2
  2812. %2828 = fmul float %2825, %2816
  2813. %2829 = fadd float %2828, %2747
  2814. %2830 = fmul float %2826, %2816
  2815. %2831 = fadd float %2830, %2749
  2816. %2832 = fmul float %2827, %2816
  2817. %2833 = fadd float %2832, %2751
  2818. %2834 = fmul float %88, 0x3FEF439580000000
  2819. %2835 = fmul float %87, 0xBFEF439580000000
  2820. %2836 = fmul float %88, 0x3FEF439580000000
  2821. %2837 = fmul float %87, 0xBFEF439580000000
  2822. %2838 = fmul float %87, 0xBFCB851EC0000000
  2823. %2839 = fadd float %2838, %2834
  2824. %2840 = fmul float %90, 0xBFCB851EC0000000
  2825. %2841 = fadd float %2840, %2835
  2826. %2842 = fmul float %87, 0xBFCB851EC0000000
  2827. %2843 = fadd float %2842, %2836
  2828. %2844 = fmul float %90, 0xBFCB851EC0000000
  2829. %2845 = fadd float %2844, %2837
  2830. %2846 = fmul float %2843, 0x3FEA147AE0000000
  2831. %2847 = fadd float %2846, %51
  2832. %2848 = fmul float %2845, 0x3FEA147AE0000000
  2833. %2849 = fadd float %2848, %52
  2834. %2850 = fmul float %2839, 0x3FC5810620000000
  2835. %2851 = fadd float %2850, %51
  2836. %2852 = fmul float %2841, 0x3FC5810620000000
  2837. %2853 = fadd float %2852, %52
  2838. %2854 = call float @llvm.AMDIL.clamp.(float %2851, float 0.000000e+00, float 1.000000e+00)
  2839. %2855 = call float @llvm.AMDIL.clamp.(float %2853, float 0.000000e+00, float 1.000000e+00)
  2840. %2856 = bitcast float %2854 to i32
  2841. %2857 = bitcast float %2855 to i32
  2842. %2858 = insertelement <4 x i32> undef, i32 %2856, i32 0
  2843. %2859 = insertelement <4 x i32> %2858, i32 %2857, i32 1
  2844. %2860 = insertelement <4 x i32> %2859, i32 0, i32 2
  2845. %2861 = bitcast <8 x i32> %38 to <32 x i8>
  2846. %2862 = bitcast <4 x i32> %40 to <16 x i8>
  2847. %2863 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2860, <32 x i8> %2861, <16 x i8> %2862, i32 2)
  2848. %2864 = extractelement <4 x float> %2863, i32 0
  2849. %2865 = extractelement <4 x float> %2863, i32 1
  2850. %2866 = extractelement <4 x float> %2863, i32 2
  2851. %2867 = extractelement <4 x float> %2863, i32 3
  2852. %2868 = fmul float %2867, %2867
  2853. %2869 = fmul float %2854, %106
  2854. %2870 = fadd float %2869, %110
  2855. %2871 = fmul float %2855, %107
  2856. %2872 = fadd float %2871, %111
  2857. %2873 = fmul float %2870, %2870
  2858. %2874 = fmul float %2872, %2872
  2859. %2875 = fadd float %2874, %2873
  2860. %2876 = fadd float %2875, 1.000000e+00
  2861. %2877 = call float @fabs(float %2876)
  2862. %2878 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2877)
  2863. %2879 = call float @llvm.minnum.f32(float %2878, float 0x47EFFFFFE0000000)
  2864. %2880 = fmul float %2879, %2870
  2865. %2881 = fmul float %2879, %2872
  2866. %2882 = fmul float %2879, %2868
  2867. %2883 = fmul float %2880, %2868
  2868. %2884 = fsub float %2883, %101
  2869. %2885 = fmul float %2881, %2868
  2870. %2886 = fsub float %2885, %102
  2871. %2887 = fsub float -0.000000e+00, %103
  2872. %2888 = fsub float %2887, %2882
  2873. %2889 = fmul float %2884, %2884
  2874. %2890 = fmul float %2886, %2886
  2875. %2891 = fadd float %2890, %2889
  2876. %2892 = fmul float %2888, %2888
  2877. %2893 = fadd float %2891, %2892
  2878. %2894 = fmul float %32, %2893
  2879. %2895 = fsub float 1.000000e+00, %2894
  2880. %2896 = call float @llvm.AMDIL.clamp.(float %2895, float 0.000000e+00, float 1.000000e+00)
  2881. %2897 = call float @fabs(float %2893)
  2882. %2898 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2897)
  2883. %2899 = call float @llvm.minnum.f32(float %2898, float 0x47EFFFFFE0000000)
  2884. %2900 = fmul float %2899, %2884
  2885. %2901 = fmul float %2899, %2886
  2886. %2902 = fmul float %2899, %2888
  2887. %2903 = fmul float %2900, %2864
  2888. %2904 = fmul float %2901, %2865
  2889. %2905 = fadd float %2904, %2903
  2890. %2906 = fmul float %2902, %2866
  2891. %2907 = fadd float %2905, %2906
  2892. %2908 = fsub float %33, %2907
  2893. %2909 = call float @llvm.AMDIL.clamp.(float %2908, float 0.000000e+00, float 1.000000e+00)
  2894. %2910 = fmul float %2900, %68
  2895. %2911 = fmul float %2901, %69
  2896. %2912 = fadd float %2911, %2910
  2897. %2913 = fmul float %2902, %70
  2898. %2914 = fadd float %2912, %2913
  2899. %2915 = fadd float %2914, %34
  2900. %2916 = call float @llvm.AMDIL.clamp.(float %2915, float 0.000000e+00, float 1.000000e+00)
  2901. %2917 = fmul float %2909, %2916
  2902. %2918 = fmul float %2917, %2896
  2903. %2919 = bitcast float %2854 to i32
  2904. %2920 = bitcast float %2855 to i32
  2905. %2921 = insertelement <4 x i32> undef, i32 %2919, i32 0
  2906. %2922 = insertelement <4 x i32> %2921, i32 %2920, i32 1
  2907. %2923 = insertelement <4 x i32> %2922, i32 0, i32 2
  2908. %2924 = bitcast <8 x i32> %42 to <32 x i8>
  2909. %2925 = bitcast <4 x i32> %44 to <16 x i8>
  2910. %2926 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2923, <32 x i8> %2924, <16 x i8> %2925, i32 2)
  2911. %2927 = extractelement <4 x float> %2926, i32 0
  2912. %2928 = extractelement <4 x float> %2926, i32 1
  2913. %2929 = extractelement <4 x float> %2926, i32 2
  2914. %2930 = fmul float %2927, %2918
  2915. %2931 = fadd float %2930, %2829
  2916. %2932 = fmul float %2928, %2918
  2917. %2933 = fadd float %2932, %2831
  2918. %2934 = fmul float %2929, %2918
  2919. %2935 = fadd float %2934, %2833
  2920. %2936 = call float @llvm.AMDIL.clamp.(float %2847, float 0.000000e+00, float 1.000000e+00)
  2921. %2937 = call float @llvm.AMDIL.clamp.(float %2849, float 0.000000e+00, float 1.000000e+00)
  2922. %2938 = bitcast float %2936 to i32
  2923. %2939 = bitcast float %2937 to i32
  2924. %2940 = insertelement <4 x i32> undef, i32 %2938, i32 0
  2925. %2941 = insertelement <4 x i32> %2940, i32 %2939, i32 1
  2926. %2942 = insertelement <4 x i32> %2941, i32 0, i32 2
  2927. %2943 = bitcast <8 x i32> %38 to <32 x i8>
  2928. %2944 = bitcast <4 x i32> %40 to <16 x i8>
  2929. %2945 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %2942, <32 x i8> %2943, <16 x i8> %2944, i32 2)
  2930. %2946 = extractelement <4 x float> %2945, i32 0
  2931. %2947 = extractelement <4 x float> %2945, i32 1
  2932. %2948 = extractelement <4 x float> %2945, i32 2
  2933. %2949 = extractelement <4 x float> %2945, i32 3
  2934. %2950 = fmul float %2949, %2949
  2935. %2951 = fmul float %2936, %106
  2936. %2952 = fadd float %2951, %110
  2937. %2953 = fmul float %2937, %107
  2938. %2954 = fadd float %2953, %111
  2939. %2955 = fmul float %2952, %2952
  2940. %2956 = fmul float %2954, %2954
  2941. %2957 = fadd float %2956, %2955
  2942. %2958 = fadd float %2957, 1.000000e+00
  2943. %2959 = call float @fabs(float %2958)
  2944. %2960 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2959)
  2945. %2961 = call float @llvm.minnum.f32(float %2960, float 0x47EFFFFFE0000000)
  2946. %2962 = fmul float %2961, %2952
  2947. %2963 = fmul float %2961, %2954
  2948. %2964 = fmul float %2961, %2950
  2949. %2965 = fmul float %2962, %2950
  2950. %2966 = fsub float %2965, %101
  2951. %2967 = fmul float %2963, %2950
  2952. %2968 = fsub float %2967, %102
  2953. %2969 = fsub float -0.000000e+00, %103
  2954. %2970 = fsub float %2969, %2964
  2955. %2971 = fmul float %2966, %2966
  2956. %2972 = fmul float %2968, %2968
  2957. %2973 = fadd float %2972, %2971
  2958. %2974 = fmul float %2970, %2970
  2959. %2975 = fadd float %2973, %2974
  2960. %2976 = fmul float %32, %2975
  2961. %2977 = fsub float 1.000000e+00, %2976
  2962. %2978 = call float @llvm.AMDIL.clamp.(float %2977, float 0.000000e+00, float 1.000000e+00)
  2963. %2979 = call float @fabs(float %2975)
  2964. %2980 = call float @llvm.AMDGPU.rsq.clamped.f32(float %2979)
  2965. %2981 = call float @llvm.minnum.f32(float %2980, float 0x47EFFFFFE0000000)
  2966. %2982 = fmul float %2981, %2966
  2967. %2983 = fmul float %2981, %2968
  2968. %2984 = fmul float %2981, %2970
  2969. %2985 = fmul float %2982, %2946
  2970. %2986 = fmul float %2983, %2947
  2971. %2987 = fadd float %2986, %2985
  2972. %2988 = fmul float %2984, %2948
  2973. %2989 = fadd float %2987, %2988
  2974. %2990 = fsub float %33, %2989
  2975. %2991 = call float @llvm.AMDIL.clamp.(float %2990, float 0.000000e+00, float 1.000000e+00)
  2976. %2992 = fmul float %2982, %68
  2977. %2993 = fmul float %2983, %69
  2978. %2994 = fadd float %2993, %2992
  2979. %2995 = fmul float %2984, %70
  2980. %2996 = fadd float %2994, %2995
  2981. %2997 = fadd float %2996, %34
  2982. %2998 = call float @llvm.AMDIL.clamp.(float %2997, float 0.000000e+00, float 1.000000e+00)
  2983. %2999 = fmul float %2991, %2998
  2984. %3000 = fmul float %2999, %2978
  2985. %3001 = bitcast float %2936 to i32
  2986. %3002 = bitcast float %2937 to i32
  2987. %3003 = insertelement <4 x i32> undef, i32 %3001, i32 0
  2988. %3004 = insertelement <4 x i32> %3003, i32 %3002, i32 1
  2989. %3005 = insertelement <4 x i32> %3004, i32 0, i32 2
  2990. %3006 = bitcast <8 x i32> %42 to <32 x i8>
  2991. %3007 = bitcast <4 x i32> %44 to <16 x i8>
  2992. %3008 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3005, <32 x i8> %3006, <16 x i8> %3007, i32 2)
  2993. %3009 = extractelement <4 x float> %3008, i32 0
  2994. %3010 = extractelement <4 x float> %3008, i32 1
  2995. %3011 = extractelement <4 x float> %3008, i32 2
  2996. %3012 = fmul float %3009, %3000
  2997. %3013 = fadd float %3012, %2931
  2998. %3014 = fmul float %3010, %3000
  2999. %3015 = fadd float %3014, %2933
  3000. %3016 = fmul float %3011, %3000
  3001. %3017 = fadd float %3016, %2935
  3002. %3018 = fmul float %3013, 3.125000e-02
  3003. %3019 = fmul float %3015, 3.125000e-02
  3004. %3020 = fmul float %3017, 3.125000e-02
  3005. br label %ENDIF
  3006.  
  3007. ELSE: ; preds = %main_body
  3008. %3021 = fcmp ogt float %75, 0x3F947AE140000000
  3009. br i1 %3021, label %IF57, label %ELSE58
  3010.  
  3011. ENDIF: ; preds = %IF60, %ELSE58, %IF57, %IF
  3012. %temp21.0 = phi float [ %3018, %IF ], [ %5224, %IF57 ], [ %6677, %IF60 ], [ 0.000000e+00, %ELSE58 ]
  3013. %temp22.0 = phi float [ %3019, %IF ], [ %5225, %IF57 ], [ %6678, %IF60 ], [ 0.000000e+00, %ELSE58 ]
  3014. %temp23.0 = phi float [ %3020, %IF ], [ %5226, %IF57 ], [ %6679, %IF60 ], [ 0.000000e+00, %ELSE58 ]
  3015. %3022 = fmul float %temp21.0, %35
  3016. %3023 = fmul float %temp22.0, %35
  3017. %3024 = fmul float %temp23.0, %35
  3018. %3025 = call float @llvm.maxnum.f32(float %3022, float 0.000000e+00)
  3019. %3026 = call float @llvm.maxnum.f32(float %3023, float 0.000000e+00)
  3020. %3027 = call float @llvm.maxnum.f32(float %3024, float 0.000000e+00)
  3021. %3028 = call float @fabs(float %3025)
  3022. %3029 = call float @llvm.log2.f32(float %3028)
  3023. %3030 = call float @llvm.maxnum.f32(float %3029, float 0xC7EFFFFFE0000000)
  3024. %3031 = call float @fabs(float %3026)
  3025. %3032 = call float @llvm.log2.f32(float %3031)
  3026. %3033 = call float @llvm.maxnum.f32(float %3032, float 0xC7EFFFFFE0000000)
  3027. %3034 = call float @fabs(float %3027)
  3028. %3035 = call float @llvm.log2.f32(float %3034)
  3029. %3036 = call float @llvm.maxnum.f32(float %3035, float 0xC7EFFFFFE0000000)
  3030. %3037 = fmul float %3030, %36
  3031. %3038 = fmul float %3033, %36
  3032. %3039 = fmul float %3036, %36
  3033. %3040 = call float @llvm.AMDIL.exp.(float %3037)
  3034. %3041 = call float @llvm.AMDIL.exp.(float %3038)
  3035. %3042 = call float @llvm.AMDIL.exp.(float %3039)
  3036. %3043 = call i32 @llvm.SI.packf16(float %3040, float %3041)
  3037. %3044 = bitcast i32 %3043 to float
  3038. %3045 = call i32 @llvm.SI.packf16(float %3042, float %72)
  3039. %3046 = bitcast i32 %3045 to float
  3040. call void @llvm.SI.export(i32 15, i32 1, i32 1, i32 0, i32 1, float %3044, float %3046, float %3044, float %3046)
  3041. ret void
  3042.  
  3043. IF57: ; preds = %ELSE
  3044. %3047 = fmul float %87, 0x3F50624DE0000000
  3045. %3048 = fadd float %3047, %88
  3046. %3049 = fmul float %90, 0x3F50624DE0000000
  3047. %3050 = fsub float %3049, %87
  3048. %3051 = fmul float %87, 0x3F50624DE0000000
  3049. %3052 = fadd float %3051, %88
  3050. %3053 = fmul float %90, 0x3F50624DE0000000
  3051. %3054 = fsub float %3053, %87
  3052. %3055 = fmul float %3052, 0x3FE2147AE0000000
  3053. %3056 = fadd float %3055, %51
  3054. %3057 = fmul float %3054, 0x3FE2147AE0000000
  3055. %3058 = fadd float %3057, %52
  3056. %3059 = fmul float %3048, 0x3FDB53F7C0000000
  3057. %3060 = fadd float %3059, %51
  3058. %3061 = fmul float %3050, 0x3FDB53F7C0000000
  3059. %3062 = fadd float %3061, %52
  3060. %3063 = call float @llvm.AMDIL.clamp.(float %3060, float 0.000000e+00, float 1.000000e+00)
  3061. %3064 = call float @llvm.AMDIL.clamp.(float %3062, float 0.000000e+00, float 1.000000e+00)
  3062. %3065 = bitcast float %3063 to i32
  3063. %3066 = bitcast float %3064 to i32
  3064. %3067 = insertelement <4 x i32> undef, i32 %3065, i32 0
  3065. %3068 = insertelement <4 x i32> %3067, i32 %3066, i32 1
  3066. %3069 = insertelement <4 x i32> %3068, i32 0, i32 2
  3067. %3070 = bitcast <8 x i32> %38 to <32 x i8>
  3068. %3071 = bitcast <4 x i32> %40 to <16 x i8>
  3069. %3072 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3069, <32 x i8> %3070, <16 x i8> %3071, i32 2)
  3070. %3073 = extractelement <4 x float> %3072, i32 0
  3071. %3074 = extractelement <4 x float> %3072, i32 1
  3072. %3075 = extractelement <4 x float> %3072, i32 2
  3073. %3076 = extractelement <4 x float> %3072, i32 3
  3074. %3077 = fmul float %3076, %3076
  3075. %3078 = fmul float %3063, %106
  3076. %3079 = fadd float %3078, %110
  3077. %3080 = fmul float %3064, %107
  3078. %3081 = fadd float %3080, %111
  3079. %3082 = fmul float %3079, %3079
  3080. %3083 = fmul float %3081, %3081
  3081. %3084 = fadd float %3083, %3082
  3082. %3085 = fadd float %3084, 1.000000e+00
  3083. %3086 = call float @fabs(float %3085)
  3084. %3087 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3086)
  3085. %3088 = call float @llvm.minnum.f32(float %3087, float 0x47EFFFFFE0000000)
  3086. %3089 = fmul float %3088, %3079
  3087. %3090 = fmul float %3088, %3081
  3088. %3091 = fmul float %3088, %3077
  3089. %3092 = fmul float %3089, %3077
  3090. %3093 = fsub float %3092, %101
  3091. %3094 = fmul float %3090, %3077
  3092. %3095 = fsub float %3094, %102
  3093. %3096 = fsub float -0.000000e+00, %103
  3094. %3097 = fsub float %3096, %3091
  3095. %3098 = fmul float %3093, %3093
  3096. %3099 = fmul float %3095, %3095
  3097. %3100 = fadd float %3099, %3098
  3098. %3101 = fmul float %3097, %3097
  3099. %3102 = fadd float %3100, %3101
  3100. %3103 = fmul float %32, %3102
  3101. %3104 = fsub float 1.000000e+00, %3103
  3102. %3105 = call float @llvm.AMDIL.clamp.(float %3104, float 0.000000e+00, float 1.000000e+00)
  3103. %3106 = call float @fabs(float %3102)
  3104. %3107 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3106)
  3105. %3108 = call float @llvm.minnum.f32(float %3107, float 0x47EFFFFFE0000000)
  3106. %3109 = fmul float %3108, %3093
  3107. %3110 = fmul float %3108, %3095
  3108. %3111 = fmul float %3108, %3097
  3109. %3112 = fmul float %3109, %3073
  3110. %3113 = fmul float %3110, %3074
  3111. %3114 = fadd float %3113, %3112
  3112. %3115 = fmul float %3111, %3075
  3113. %3116 = fadd float %3114, %3115
  3114. %3117 = fsub float %33, %3116
  3115. %3118 = call float @llvm.AMDIL.clamp.(float %3117, float 0.000000e+00, float 1.000000e+00)
  3116. %3119 = fmul float %3109, %68
  3117. %3120 = fmul float %3110, %69
  3118. %3121 = fadd float %3120, %3119
  3119. %3122 = fmul float %3111, %70
  3120. %3123 = fadd float %3121, %3122
  3121. %3124 = fadd float %3123, %34
  3122. %3125 = call float @llvm.AMDIL.clamp.(float %3124, float 0.000000e+00, float 1.000000e+00)
  3123. %3126 = fmul float %3118, %3125
  3124. %3127 = fmul float %3126, %3105
  3125. %3128 = bitcast float %3063 to i32
  3126. %3129 = bitcast float %3064 to i32
  3127. %3130 = insertelement <4 x i32> undef, i32 %3128, i32 0
  3128. %3131 = insertelement <4 x i32> %3130, i32 %3129, i32 1
  3129. %3132 = insertelement <4 x i32> %3131, i32 0, i32 2
  3130. %3133 = bitcast <8 x i32> %42 to <32 x i8>
  3131. %3134 = bitcast <4 x i32> %44 to <16 x i8>
  3132. %3135 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3132, <32 x i8> %3133, <16 x i8> %3134, i32 2)
  3133. %3136 = extractelement <4 x float> %3135, i32 0
  3134. %3137 = extractelement <4 x float> %3135, i32 1
  3135. %3138 = extractelement <4 x float> %3135, i32 2
  3136. %3139 = call float @llvm.AMDIL.clamp.(float %3056, float 0.000000e+00, float 1.000000e+00)
  3137. %3140 = call float @llvm.AMDIL.clamp.(float %3058, float 0.000000e+00, float 1.000000e+00)
  3138. %3141 = bitcast float %3139 to i32
  3139. %3142 = bitcast float %3140 to i32
  3140. %3143 = insertelement <4 x i32> undef, i32 %3141, i32 0
  3141. %3144 = insertelement <4 x i32> %3143, i32 %3142, i32 1
  3142. %3145 = insertelement <4 x i32> %3144, i32 0, i32 2
  3143. %3146 = bitcast <8 x i32> %38 to <32 x i8>
  3144. %3147 = bitcast <4 x i32> %40 to <16 x i8>
  3145. %3148 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3145, <32 x i8> %3146, <16 x i8> %3147, i32 2)
  3146. %3149 = extractelement <4 x float> %3148, i32 0
  3147. %3150 = extractelement <4 x float> %3148, i32 1
  3148. %3151 = extractelement <4 x float> %3148, i32 2
  3149. %3152 = extractelement <4 x float> %3148, i32 3
  3150. %3153 = fmul float %3152, %3152
  3151. %3154 = fmul float %3139, %106
  3152. %3155 = fadd float %3154, %110
  3153. %3156 = fmul float %3140, %107
  3154. %3157 = fadd float %3156, %111
  3155. %3158 = fmul float %3155, %3155
  3156. %3159 = fmul float %3157, %3157
  3157. %3160 = fadd float %3159, %3158
  3158. %3161 = fadd float %3160, 1.000000e+00
  3159. %3162 = call float @fabs(float %3161)
  3160. %3163 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3162)
  3161. %3164 = call float @llvm.minnum.f32(float %3163, float 0x47EFFFFFE0000000)
  3162. %3165 = fmul float %3164, %3155
  3163. %3166 = fmul float %3164, %3157
  3164. %3167 = fmul float %3164, %3153
  3165. %3168 = fmul float %3165, %3153
  3166. %3169 = fsub float %3168, %101
  3167. %3170 = fmul float %3166, %3153
  3168. %3171 = fsub float %3170, %102
  3169. %3172 = fsub float -0.000000e+00, %103
  3170. %3173 = fsub float %3172, %3167
  3171. %3174 = fmul float %3169, %3169
  3172. %3175 = fmul float %3171, %3171
  3173. %3176 = fadd float %3175, %3174
  3174. %3177 = fmul float %3173, %3173
  3175. %3178 = fadd float %3176, %3177
  3176. %3179 = fmul float %32, %3178
  3177. %3180 = fsub float 1.000000e+00, %3179
  3178. %3181 = call float @llvm.AMDIL.clamp.(float %3180, float 0.000000e+00, float 1.000000e+00)
  3179. %3182 = call float @fabs(float %3178)
  3180. %3183 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3182)
  3181. %3184 = call float @llvm.minnum.f32(float %3183, float 0x47EFFFFFE0000000)
  3182. %3185 = fmul float %3184, %3169
  3183. %3186 = fmul float %3184, %3171
  3184. %3187 = fmul float %3184, %3173
  3185. %3188 = fmul float %3185, %3149
  3186. %3189 = fmul float %3186, %3150
  3187. %3190 = fadd float %3189, %3188
  3188. %3191 = fmul float %3187, %3151
  3189. %3192 = fadd float %3190, %3191
  3190. %3193 = fsub float %33, %3192
  3191. %3194 = call float @llvm.AMDIL.clamp.(float %3193, float 0.000000e+00, float 1.000000e+00)
  3192. %3195 = fmul float %3185, %68
  3193. %3196 = fmul float %3186, %69
  3194. %3197 = fadd float %3196, %3195
  3195. %3198 = fmul float %3187, %70
  3196. %3199 = fadd float %3197, %3198
  3197. %3200 = fadd float %3199, %34
  3198. %3201 = call float @llvm.AMDIL.clamp.(float %3200, float 0.000000e+00, float 1.000000e+00)
  3199. %3202 = fmul float %3194, %3201
  3200. %3203 = fmul float %3202, %3181
  3201. %3204 = bitcast float %3139 to i32
  3202. %3205 = bitcast float %3140 to i32
  3203. %3206 = insertelement <4 x i32> undef, i32 %3204, i32 0
  3204. %3207 = insertelement <4 x i32> %3206, i32 %3205, i32 1
  3205. %3208 = insertelement <4 x i32> %3207, i32 0, i32 2
  3206. %3209 = bitcast <8 x i32> %42 to <32 x i8>
  3207. %3210 = bitcast <4 x i32> %44 to <16 x i8>
  3208. %3211 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3208, <32 x i8> %3209, <16 x i8> %3210, i32 2)
  3209. %3212 = extractelement <4 x float> %3211, i32 0
  3210. %3213 = extractelement <4 x float> %3211, i32 1
  3211. %3214 = extractelement <4 x float> %3211, i32 2
  3212. %3215 = fmul float %3203, %3212
  3213. %3216 = fmul float %3203, %3213
  3214. %3217 = fmul float %3203, %3214
  3215. %3218 = fmul float %3136, %3127
  3216. %3219 = fadd float %3218, %3215
  3217. %3220 = fmul float %3137, %3127
  3218. %3221 = fadd float %3220, %3216
  3219. %3222 = fmul float %3138, %3127
  3220. %3223 = fadd float %3222, %3217
  3221. %3224 = fmul float %88, 0x3FE2F1AA00000000
  3222. %3225 = fmul float %87, 0xBFE2F1AA00000000
  3223. %3226 = fmul float %88, 0x3FD53F7CE0000000
  3224. %3227 = fmul float %87, 0xBFD53F7CE0000000
  3225. %3228 = fmul float %87, 0x3FE9CAC080000000
  3226. %3229 = fadd float %3228, %3224
  3227. %3230 = fmul float %90, 0x3FE9CAC080000000
  3228. %3231 = fadd float %3230, %3225
  3229. %3232 = fmul float %87, 0x3FE9CAC080000000
  3230. %3233 = fadd float %3232, %3224
  3231. %3234 = fmul float %90, 0x3FE9CAC080000000
  3232. %3235 = fadd float %3234, %3225
  3233. %3236 = fmul float %3233, 0x3FE5168720000000
  3234. %3237 = fadd float %3236, %51
  3235. %3238 = fmul float %3235, 0x3FE5168720000000
  3236. %3239 = fadd float %3238, %52
  3237. %3240 = fmul float %3229, 0x3FD0624DE0000000
  3238. %3241 = fadd float %3240, %51
  3239. %3242 = fmul float %3231, 0x3FD0624DE0000000
  3240. %3243 = fadd float %3242, %52
  3241. %3244 = call float @llvm.AMDIL.clamp.(float %3241, float 0.000000e+00, float 1.000000e+00)
  3242. %3245 = call float @llvm.AMDIL.clamp.(float %3243, float 0.000000e+00, float 1.000000e+00)
  3243. %3246 = bitcast float %3244 to i32
  3244. %3247 = bitcast float %3245 to i32
  3245. %3248 = insertelement <4 x i32> undef, i32 %3246, i32 0
  3246. %3249 = insertelement <4 x i32> %3248, i32 %3247, i32 1
  3247. %3250 = insertelement <4 x i32> %3249, i32 0, i32 2
  3248. %3251 = bitcast <8 x i32> %38 to <32 x i8>
  3249. %3252 = bitcast <4 x i32> %40 to <16 x i8>
  3250. %3253 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3250, <32 x i8> %3251, <16 x i8> %3252, i32 2)
  3251. %3254 = extractelement <4 x float> %3253, i32 0
  3252. %3255 = extractelement <4 x float> %3253, i32 1
  3253. %3256 = extractelement <4 x float> %3253, i32 2
  3254. %3257 = extractelement <4 x float> %3253, i32 3
  3255. %3258 = fmul float %3257, %3257
  3256. %3259 = fmul float %3244, %106
  3257. %3260 = fadd float %3259, %110
  3258. %3261 = fmul float %3245, %107
  3259. %3262 = fadd float %3261, %111
  3260. %3263 = fmul float %3260, %3260
  3261. %3264 = fmul float %3262, %3262
  3262. %3265 = fadd float %3264, %3263
  3263. %3266 = fadd float %3265, 1.000000e+00
  3264. %3267 = call float @fabs(float %3266)
  3265. %3268 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3267)
  3266. %3269 = call float @llvm.minnum.f32(float %3268, float 0x47EFFFFFE0000000)
  3267. %3270 = fmul float %3269, %3260
  3268. %3271 = fmul float %3269, %3262
  3269. %3272 = fmul float %3269, %3258
  3270. %3273 = fmul float %3270, %3258
  3271. %3274 = fsub float %3273, %101
  3272. %3275 = fmul float %3271, %3258
  3273. %3276 = fsub float %3275, %102
  3274. %3277 = fsub float -0.000000e+00, %103
  3275. %3278 = fsub float %3277, %3272
  3276. %3279 = fmul float %3274, %3274
  3277. %3280 = fmul float %3276, %3276
  3278. %3281 = fadd float %3280, %3279
  3279. %3282 = fmul float %3278, %3278
  3280. %3283 = fadd float %3281, %3282
  3281. %3284 = fmul float %32, %3283
  3282. %3285 = fsub float 1.000000e+00, %3284
  3283. %3286 = call float @llvm.AMDIL.clamp.(float %3285, float 0.000000e+00, float 1.000000e+00)
  3284. %3287 = call float @fabs(float %3283)
  3285. %3288 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3287)
  3286. %3289 = call float @llvm.minnum.f32(float %3288, float 0x47EFFFFFE0000000)
  3287. %3290 = fmul float %3289, %3274
  3288. %3291 = fmul float %3289, %3276
  3289. %3292 = fmul float %3289, %3278
  3290. %3293 = fmul float %3290, %3254
  3291. %3294 = fmul float %3291, %3255
  3292. %3295 = fadd float %3294, %3293
  3293. %3296 = fmul float %3292, %3256
  3294. %3297 = fadd float %3295, %3296
  3295. %3298 = fsub float %33, %3297
  3296. %3299 = call float @llvm.AMDIL.clamp.(float %3298, float 0.000000e+00, float 1.000000e+00)
  3297. %3300 = fmul float %3290, %68
  3298. %3301 = fmul float %3291, %69
  3299. %3302 = fadd float %3301, %3300
  3300. %3303 = fmul float %3292, %70
  3301. %3304 = fadd float %3302, %3303
  3302. %3305 = fadd float %3304, %34
  3303. %3306 = call float @llvm.AMDIL.clamp.(float %3305, float 0.000000e+00, float 1.000000e+00)
  3304. %3307 = fmul float %3299, %3306
  3305. %3308 = fmul float %3307, %3286
  3306. %3309 = bitcast float %3244 to i32
  3307. %3310 = bitcast float %3245 to i32
  3308. %3311 = insertelement <4 x i32> undef, i32 %3309, i32 0
  3309. %3312 = insertelement <4 x i32> %3311, i32 %3310, i32 1
  3310. %3313 = insertelement <4 x i32> %3312, i32 0, i32 2
  3311. %3314 = bitcast <8 x i32> %42 to <32 x i8>
  3312. %3315 = bitcast <4 x i32> %44 to <16 x i8>
  3313. %3316 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3313, <32 x i8> %3314, <16 x i8> %3315, i32 2)
  3314. %3317 = extractelement <4 x float> %3316, i32 0
  3315. %3318 = extractelement <4 x float> %3316, i32 1
  3316. %3319 = extractelement <4 x float> %3316, i32 2
  3317. %3320 = fmul float %3317, %3308
  3318. %3321 = fadd float %3320, %3219
  3319. %3322 = fmul float %3318, %3308
  3320. %3323 = fadd float %3322, %3221
  3321. %3324 = fmul float %3319, %3308
  3322. %3325 = fadd float %3324, %3223
  3323. %3326 = call float @llvm.AMDIL.clamp.(float %3237, float 0.000000e+00, float 1.000000e+00)
  3324. %3327 = call float @llvm.AMDIL.clamp.(float %3239, float 0.000000e+00, float 1.000000e+00)
  3325. %3328 = bitcast float %3326 to i32
  3326. %3329 = bitcast float %3327 to i32
  3327. %3330 = insertelement <4 x i32> undef, i32 %3328, i32 0
  3328. %3331 = insertelement <4 x i32> %3330, i32 %3329, i32 1
  3329. %3332 = insertelement <4 x i32> %3331, i32 0, i32 2
  3330. %3333 = bitcast <8 x i32> %38 to <32 x i8>
  3331. %3334 = bitcast <4 x i32> %40 to <16 x i8>
  3332. %3335 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3332, <32 x i8> %3333, <16 x i8> %3334, i32 2)
  3333. %3336 = extractelement <4 x float> %3335, i32 0
  3334. %3337 = extractelement <4 x float> %3335, i32 1
  3335. %3338 = extractelement <4 x float> %3335, i32 2
  3336. %3339 = extractelement <4 x float> %3335, i32 3
  3337. %3340 = fmul float %3339, %3339
  3338. %3341 = fmul float %3326, %106
  3339. %3342 = fadd float %3341, %110
  3340. %3343 = fmul float %3327, %107
  3341. %3344 = fadd float %3343, %111
  3342. %3345 = fmul float %3342, %3342
  3343. %3346 = fmul float %3344, %3344
  3344. %3347 = fadd float %3346, %3345
  3345. %3348 = fadd float %3347, 1.000000e+00
  3346. %3349 = call float @fabs(float %3348)
  3347. %3350 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3349)
  3348. %3351 = call float @llvm.minnum.f32(float %3350, float 0x47EFFFFFE0000000)
  3349. %3352 = fmul float %3351, %3342
  3350. %3353 = fmul float %3351, %3344
  3351. %3354 = fmul float %3351, %3340
  3352. %3355 = fmul float %3352, %3340
  3353. %3356 = fsub float %3355, %101
  3354. %3357 = fmul float %3353, %3340
  3355. %3358 = fsub float %3357, %102
  3356. %3359 = fsub float -0.000000e+00, %103
  3357. %3360 = fsub float %3359, %3354
  3358. %3361 = fmul float %3356, %3356
  3359. %3362 = fmul float %3358, %3358
  3360. %3363 = fadd float %3362, %3361
  3361. %3364 = fmul float %3360, %3360
  3362. %3365 = fadd float %3363, %3364
  3363. %3366 = fmul float %32, %3365
  3364. %3367 = fsub float 1.000000e+00, %3366
  3365. %3368 = call float @llvm.AMDIL.clamp.(float %3367, float 0.000000e+00, float 1.000000e+00)
  3366. %3369 = call float @fabs(float %3365)
  3367. %3370 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3369)
  3368. %3371 = call float @llvm.minnum.f32(float %3370, float 0x47EFFFFFE0000000)
  3369. %3372 = fmul float %3371, %3356
  3370. %3373 = fmul float %3371, %3358
  3371. %3374 = fmul float %3371, %3360
  3372. %3375 = fmul float %3372, %3336
  3373. %3376 = fmul float %3373, %3337
  3374. %3377 = fadd float %3376, %3375
  3375. %3378 = fmul float %3374, %3338
  3376. %3379 = fadd float %3377, %3378
  3377. %3380 = fsub float %33, %3379
  3378. %3381 = call float @llvm.AMDIL.clamp.(float %3380, float 0.000000e+00, float 1.000000e+00)
  3379. %3382 = fmul float %3372, %68
  3380. %3383 = fmul float %3373, %69
  3381. %3384 = fadd float %3383, %3382
  3382. %3385 = fmul float %3374, %70
  3383. %3386 = fadd float %3384, %3385
  3384. %3387 = fadd float %3386, %34
  3385. %3388 = call float @llvm.AMDIL.clamp.(float %3387, float 0.000000e+00, float 1.000000e+00)
  3386. %3389 = fmul float %3381, %3388
  3387. %3390 = fmul float %3389, %3368
  3388. %3391 = bitcast float %3326 to i32
  3389. %3392 = bitcast float %3327 to i32
  3390. %3393 = insertelement <4 x i32> undef, i32 %3391, i32 0
  3391. %3394 = insertelement <4 x i32> %3393, i32 %3392, i32 1
  3392. %3395 = insertelement <4 x i32> %3394, i32 0, i32 2
  3393. %3396 = bitcast <8 x i32> %42 to <32 x i8>
  3394. %3397 = bitcast <4 x i32> %44 to <16 x i8>
  3395. %3398 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3395, <32 x i8> %3396, <16 x i8> %3397, i32 2)
  3396. %3399 = extractelement <4 x float> %3398, i32 0
  3397. %3400 = extractelement <4 x float> %3398, i32 1
  3398. %3401 = extractelement <4 x float> %3398, i32 2
  3399. %3402 = fmul float %3399, %3390
  3400. %3403 = fadd float %3402, %3321
  3401. %3404 = fmul float %3400, %3390
  3402. %3405 = fadd float %3404, %3323
  3403. %3406 = fmul float %3401, %3390
  3404. %3407 = fadd float %3406, %3325
  3405. %3408 = fmul float %87, 0x3FEE2D0E60000000
  3406. %3409 = fadd float %3408, %3226
  3407. %3410 = fmul float %90, 0x3FEE2D0E60000000
  3408. %3411 = fadd float %3410, %3227
  3409. %3412 = fmul float %87, 0x3FEE2D0E60000000
  3410. %3413 = fadd float %3412, %3226
  3411. %3414 = fmul float %90, 0x3FEE2D0E60000000
  3412. %3415 = fadd float %3414, %3227
  3413. %3416 = fmul float %3413, 0x3FEBCED920000000
  3414. %3417 = fadd float %3416, %51
  3415. %3418 = fmul float %3415, 0x3FEBCED920000000
  3416. %3419 = fadd float %3418, %52
  3417. %3420 = fmul float %3409, 0x3FCB22D0E0000000
  3418. %3421 = fadd float %3420, %51
  3419. %3422 = fmul float %3411, 0x3FCB22D0E0000000
  3420. %3423 = fadd float %3422, %52
  3421. %3424 = call float @llvm.AMDIL.clamp.(float %3421, float 0.000000e+00, float 1.000000e+00)
  3422. %3425 = call float @llvm.AMDIL.clamp.(float %3423, float 0.000000e+00, float 1.000000e+00)
  3423. %3426 = bitcast float %3424 to i32
  3424. %3427 = bitcast float %3425 to i32
  3425. %3428 = insertelement <4 x i32> undef, i32 %3426, i32 0
  3426. %3429 = insertelement <4 x i32> %3428, i32 %3427, i32 1
  3427. %3430 = insertelement <4 x i32> %3429, i32 0, i32 2
  3428. %3431 = bitcast <8 x i32> %38 to <32 x i8>
  3429. %3432 = bitcast <4 x i32> %40 to <16 x i8>
  3430. %3433 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3430, <32 x i8> %3431, <16 x i8> %3432, i32 2)
  3431. %3434 = extractelement <4 x float> %3433, i32 0
  3432. %3435 = extractelement <4 x float> %3433, i32 1
  3433. %3436 = extractelement <4 x float> %3433, i32 2
  3434. %3437 = extractelement <4 x float> %3433, i32 3
  3435. %3438 = fmul float %3437, %3437
  3436. %3439 = fmul float %3424, %106
  3437. %3440 = fadd float %3439, %110
  3438. %3441 = fmul float %3425, %107
  3439. %3442 = fadd float %3441, %111
  3440. %3443 = fmul float %3440, %3440
  3441. %3444 = fmul float %3442, %3442
  3442. %3445 = fadd float %3444, %3443
  3443. %3446 = fadd float %3445, 1.000000e+00
  3444. %3447 = call float @fabs(float %3446)
  3445. %3448 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3447)
  3446. %3449 = call float @llvm.minnum.f32(float %3448, float 0x47EFFFFFE0000000)
  3447. %3450 = fmul float %3449, %3440
  3448. %3451 = fmul float %3449, %3442
  3449. %3452 = fmul float %3449, %3438
  3450. %3453 = fmul float %3450, %3438
  3451. %3454 = fsub float %3453, %101
  3452. %3455 = fmul float %3451, %3438
  3453. %3456 = fsub float %3455, %102
  3454. %3457 = fsub float -0.000000e+00, %103
  3455. %3458 = fsub float %3457, %3452
  3456. %3459 = fmul float %3454, %3454
  3457. %3460 = fmul float %3456, %3456
  3458. %3461 = fadd float %3460, %3459
  3459. %3462 = fmul float %3458, %3458
  3460. %3463 = fadd float %3461, %3462
  3461. %3464 = fmul float %32, %3463
  3462. %3465 = fsub float 1.000000e+00, %3464
  3463. %3466 = call float @llvm.AMDIL.clamp.(float %3465, float 0.000000e+00, float 1.000000e+00)
  3464. %3467 = call float @fabs(float %3463)
  3465. %3468 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3467)
  3466. %3469 = call float @llvm.minnum.f32(float %3468, float 0x47EFFFFFE0000000)
  3467. %3470 = fmul float %3469, %3454
  3468. %3471 = fmul float %3469, %3456
  3469. %3472 = fmul float %3469, %3458
  3470. %3473 = fmul float %3470, %3434
  3471. %3474 = fmul float %3471, %3435
  3472. %3475 = fadd float %3474, %3473
  3473. %3476 = fmul float %3472, %3436
  3474. %3477 = fadd float %3475, %3476
  3475. %3478 = fsub float %33, %3477
  3476. %3479 = call float @llvm.AMDIL.clamp.(float %3478, float 0.000000e+00, float 1.000000e+00)
  3477. %3480 = fmul float %3470, %68
  3478. %3481 = fmul float %3471, %69
  3479. %3482 = fadd float %3481, %3480
  3480. %3483 = fmul float %3472, %70
  3481. %3484 = fadd float %3482, %3483
  3482. %3485 = fadd float %3484, %34
  3483. %3486 = call float @llvm.AMDIL.clamp.(float %3485, float 0.000000e+00, float 1.000000e+00)
  3484. %3487 = fmul float %3479, %3486
  3485. %3488 = fmul float %3487, %3466
  3486. %3489 = bitcast float %3424 to i32
  3487. %3490 = bitcast float %3425 to i32
  3488. %3491 = insertelement <4 x i32> undef, i32 %3489, i32 0
  3489. %3492 = insertelement <4 x i32> %3491, i32 %3490, i32 1
  3490. %3493 = insertelement <4 x i32> %3492, i32 0, i32 2
  3491. %3494 = bitcast <8 x i32> %42 to <32 x i8>
  3492. %3495 = bitcast <4 x i32> %44 to <16 x i8>
  3493. %3496 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3493, <32 x i8> %3494, <16 x i8> %3495, i32 2)
  3494. %3497 = extractelement <4 x float> %3496, i32 0
  3495. %3498 = extractelement <4 x float> %3496, i32 1
  3496. %3499 = extractelement <4 x float> %3496, i32 2
  3497. %3500 = fmul float %3497, %3488
  3498. %3501 = fadd float %3500, %3403
  3499. %3502 = fmul float %3498, %3488
  3500. %3503 = fadd float %3502, %3405
  3501. %3504 = fmul float %3499, %3488
  3502. %3505 = fadd float %3504, %3407
  3503. %3506 = call float @llvm.AMDIL.clamp.(float %3417, float 0.000000e+00, float 1.000000e+00)
  3504. %3507 = call float @llvm.AMDIL.clamp.(float %3419, float 0.000000e+00, float 1.000000e+00)
  3505. %3508 = bitcast float %3506 to i32
  3506. %3509 = bitcast float %3507 to i32
  3507. %3510 = insertelement <4 x i32> undef, i32 %3508, i32 0
  3508. %3511 = insertelement <4 x i32> %3510, i32 %3509, i32 1
  3509. %3512 = insertelement <4 x i32> %3511, i32 0, i32 2
  3510. %3513 = bitcast <8 x i32> %38 to <32 x i8>
  3511. %3514 = bitcast <4 x i32> %40 to <16 x i8>
  3512. %3515 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3512, <32 x i8> %3513, <16 x i8> %3514, i32 2)
  3513. %3516 = extractelement <4 x float> %3515, i32 0
  3514. %3517 = extractelement <4 x float> %3515, i32 1
  3515. %3518 = extractelement <4 x float> %3515, i32 2
  3516. %3519 = extractelement <4 x float> %3515, i32 3
  3517. %3520 = fmul float %3519, %3519
  3518. %3521 = fmul float %3506, %106
  3519. %3522 = fadd float %3521, %110
  3520. %3523 = fmul float %3507, %107
  3521. %3524 = fadd float %3523, %111
  3522. %3525 = fmul float %3522, %3522
  3523. %3526 = fmul float %3524, %3524
  3524. %3527 = fadd float %3526, %3525
  3525. %3528 = fadd float %3527, 1.000000e+00
  3526. %3529 = call float @fabs(float %3528)
  3527. %3530 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3529)
  3528. %3531 = call float @llvm.minnum.f32(float %3530, float 0x47EFFFFFE0000000)
  3529. %3532 = fmul float %3531, %3522
  3530. %3533 = fmul float %3531, %3524
  3531. %3534 = fmul float %3531, %3520
  3532. %3535 = fmul float %3532, %3520
  3533. %3536 = fsub float %3535, %101
  3534. %3537 = fmul float %3533, %3520
  3535. %3538 = fsub float %3537, %102
  3536. %3539 = fsub float -0.000000e+00, %103
  3537. %3540 = fsub float %3539, %3534
  3538. %3541 = fmul float %3536, %3536
  3539. %3542 = fmul float %3538, %3538
  3540. %3543 = fadd float %3542, %3541
  3541. %3544 = fmul float %3540, %3540
  3542. %3545 = fadd float %3543, %3544
  3543. %3546 = fmul float %32, %3545
  3544. %3547 = fsub float 1.000000e+00, %3546
  3545. %3548 = call float @llvm.AMDIL.clamp.(float %3547, float 0.000000e+00, float 1.000000e+00)
  3546. %3549 = call float @fabs(float %3545)
  3547. %3550 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3549)
  3548. %3551 = call float @llvm.minnum.f32(float %3550, float 0x47EFFFFFE0000000)
  3549. %3552 = fmul float %3551, %3536
  3550. %3553 = fmul float %3551, %3538
  3551. %3554 = fmul float %3551, %3540
  3552. %3555 = fmul float %3552, %3516
  3553. %3556 = fmul float %3553, %3517
  3554. %3557 = fadd float %3556, %3555
  3555. %3558 = fmul float %3554, %3518
  3556. %3559 = fadd float %3557, %3558
  3557. %3560 = fsub float %33, %3559
  3558. %3561 = call float @llvm.AMDIL.clamp.(float %3560, float 0.000000e+00, float 1.000000e+00)
  3559. %3562 = fmul float %3552, %68
  3560. %3563 = fmul float %3553, %69
  3561. %3564 = fadd float %3563, %3562
  3562. %3565 = fmul float %3554, %70
  3563. %3566 = fadd float %3564, %3565
  3564. %3567 = fadd float %3566, %34
  3565. %3568 = call float @llvm.AMDIL.clamp.(float %3567, float 0.000000e+00, float 1.000000e+00)
  3566. %3569 = fmul float %3561, %3568
  3567. %3570 = fmul float %3569, %3548
  3568. %3571 = bitcast float %3506 to i32
  3569. %3572 = bitcast float %3507 to i32
  3570. %3573 = insertelement <4 x i32> undef, i32 %3571, i32 0
  3571. %3574 = insertelement <4 x i32> %3573, i32 %3572, i32 1
  3572. %3575 = insertelement <4 x i32> %3574, i32 0, i32 2
  3573. %3576 = bitcast <8 x i32> %42 to <32 x i8>
  3574. %3577 = bitcast <4 x i32> %44 to <16 x i8>
  3575. %3578 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3575, <32 x i8> %3576, <16 x i8> %3577, i32 2)
  3576. %3579 = extractelement <4 x float> %3578, i32 0
  3577. %3580 = extractelement <4 x float> %3578, i32 1
  3578. %3581 = extractelement <4 x float> %3578, i32 2
  3579. %3582 = fmul float %3579, %3570
  3580. %3583 = fadd float %3582, %3501
  3581. %3584 = fmul float %3580, %3570
  3582. %3585 = fadd float %3584, %3503
  3583. %3586 = fmul float %3581, %3570
  3584. %3587 = fadd float %3586, %3505
  3585. %3588 = fmul float %88, 0xBFD72B0200000000
  3586. %3589 = fmul float %87, 0x3FD72B0200000000
  3587. %3590 = fmul float %88, 0xBFE30A3D80000000
  3588. %3591 = fmul float %87, 0x3FE30A3D80000000
  3589. %3592 = fmul float %87, 0x3FEDD2F1A0000000
  3590. %3593 = fadd float %3592, %3588
  3591. %3594 = fmul float %90, 0x3FEDD2F1A0000000
  3592. %3595 = fadd float %3594, %3589
  3593. %3596 = fmul float %87, 0x3FEDD2F1A0000000
  3594. %3597 = fadd float %3596, %3588
  3595. %3598 = fmul float %90, 0x3FEDD2F1A0000000
  3596. %3599 = fadd float %3598, %3589
  3597. %3600 = fmul float %3597, 0x3FE69FBE80000000
  3598. %3601 = fadd float %3600, %51
  3599. %3602 = fmul float %3599, 0x3FE69FBE80000000
  3600. %3603 = fadd float %3602, %52
  3601. %3604 = fmul float %3593, 0x3FDD4FDF40000000
  3602. %3605 = fadd float %3604, %51
  3603. %3606 = fmul float %3595, 0x3FDD4FDF40000000
  3604. %3607 = fadd float %3606, %52
  3605. %3608 = call float @llvm.AMDIL.clamp.(float %3605, float 0.000000e+00, float 1.000000e+00)
  3606. %3609 = call float @llvm.AMDIL.clamp.(float %3607, float 0.000000e+00, float 1.000000e+00)
  3607. %3610 = bitcast float %3608 to i32
  3608. %3611 = bitcast float %3609 to i32
  3609. %3612 = insertelement <4 x i32> undef, i32 %3610, i32 0
  3610. %3613 = insertelement <4 x i32> %3612, i32 %3611, i32 1
  3611. %3614 = insertelement <4 x i32> %3613, i32 0, i32 2
  3612. %3615 = bitcast <8 x i32> %38 to <32 x i8>
  3613. %3616 = bitcast <4 x i32> %40 to <16 x i8>
  3614. %3617 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3614, <32 x i8> %3615, <16 x i8> %3616, i32 2)
  3615. %3618 = extractelement <4 x float> %3617, i32 0
  3616. %3619 = extractelement <4 x float> %3617, i32 1
  3617. %3620 = extractelement <4 x float> %3617, i32 2
  3618. %3621 = extractelement <4 x float> %3617, i32 3
  3619. %3622 = fmul float %3621, %3621
  3620. %3623 = fmul float %3608, %106
  3621. %3624 = fadd float %3623, %110
  3622. %3625 = fmul float %3609, %107
  3623. %3626 = fadd float %3625, %111
  3624. %3627 = fmul float %3624, %3624
  3625. %3628 = fmul float %3626, %3626
  3626. %3629 = fadd float %3628, %3627
  3627. %3630 = fadd float %3629, 1.000000e+00
  3628. %3631 = call float @fabs(float %3630)
  3629. %3632 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3631)
  3630. %3633 = call float @llvm.minnum.f32(float %3632, float 0x47EFFFFFE0000000)
  3631. %3634 = fmul float %3633, %3624
  3632. %3635 = fmul float %3633, %3626
  3633. %3636 = fmul float %3633, %3622
  3634. %3637 = fmul float %3634, %3622
  3635. %3638 = fsub float %3637, %101
  3636. %3639 = fmul float %3635, %3622
  3637. %3640 = fsub float %3639, %102
  3638. %3641 = fsub float -0.000000e+00, %103
  3639. %3642 = fsub float %3641, %3636
  3640. %3643 = fmul float %3638, %3638
  3641. %3644 = fmul float %3640, %3640
  3642. %3645 = fadd float %3644, %3643
  3643. %3646 = fmul float %3642, %3642
  3644. %3647 = fadd float %3645, %3646
  3645. %3648 = fmul float %32, %3647
  3646. %3649 = fsub float 1.000000e+00, %3648
  3647. %3650 = call float @llvm.AMDIL.clamp.(float %3649, float 0.000000e+00, float 1.000000e+00)
  3648. %3651 = call float @fabs(float %3647)
  3649. %3652 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3651)
  3650. %3653 = call float @llvm.minnum.f32(float %3652, float 0x47EFFFFFE0000000)
  3651. %3654 = fmul float %3653, %3638
  3652. %3655 = fmul float %3653, %3640
  3653. %3656 = fmul float %3653, %3642
  3654. %3657 = fmul float %3654, %3618
  3655. %3658 = fmul float %3655, %3619
  3656. %3659 = fadd float %3658, %3657
  3657. %3660 = fmul float %3656, %3620
  3658. %3661 = fadd float %3659, %3660
  3659. %3662 = fsub float %33, %3661
  3660. %3663 = call float @llvm.AMDIL.clamp.(float %3662, float 0.000000e+00, float 1.000000e+00)
  3661. %3664 = fmul float %3654, %68
  3662. %3665 = fmul float %3655, %69
  3663. %3666 = fadd float %3665, %3664
  3664. %3667 = fmul float %3656, %70
  3665. %3668 = fadd float %3666, %3667
  3666. %3669 = fadd float %3668, %34
  3667. %3670 = call float @llvm.AMDIL.clamp.(float %3669, float 0.000000e+00, float 1.000000e+00)
  3668. %3671 = fmul float %3663, %3670
  3669. %3672 = fmul float %3671, %3650
  3670. %3673 = bitcast float %3608 to i32
  3671. %3674 = bitcast float %3609 to i32
  3672. %3675 = insertelement <4 x i32> undef, i32 %3673, i32 0
  3673. %3676 = insertelement <4 x i32> %3675, i32 %3674, i32 1
  3674. %3677 = insertelement <4 x i32> %3676, i32 0, i32 2
  3675. %3678 = bitcast <8 x i32> %42 to <32 x i8>
  3676. %3679 = bitcast <4 x i32> %44 to <16 x i8>
  3677. %3680 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3677, <32 x i8> %3678, <16 x i8> %3679, i32 2)
  3678. %3681 = extractelement <4 x float> %3680, i32 0
  3679. %3682 = extractelement <4 x float> %3680, i32 1
  3680. %3683 = extractelement <4 x float> %3680, i32 2
  3681. %3684 = fmul float %3681, %3672
  3682. %3685 = fadd float %3684, %3583
  3683. %3686 = fmul float %3682, %3672
  3684. %3687 = fadd float %3686, %3585
  3685. %3688 = fmul float %3683, %3672
  3686. %3689 = fadd float %3688, %3587
  3687. %3690 = call float @llvm.AMDIL.clamp.(float %3601, float 0.000000e+00, float 1.000000e+00)
  3688. %3691 = call float @llvm.AMDIL.clamp.(float %3603, float 0.000000e+00, float 1.000000e+00)
  3689. %3692 = bitcast float %3690 to i32
  3690. %3693 = bitcast float %3691 to i32
  3691. %3694 = insertelement <4 x i32> undef, i32 %3692, i32 0
  3692. %3695 = insertelement <4 x i32> %3694, i32 %3693, i32 1
  3693. %3696 = insertelement <4 x i32> %3695, i32 0, i32 2
  3694. %3697 = bitcast <8 x i32> %38 to <32 x i8>
  3695. %3698 = bitcast <4 x i32> %40 to <16 x i8>
  3696. %3699 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3696, <32 x i8> %3697, <16 x i8> %3698, i32 2)
  3697. %3700 = extractelement <4 x float> %3699, i32 0
  3698. %3701 = extractelement <4 x float> %3699, i32 1
  3699. %3702 = extractelement <4 x float> %3699, i32 2
  3700. %3703 = extractelement <4 x float> %3699, i32 3
  3701. %3704 = fmul float %3703, %3703
  3702. %3705 = fmul float %3690, %106
  3703. %3706 = fadd float %3705, %110
  3704. %3707 = fmul float %3691, %107
  3705. %3708 = fadd float %3707, %111
  3706. %3709 = fmul float %3706, %3706
  3707. %3710 = fmul float %3708, %3708
  3708. %3711 = fadd float %3710, %3709
  3709. %3712 = fadd float %3711, 1.000000e+00
  3710. %3713 = call float @fabs(float %3712)
  3711. %3714 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3713)
  3712. %3715 = call float @llvm.minnum.f32(float %3714, float 0x47EFFFFFE0000000)
  3713. %3716 = fmul float %3715, %3706
  3714. %3717 = fmul float %3715, %3708
  3715. %3718 = fmul float %3715, %3704
  3716. %3719 = fmul float %3716, %3704
  3717. %3720 = fsub float %3719, %101
  3718. %3721 = fmul float %3717, %3704
  3719. %3722 = fsub float %3721, %102
  3720. %3723 = fsub float -0.000000e+00, %103
  3721. %3724 = fsub float %3723, %3718
  3722. %3725 = fmul float %3720, %3720
  3723. %3726 = fmul float %3722, %3722
  3724. %3727 = fadd float %3726, %3725
  3725. %3728 = fmul float %3724, %3724
  3726. %3729 = fadd float %3727, %3728
  3727. %3730 = fmul float %32, %3729
  3728. %3731 = fsub float 1.000000e+00, %3730
  3729. %3732 = call float @llvm.AMDIL.clamp.(float %3731, float 0.000000e+00, float 1.000000e+00)
  3730. %3733 = call float @fabs(float %3729)
  3731. %3734 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3733)
  3732. %3735 = call float @llvm.minnum.f32(float %3734, float 0x47EFFFFFE0000000)
  3733. %3736 = fmul float %3735, %3720
  3734. %3737 = fmul float %3735, %3722
  3735. %3738 = fmul float %3735, %3724
  3736. %3739 = fmul float %3736, %3700
  3737. %3740 = fmul float %3737, %3701
  3738. %3741 = fadd float %3740, %3739
  3739. %3742 = fmul float %3738, %3702
  3740. %3743 = fadd float %3741, %3742
  3741. %3744 = fsub float %33, %3743
  3742. %3745 = call float @llvm.AMDIL.clamp.(float %3744, float 0.000000e+00, float 1.000000e+00)
  3743. %3746 = fmul float %3736, %68
  3744. %3747 = fmul float %3737, %69
  3745. %3748 = fadd float %3747, %3746
  3746. %3749 = fmul float %3738, %70
  3747. %3750 = fadd float %3748, %3749
  3748. %3751 = fadd float %3750, %34
  3749. %3752 = call float @llvm.AMDIL.clamp.(float %3751, float 0.000000e+00, float 1.000000e+00)
  3750. %3753 = fmul float %3745, %3752
  3751. %3754 = fmul float %3753, %3732
  3752. %3755 = bitcast float %3690 to i32
  3753. %3756 = bitcast float %3691 to i32
  3754. %3757 = insertelement <4 x i32> undef, i32 %3755, i32 0
  3755. %3758 = insertelement <4 x i32> %3757, i32 %3756, i32 1
  3756. %3759 = insertelement <4 x i32> %3758, i32 0, i32 2
  3757. %3760 = bitcast <8 x i32> %42 to <32 x i8>
  3758. %3761 = bitcast <4 x i32> %44 to <16 x i8>
  3759. %3762 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3759, <32 x i8> %3760, <16 x i8> %3761, i32 2)
  3760. %3763 = extractelement <4 x float> %3762, i32 0
  3761. %3764 = extractelement <4 x float> %3762, i32 1
  3762. %3765 = extractelement <4 x float> %3762, i32 2
  3763. %3766 = fmul float %3763, %3754
  3764. %3767 = fadd float %3766, %3685
  3765. %3768 = fmul float %3764, %3754
  3766. %3769 = fadd float %3768, %3687
  3767. %3770 = fmul float %3765, %3754
  3768. %3771 = fadd float %3770, %3689
  3769. %3772 = fmul float %87, 0x3FE9BA5E40000000
  3770. %3773 = fadd float %3772, %3590
  3771. %3774 = fmul float %90, 0x3FE9BA5E40000000
  3772. %3775 = fadd float %3774, %3591
  3773. %3776 = fmul float %87, 0x3FE9BA5E40000000
  3774. %3777 = fadd float %3776, %3590
  3775. %3778 = fmul float %90, 0x3FE9BA5E40000000
  3776. %3779 = fadd float %3778, %3591
  3777. %3780 = fmul float %3777, 0x3FEC51EB80000000
  3778. %3781 = fadd float %3780, %51
  3779. %3782 = fmul float %3779, 0x3FEC51EB80000000
  3780. %3783 = fadd float %3782, %52
  3781. %3784 = fmul float %3773, 0x3FCBA5E360000000
  3782. %3785 = fadd float %3784, %51
  3783. %3786 = fmul float %3775, 0x3FCBA5E360000000
  3784. %3787 = fadd float %3786, %52
  3785. %3788 = call float @llvm.AMDIL.clamp.(float %3785, float 0.000000e+00, float 1.000000e+00)
  3786. %3789 = call float @llvm.AMDIL.clamp.(float %3787, float 0.000000e+00, float 1.000000e+00)
  3787. %3790 = bitcast float %3788 to i32
  3788. %3791 = bitcast float %3789 to i32
  3789. %3792 = insertelement <4 x i32> undef, i32 %3790, i32 0
  3790. %3793 = insertelement <4 x i32> %3792, i32 %3791, i32 1
  3791. %3794 = insertelement <4 x i32> %3793, i32 0, i32 2
  3792. %3795 = bitcast <8 x i32> %38 to <32 x i8>
  3793. %3796 = bitcast <4 x i32> %40 to <16 x i8>
  3794. %3797 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3794, <32 x i8> %3795, <16 x i8> %3796, i32 2)
  3795. %3798 = extractelement <4 x float> %3797, i32 0
  3796. %3799 = extractelement <4 x float> %3797, i32 1
  3797. %3800 = extractelement <4 x float> %3797, i32 2
  3798. %3801 = extractelement <4 x float> %3797, i32 3
  3799. %3802 = fmul float %3801, %3801
  3800. %3803 = fmul float %3788, %106
  3801. %3804 = fadd float %3803, %110
  3802. %3805 = fmul float %3789, %107
  3803. %3806 = fadd float %3805, %111
  3804. %3807 = fmul float %3804, %3804
  3805. %3808 = fmul float %3806, %3806
  3806. %3809 = fadd float %3808, %3807
  3807. %3810 = fadd float %3809, 1.000000e+00
  3808. %3811 = call float @fabs(float %3810)
  3809. %3812 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3811)
  3810. %3813 = call float @llvm.minnum.f32(float %3812, float 0x47EFFFFFE0000000)
  3811. %3814 = fmul float %3813, %3804
  3812. %3815 = fmul float %3813, %3806
  3813. %3816 = fmul float %3813, %3802
  3814. %3817 = fmul float %3814, %3802
  3815. %3818 = fsub float %3817, %101
  3816. %3819 = fmul float %3815, %3802
  3817. %3820 = fsub float %3819, %102
  3818. %3821 = fsub float -0.000000e+00, %103
  3819. %3822 = fsub float %3821, %3816
  3820. %3823 = fmul float %3818, %3818
  3821. %3824 = fmul float %3820, %3820
  3822. %3825 = fadd float %3824, %3823
  3823. %3826 = fmul float %3822, %3822
  3824. %3827 = fadd float %3825, %3826
  3825. %3828 = fmul float %32, %3827
  3826. %3829 = fsub float 1.000000e+00, %3828
  3827. %3830 = call float @llvm.AMDIL.clamp.(float %3829, float 0.000000e+00, float 1.000000e+00)
  3828. %3831 = call float @fabs(float %3827)
  3829. %3832 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3831)
  3830. %3833 = call float @llvm.minnum.f32(float %3832, float 0x47EFFFFFE0000000)
  3831. %3834 = fmul float %3833, %3818
  3832. %3835 = fmul float %3833, %3820
  3833. %3836 = fmul float %3833, %3822
  3834. %3837 = fmul float %3834, %3798
  3835. %3838 = fmul float %3835, %3799
  3836. %3839 = fadd float %3838, %3837
  3837. %3840 = fmul float %3836, %3800
  3838. %3841 = fadd float %3839, %3840
  3839. %3842 = fsub float %33, %3841
  3840. %3843 = call float @llvm.AMDIL.clamp.(float %3842, float 0.000000e+00, float 1.000000e+00)
  3841. %3844 = fmul float %3834, %68
  3842. %3845 = fmul float %3835, %69
  3843. %3846 = fadd float %3845, %3844
  3844. %3847 = fmul float %3836, %70
  3845. %3848 = fadd float %3846, %3847
  3846. %3849 = fadd float %3848, %34
  3847. %3850 = call float @llvm.AMDIL.clamp.(float %3849, float 0.000000e+00, float 1.000000e+00)
  3848. %3851 = fmul float %3843, %3850
  3849. %3852 = fmul float %3851, %3830
  3850. %3853 = bitcast float %3788 to i32
  3851. %3854 = bitcast float %3789 to i32
  3852. %3855 = insertelement <4 x i32> undef, i32 %3853, i32 0
  3853. %3856 = insertelement <4 x i32> %3855, i32 %3854, i32 1
  3854. %3857 = insertelement <4 x i32> %3856, i32 0, i32 2
  3855. %3858 = bitcast <8 x i32> %42 to <32 x i8>
  3856. %3859 = bitcast <4 x i32> %44 to <16 x i8>
  3857. %3860 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3857, <32 x i8> %3858, <16 x i8> %3859, i32 2)
  3858. %3861 = extractelement <4 x float> %3860, i32 0
  3859. %3862 = extractelement <4 x float> %3860, i32 1
  3860. %3863 = extractelement <4 x float> %3860, i32 2
  3861. %3864 = fmul float %3861, %3852
  3862. %3865 = fadd float %3864, %3767
  3863. %3866 = fmul float %3862, %3852
  3864. %3867 = fadd float %3866, %3769
  3865. %3868 = fmul float %3863, %3852
  3866. %3869 = fadd float %3868, %3771
  3867. %3870 = call float @llvm.AMDIL.clamp.(float %3781, float 0.000000e+00, float 1.000000e+00)
  3868. %3871 = call float @llvm.AMDIL.clamp.(float %3783, float 0.000000e+00, float 1.000000e+00)
  3869. %3872 = bitcast float %3870 to i32
  3870. %3873 = bitcast float %3871 to i32
  3871. %3874 = insertelement <4 x i32> undef, i32 %3872, i32 0
  3872. %3875 = insertelement <4 x i32> %3874, i32 %3873, i32 1
  3873. %3876 = insertelement <4 x i32> %3875, i32 0, i32 2
  3874. %3877 = bitcast <8 x i32> %38 to <32 x i8>
  3875. %3878 = bitcast <4 x i32> %40 to <16 x i8>
  3876. %3879 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3876, <32 x i8> %3877, <16 x i8> %3878, i32 2)
  3877. %3880 = extractelement <4 x float> %3879, i32 0
  3878. %3881 = extractelement <4 x float> %3879, i32 1
  3879. %3882 = extractelement <4 x float> %3879, i32 2
  3880. %3883 = extractelement <4 x float> %3879, i32 3
  3881. %3884 = fmul float %3883, %3883
  3882. %3885 = fmul float %3870, %106
  3883. %3886 = fadd float %3885, %110
  3884. %3887 = fmul float %3871, %107
  3885. %3888 = fadd float %3887, %111
  3886. %3889 = fmul float %3886, %3886
  3887. %3890 = fmul float %3888, %3888
  3888. %3891 = fadd float %3890, %3889
  3889. %3892 = fadd float %3891, 1.000000e+00
  3890. %3893 = call float @fabs(float %3892)
  3891. %3894 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3893)
  3892. %3895 = call float @llvm.minnum.f32(float %3894, float 0x47EFFFFFE0000000)
  3893. %3896 = fmul float %3895, %3886
  3894. %3897 = fmul float %3895, %3888
  3895. %3898 = fmul float %3895, %3884
  3896. %3899 = fmul float %3896, %3884
  3897. %3900 = fsub float %3899, %101
  3898. %3901 = fmul float %3897, %3884
  3899. %3902 = fsub float %3901, %102
  3900. %3903 = fsub float -0.000000e+00, %103
  3901. %3904 = fsub float %3903, %3898
  3902. %3905 = fmul float %3900, %3900
  3903. %3906 = fmul float %3902, %3902
  3904. %3907 = fadd float %3906, %3905
  3905. %3908 = fmul float %3904, %3904
  3906. %3909 = fadd float %3907, %3908
  3907. %3910 = fmul float %32, %3909
  3908. %3911 = fsub float 1.000000e+00, %3910
  3909. %3912 = call float @llvm.AMDIL.clamp.(float %3911, float 0.000000e+00, float 1.000000e+00)
  3910. %3913 = call float @fabs(float %3909)
  3911. %3914 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3913)
  3912. %3915 = call float @llvm.minnum.f32(float %3914, float 0x47EFFFFFE0000000)
  3913. %3916 = fmul float %3915, %3900
  3914. %3917 = fmul float %3915, %3902
  3915. %3918 = fmul float %3915, %3904
  3916. %3919 = fmul float %3916, %3880
  3917. %3920 = fmul float %3917, %3881
  3918. %3921 = fadd float %3920, %3919
  3919. %3922 = fmul float %3918, %3882
  3920. %3923 = fadd float %3921, %3922
  3921. %3924 = fsub float %33, %3923
  3922. %3925 = call float @llvm.AMDIL.clamp.(float %3924, float 0.000000e+00, float 1.000000e+00)
  3923. %3926 = fmul float %3916, %68
  3924. %3927 = fmul float %3917, %69
  3925. %3928 = fadd float %3927, %3926
  3926. %3929 = fmul float %3918, %70
  3927. %3930 = fadd float %3928, %3929
  3928. %3931 = fadd float %3930, %34
  3929. %3932 = call float @llvm.AMDIL.clamp.(float %3931, float 0.000000e+00, float 1.000000e+00)
  3930. %3933 = fmul float %3925, %3932
  3931. %3934 = fmul float %3933, %3912
  3932. %3935 = bitcast float %3870 to i32
  3933. %3936 = bitcast float %3871 to i32
  3934. %3937 = insertelement <4 x i32> undef, i32 %3935, i32 0
  3935. %3938 = insertelement <4 x i32> %3937, i32 %3936, i32 1
  3936. %3939 = insertelement <4 x i32> %3938, i32 0, i32 2
  3937. %3940 = bitcast <8 x i32> %42 to <32 x i8>
  3938. %3941 = bitcast <4 x i32> %44 to <16 x i8>
  3939. %3942 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3939, <32 x i8> %3940, <16 x i8> %3941, i32 2)
  3940. %3943 = extractelement <4 x float> %3942, i32 0
  3941. %3944 = extractelement <4 x float> %3942, i32 1
  3942. %3945 = extractelement <4 x float> %3942, i32 2
  3943. %3946 = fmul float %3943, %3934
  3944. %3947 = fadd float %3946, %3865
  3945. %3948 = fmul float %3944, %3934
  3946. %3949 = fadd float %3948, %3867
  3947. %3950 = fmul float %3945, %3934
  3948. %3951 = fadd float %3950, %3869
  3949. %3952 = fmul float %88, 0xBFECE56040000000
  3950. %3953 = fmul float %87, 0x3FECE56040000000
  3951. %3954 = fmul float %88, 0xBFE0083120000000
  3952. %3955 = fmul float %87, 0x3FE0083120000000
  3953. %3956 = fmul float %87, 0x3FDB851EC0000000
  3954. %3957 = fadd float %3956, %3952
  3955. %3958 = fmul float %90, 0x3FDB851EC0000000
  3956. %3959 = fadd float %3958, %3953
  3957. %3960 = fmul float %87, 0x3FDB851EC0000000
  3958. %3961 = fadd float %3960, %3952
  3959. %3962 = fmul float %90, 0x3FDB851EC0000000
  3960. %3963 = fadd float %3962, %3953
  3961. %3964 = fmul float %3961, 0x3FEF3B6460000000
  3962. %3965 = fadd float %3964, %51
  3963. %3966 = fmul float %3963, 0x3FEF3B6460000000
  3964. %3967 = fadd float %3966, %52
  3965. %3968 = fmul float %3957, 0x3FDFCED920000000
  3966. %3969 = fadd float %3968, %51
  3967. %3970 = fmul float %3959, 0x3FDFCED920000000
  3968. %3971 = fadd float %3970, %52
  3969. %3972 = call float @llvm.AMDIL.clamp.(float %3969, float 0.000000e+00, float 1.000000e+00)
  3970. %3973 = call float @llvm.AMDIL.clamp.(float %3971, float 0.000000e+00, float 1.000000e+00)
  3971. %3974 = bitcast float %3972 to i32
  3972. %3975 = bitcast float %3973 to i32
  3973. %3976 = insertelement <4 x i32> undef, i32 %3974, i32 0
  3974. %3977 = insertelement <4 x i32> %3976, i32 %3975, i32 1
  3975. %3978 = insertelement <4 x i32> %3977, i32 0, i32 2
  3976. %3979 = bitcast <8 x i32> %38 to <32 x i8>
  3977. %3980 = bitcast <4 x i32> %40 to <16 x i8>
  3978. %3981 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %3978, <32 x i8> %3979, <16 x i8> %3980, i32 2)
  3979. %3982 = extractelement <4 x float> %3981, i32 0
  3980. %3983 = extractelement <4 x float> %3981, i32 1
  3981. %3984 = extractelement <4 x float> %3981, i32 2
  3982. %3985 = extractelement <4 x float> %3981, i32 3
  3983. %3986 = fmul float %3985, %3985
  3984. %3987 = fmul float %3972, %106
  3985. %3988 = fadd float %3987, %110
  3986. %3989 = fmul float %3973, %107
  3987. %3990 = fadd float %3989, %111
  3988. %3991 = fmul float %3988, %3988
  3989. %3992 = fmul float %3990, %3990
  3990. %3993 = fadd float %3992, %3991
  3991. %3994 = fadd float %3993, 1.000000e+00
  3992. %3995 = call float @fabs(float %3994)
  3993. %3996 = call float @llvm.AMDGPU.rsq.clamped.f32(float %3995)
  3994. %3997 = call float @llvm.minnum.f32(float %3996, float 0x47EFFFFFE0000000)
  3995. %3998 = fmul float %3997, %3988
  3996. %3999 = fmul float %3997, %3990
  3997. %4000 = fmul float %3997, %3986
  3998. %4001 = fmul float %3998, %3986
  3999. %4002 = fsub float %4001, %101
  4000. %4003 = fmul float %3999, %3986
  4001. %4004 = fsub float %4003, %102
  4002. %4005 = fsub float -0.000000e+00, %103
  4003. %4006 = fsub float %4005, %4000
  4004. %4007 = fmul float %4002, %4002
  4005. %4008 = fmul float %4004, %4004
  4006. %4009 = fadd float %4008, %4007
  4007. %4010 = fmul float %4006, %4006
  4008. %4011 = fadd float %4009, %4010
  4009. %4012 = fmul float %32, %4011
  4010. %4013 = fsub float 1.000000e+00, %4012
  4011. %4014 = call float @llvm.AMDIL.clamp.(float %4013, float 0.000000e+00, float 1.000000e+00)
  4012. %4015 = call float @fabs(float %4011)
  4013. %4016 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4015)
  4014. %4017 = call float @llvm.minnum.f32(float %4016, float 0x47EFFFFFE0000000)
  4015. %4018 = fmul float %4017, %4002
  4016. %4019 = fmul float %4017, %4004
  4017. %4020 = fmul float %4017, %4006
  4018. %4021 = fmul float %4018, %3982
  4019. %4022 = fmul float %4019, %3983
  4020. %4023 = fadd float %4022, %4021
  4021. %4024 = fmul float %4020, %3984
  4022. %4025 = fadd float %4023, %4024
  4023. %4026 = fsub float %33, %4025
  4024. %4027 = call float @llvm.AMDIL.clamp.(float %4026, float 0.000000e+00, float 1.000000e+00)
  4025. %4028 = fmul float %4018, %68
  4026. %4029 = fmul float %4019, %69
  4027. %4030 = fadd float %4029, %4028
  4028. %4031 = fmul float %4020, %70
  4029. %4032 = fadd float %4030, %4031
  4030. %4033 = fadd float %4032, %34
  4031. %4034 = call float @llvm.AMDIL.clamp.(float %4033, float 0.000000e+00, float 1.000000e+00)
  4032. %4035 = fmul float %4027, %4034
  4033. %4036 = fmul float %4035, %4014
  4034. %4037 = bitcast float %3972 to i32
  4035. %4038 = bitcast float %3973 to i32
  4036. %4039 = insertelement <4 x i32> undef, i32 %4037, i32 0
  4037. %4040 = insertelement <4 x i32> %4039, i32 %4038, i32 1
  4038. %4041 = insertelement <4 x i32> %4040, i32 0, i32 2
  4039. %4042 = bitcast <8 x i32> %42 to <32 x i8>
  4040. %4043 = bitcast <4 x i32> %44 to <16 x i8>
  4041. %4044 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4041, <32 x i8> %4042, <16 x i8> %4043, i32 2)
  4042. %4045 = extractelement <4 x float> %4044, i32 0
  4043. %4046 = extractelement <4 x float> %4044, i32 1
  4044. %4047 = extractelement <4 x float> %4044, i32 2
  4045. %4048 = fmul float %4045, %4036
  4046. %4049 = fadd float %4048, %3947
  4047. %4050 = fmul float %4046, %4036
  4048. %4051 = fadd float %4050, %3949
  4049. %4052 = fmul float %4047, %4036
  4050. %4053 = fadd float %4052, %3951
  4051. %4054 = call float @llvm.AMDIL.clamp.(float %3965, float 0.000000e+00, float 1.000000e+00)
  4052. %4055 = call float @llvm.AMDIL.clamp.(float %3967, float 0.000000e+00, float 1.000000e+00)
  4053. %4056 = bitcast float %4054 to i32
  4054. %4057 = bitcast float %4055 to i32
  4055. %4058 = insertelement <4 x i32> undef, i32 %4056, i32 0
  4056. %4059 = insertelement <4 x i32> %4058, i32 %4057, i32 1
  4057. %4060 = insertelement <4 x i32> %4059, i32 0, i32 2
  4058. %4061 = bitcast <8 x i32> %38 to <32 x i8>
  4059. %4062 = bitcast <4 x i32> %40 to <16 x i8>
  4060. %4063 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4060, <32 x i8> %4061, <16 x i8> %4062, i32 2)
  4061. %4064 = extractelement <4 x float> %4063, i32 0
  4062. %4065 = extractelement <4 x float> %4063, i32 1
  4063. %4066 = extractelement <4 x float> %4063, i32 2
  4064. %4067 = extractelement <4 x float> %4063, i32 3
  4065. %4068 = fmul float %4067, %4067
  4066. %4069 = fmul float %4054, %106
  4067. %4070 = fadd float %4069, %110
  4068. %4071 = fmul float %4055, %107
  4069. %4072 = fadd float %4071, %111
  4070. %4073 = fmul float %4070, %4070
  4071. %4074 = fmul float %4072, %4072
  4072. %4075 = fadd float %4074, %4073
  4073. %4076 = fadd float %4075, 1.000000e+00
  4074. %4077 = call float @fabs(float %4076)
  4075. %4078 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4077)
  4076. %4079 = call float @llvm.minnum.f32(float %4078, float 0x47EFFFFFE0000000)
  4077. %4080 = fmul float %4079, %4070
  4078. %4081 = fmul float %4079, %4072
  4079. %4082 = fmul float %4079, %4068
  4080. %4083 = fmul float %4080, %4068
  4081. %4084 = fsub float %4083, %101
  4082. %4085 = fmul float %4081, %4068
  4083. %4086 = fsub float %4085, %102
  4084. %4087 = fsub float -0.000000e+00, %103
  4085. %4088 = fsub float %4087, %4082
  4086. %4089 = fmul float %4084, %4084
  4087. %4090 = fmul float %4086, %4086
  4088. %4091 = fadd float %4090, %4089
  4089. %4092 = fmul float %4088, %4088
  4090. %4093 = fadd float %4091, %4092
  4091. %4094 = fmul float %32, %4093
  4092. %4095 = fsub float 1.000000e+00, %4094
  4093. %4096 = call float @llvm.AMDIL.clamp.(float %4095, float 0.000000e+00, float 1.000000e+00)
  4094. %4097 = call float @fabs(float %4093)
  4095. %4098 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4097)
  4096. %4099 = call float @llvm.minnum.f32(float %4098, float 0x47EFFFFFE0000000)
  4097. %4100 = fmul float %4099, %4084
  4098. %4101 = fmul float %4099, %4086
  4099. %4102 = fmul float %4099, %4088
  4100. %4103 = fmul float %4100, %4064
  4101. %4104 = fmul float %4101, %4065
  4102. %4105 = fadd float %4104, %4103
  4103. %4106 = fmul float %4102, %4066
  4104. %4107 = fadd float %4105, %4106
  4105. %4108 = fsub float %33, %4107
  4106. %4109 = call float @llvm.AMDIL.clamp.(float %4108, float 0.000000e+00, float 1.000000e+00)
  4107. %4110 = fmul float %4100, %68
  4108. %4111 = fmul float %4101, %69
  4109. %4112 = fadd float %4111, %4110
  4110. %4113 = fmul float %4102, %70
  4111. %4114 = fadd float %4112, %4113
  4112. %4115 = fadd float %4114, %34
  4113. %4116 = call float @llvm.AMDIL.clamp.(float %4115, float 0.000000e+00, float 1.000000e+00)
  4114. %4117 = fmul float %4109, %4116
  4115. %4118 = fmul float %4117, %4096
  4116. %4119 = bitcast float %4054 to i32
  4117. %4120 = bitcast float %4055 to i32
  4118. %4121 = insertelement <4 x i32> undef, i32 %4119, i32 0
  4119. %4122 = insertelement <4 x i32> %4121, i32 %4120, i32 1
  4120. %4123 = insertelement <4 x i32> %4122, i32 0, i32 2
  4121. %4124 = bitcast <8 x i32> %42 to <32 x i8>
  4122. %4125 = bitcast <4 x i32> %44 to <16 x i8>
  4123. %4126 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4123, <32 x i8> %4124, <16 x i8> %4125, i32 2)
  4124. %4127 = extractelement <4 x float> %4126, i32 0
  4125. %4128 = extractelement <4 x float> %4126, i32 1
  4126. %4129 = extractelement <4 x float> %4126, i32 2
  4127. %4130 = fmul float %4127, %4118
  4128. %4131 = fadd float %4130, %4049
  4129. %4132 = fmul float %4128, %4118
  4130. %4133 = fadd float %4132, %4051
  4131. %4134 = fmul float %4129, %4118
  4132. %4135 = fadd float %4134, %4053
  4133. %4136 = fmul float %87, 0xBFDB851EC0000000
  4134. %4137 = fadd float %4136, %3952
  4135. %4138 = fmul float %90, 0xBFDB851EC0000000
  4136. %4139 = fadd float %4138, %3953
  4137. %4140 = fmul float %87, 0xBFDB851EC0000000
  4138. %4141 = fadd float %4140, %3952
  4139. %4142 = fmul float %90, 0xBFDB851EC0000000
  4140. %4143 = fadd float %4142, %3953
  4141. %4144 = fmul float %4141, 0x3FE36C8B40000000
  4142. %4145 = fadd float %4144, %51
  4143. %4146 = fmul float %4143, 0x3FE36C8B40000000
  4144. %4147 = fadd float %4146, %52
  4145. %4148 = fmul float %4137, 0x3FE1604180000000
  4146. %4149 = fadd float %4148, %51
  4147. %4150 = fmul float %4139, 0x3FE1604180000000
  4148. %4151 = fadd float %4150, %52
  4149. %4152 = call float @llvm.AMDIL.clamp.(float %4149, float 0.000000e+00, float 1.000000e+00)
  4150. %4153 = call float @llvm.AMDIL.clamp.(float %4151, float 0.000000e+00, float 1.000000e+00)
  4151. %4154 = bitcast float %4152 to i32
  4152. %4155 = bitcast float %4153 to i32
  4153. %4156 = insertelement <4 x i32> undef, i32 %4154, i32 0
  4154. %4157 = insertelement <4 x i32> %4156, i32 %4155, i32 1
  4155. %4158 = insertelement <4 x i32> %4157, i32 0, i32 2
  4156. %4159 = bitcast <8 x i32> %38 to <32 x i8>
  4157. %4160 = bitcast <4 x i32> %40 to <16 x i8>
  4158. %4161 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4158, <32 x i8> %4159, <16 x i8> %4160, i32 2)
  4159. %4162 = extractelement <4 x float> %4161, i32 0
  4160. %4163 = extractelement <4 x float> %4161, i32 1
  4161. %4164 = extractelement <4 x float> %4161, i32 2
  4162. %4165 = extractelement <4 x float> %4161, i32 3
  4163. %4166 = fmul float %4165, %4165
  4164. %4167 = fmul float %4152, %106
  4165. %4168 = fadd float %4167, %110
  4166. %4169 = fmul float %4153, %107
  4167. %4170 = fadd float %4169, %111
  4168. %4171 = fmul float %4168, %4168
  4169. %4172 = fmul float %4170, %4170
  4170. %4173 = fadd float %4172, %4171
  4171. %4174 = fadd float %4173, 1.000000e+00
  4172. %4175 = call float @fabs(float %4174)
  4173. %4176 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4175)
  4174. %4177 = call float @llvm.minnum.f32(float %4176, float 0x47EFFFFFE0000000)
  4175. %4178 = fmul float %4177, %4168
  4176. %4179 = fmul float %4177, %4170
  4177. %4180 = fmul float %4177, %4166
  4178. %4181 = fmul float %4178, %4166
  4179. %4182 = fsub float %4181, %101
  4180. %4183 = fmul float %4179, %4166
  4181. %4184 = fsub float %4183, %102
  4182. %4185 = fsub float -0.000000e+00, %103
  4183. %4186 = fsub float %4185, %4180
  4184. %4187 = fmul float %4182, %4182
  4185. %4188 = fmul float %4184, %4184
  4186. %4189 = fadd float %4188, %4187
  4187. %4190 = fmul float %4186, %4186
  4188. %4191 = fadd float %4189, %4190
  4189. %4192 = fmul float %32, %4191
  4190. %4193 = fsub float 1.000000e+00, %4192
  4191. %4194 = call float @llvm.AMDIL.clamp.(float %4193, float 0.000000e+00, float 1.000000e+00)
  4192. %4195 = call float @fabs(float %4191)
  4193. %4196 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4195)
  4194. %4197 = call float @llvm.minnum.f32(float %4196, float 0x47EFFFFFE0000000)
  4195. %4198 = fmul float %4197, %4182
  4196. %4199 = fmul float %4197, %4184
  4197. %4200 = fmul float %4197, %4186
  4198. %4201 = fmul float %4198, %4162
  4199. %4202 = fmul float %4199, %4163
  4200. %4203 = fadd float %4202, %4201
  4201. %4204 = fmul float %4200, %4164
  4202. %4205 = fadd float %4203, %4204
  4203. %4206 = fsub float %33, %4205
  4204. %4207 = call float @llvm.AMDIL.clamp.(float %4206, float 0.000000e+00, float 1.000000e+00)
  4205. %4208 = fmul float %4198, %68
  4206. %4209 = fmul float %4199, %69
  4207. %4210 = fadd float %4209, %4208
  4208. %4211 = fmul float %4200, %70
  4209. %4212 = fadd float %4210, %4211
  4210. %4213 = fadd float %4212, %34
  4211. %4214 = call float @llvm.AMDIL.clamp.(float %4213, float 0.000000e+00, float 1.000000e+00)
  4212. %4215 = fmul float %4207, %4214
  4213. %4216 = fmul float %4215, %4194
  4214. %4217 = bitcast float %4152 to i32
  4215. %4218 = bitcast float %4153 to i32
  4216. %4219 = insertelement <4 x i32> undef, i32 %4217, i32 0
  4217. %4220 = insertelement <4 x i32> %4219, i32 %4218, i32 1
  4218. %4221 = insertelement <4 x i32> %4220, i32 0, i32 2
  4219. %4222 = bitcast <8 x i32> %42 to <32 x i8>
  4220. %4223 = bitcast <4 x i32> %44 to <16 x i8>
  4221. %4224 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4221, <32 x i8> %4222, <16 x i8> %4223, i32 2)
  4222. %4225 = extractelement <4 x float> %4224, i32 0
  4223. %4226 = extractelement <4 x float> %4224, i32 1
  4224. %4227 = extractelement <4 x float> %4224, i32 2
  4225. %4228 = fmul float %4225, %4216
  4226. %4229 = fadd float %4228, %4131
  4227. %4230 = fmul float %4226, %4216
  4228. %4231 = fadd float %4230, %4133
  4229. %4232 = fmul float %4227, %4216
  4230. %4233 = fadd float %4232, %4135
  4231. %4234 = call float @llvm.AMDIL.clamp.(float %4145, float 0.000000e+00, float 1.000000e+00)
  4232. %4235 = call float @llvm.AMDIL.clamp.(float %4147, float 0.000000e+00, float 1.000000e+00)
  4233. %4236 = bitcast float %4234 to i32
  4234. %4237 = bitcast float %4235 to i32
  4235. %4238 = insertelement <4 x i32> undef, i32 %4236, i32 0
  4236. %4239 = insertelement <4 x i32> %4238, i32 %4237, i32 1
  4237. %4240 = insertelement <4 x i32> %4239, i32 0, i32 2
  4238. %4241 = bitcast <8 x i32> %38 to <32 x i8>
  4239. %4242 = bitcast <4 x i32> %40 to <16 x i8>
  4240. %4243 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4240, <32 x i8> %4241, <16 x i8> %4242, i32 2)
  4241. %4244 = extractelement <4 x float> %4243, i32 0
  4242. %4245 = extractelement <4 x float> %4243, i32 1
  4243. %4246 = extractelement <4 x float> %4243, i32 2
  4244. %4247 = extractelement <4 x float> %4243, i32 3
  4245. %4248 = fmul float %4247, %4247
  4246. %4249 = fmul float %4234, %106
  4247. %4250 = fadd float %4249, %110
  4248. %4251 = fmul float %4235, %107
  4249. %4252 = fadd float %4251, %111
  4250. %4253 = fmul float %4250, %4250
  4251. %4254 = fmul float %4252, %4252
  4252. %4255 = fadd float %4254, %4253
  4253. %4256 = fadd float %4255, 1.000000e+00
  4254. %4257 = call float @fabs(float %4256)
  4255. %4258 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4257)
  4256. %4259 = call float @llvm.minnum.f32(float %4258, float 0x47EFFFFFE0000000)
  4257. %4260 = fmul float %4259, %4250
  4258. %4261 = fmul float %4259, %4252
  4259. %4262 = fmul float %4259, %4248
  4260. %4263 = fmul float %4260, %4248
  4261. %4264 = fsub float %4263, %101
  4262. %4265 = fmul float %4261, %4248
  4263. %4266 = fsub float %4265, %102
  4264. %4267 = fsub float -0.000000e+00, %103
  4265. %4268 = fsub float %4267, %4262
  4266. %4269 = fmul float %4264, %4264
  4267. %4270 = fmul float %4266, %4266
  4268. %4271 = fadd float %4270, %4269
  4269. %4272 = fmul float %4268, %4268
  4270. %4273 = fadd float %4271, %4272
  4271. %4274 = fmul float %32, %4273
  4272. %4275 = fsub float 1.000000e+00, %4274
  4273. %4276 = call float @llvm.AMDIL.clamp.(float %4275, float 0.000000e+00, float 1.000000e+00)
  4274. %4277 = call float @fabs(float %4273)
  4275. %4278 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4277)
  4276. %4279 = call float @llvm.minnum.f32(float %4278, float 0x47EFFFFFE0000000)
  4277. %4280 = fmul float %4279, %4264
  4278. %4281 = fmul float %4279, %4266
  4279. %4282 = fmul float %4279, %4268
  4280. %4283 = fmul float %4280, %4244
  4281. %4284 = fmul float %4281, %4245
  4282. %4285 = fadd float %4284, %4283
  4283. %4286 = fmul float %4282, %4246
  4284. %4287 = fadd float %4285, %4286
  4285. %4288 = fsub float %33, %4287
  4286. %4289 = call float @llvm.AMDIL.clamp.(float %4288, float 0.000000e+00, float 1.000000e+00)
  4287. %4290 = fmul float %4280, %68
  4288. %4291 = fmul float %4281, %69
  4289. %4292 = fadd float %4291, %4290
  4290. %4293 = fmul float %4282, %70
  4291. %4294 = fadd float %4292, %4293
  4292. %4295 = fadd float %4294, %34
  4293. %4296 = call float @llvm.AMDIL.clamp.(float %4295, float 0.000000e+00, float 1.000000e+00)
  4294. %4297 = fmul float %4289, %4296
  4295. %4298 = fmul float %4297, %4276
  4296. %4299 = bitcast float %4234 to i32
  4297. %4300 = bitcast float %4235 to i32
  4298. %4301 = insertelement <4 x i32> undef, i32 %4299, i32 0
  4299. %4302 = insertelement <4 x i32> %4301, i32 %4300, i32 1
  4300. %4303 = insertelement <4 x i32> %4302, i32 0, i32 2
  4301. %4304 = bitcast <8 x i32> %42 to <32 x i8>
  4302. %4305 = bitcast <4 x i32> %44 to <16 x i8>
  4303. %4306 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4303, <32 x i8> %4304, <16 x i8> %4305, i32 2)
  4304. %4307 = extractelement <4 x float> %4306, i32 0
  4305. %4308 = extractelement <4 x float> %4306, i32 1
  4306. %4309 = extractelement <4 x float> %4306, i32 2
  4307. %4310 = fmul float %4307, %4298
  4308. %4311 = fadd float %4310, %4229
  4309. %4312 = fmul float %4308, %4298
  4310. %4313 = fadd float %4312, %4231
  4311. %4314 = fmul float %4309, %4298
  4312. %4315 = fadd float %4314, %4233
  4313. %4316 = fmul float %87, 0xBFEBAE1480000000
  4314. %4317 = fadd float %4316, %3954
  4315. %4318 = fmul float %90, 0xBFEBAE1480000000
  4316. %4319 = fadd float %4318, %3955
  4317. %4320 = fmul float %87, 0xBFEBAE1480000000
  4318. %4321 = fadd float %4320, %3954
  4319. %4322 = fmul float %90, 0xBFEBAE1480000000
  4320. %4323 = fadd float %4322, %3955
  4321. %4324 = fmul float %4321, 0x3FE6E978E0000000
  4322. %4325 = fadd float %4324, %51
  4323. %4326 = fmul float %4323, 0x3FE6E978E0000000
  4324. %4327 = fadd float %4326, %52
  4325. %4328 = fmul float %4317, 0x3FC9168720000000
  4326. %4329 = fadd float %4328, %51
  4327. %4330 = fmul float %4319, 0x3FC9168720000000
  4328. %4331 = fadd float %4330, %52
  4329. %4332 = call float @llvm.AMDIL.clamp.(float %4329, float 0.000000e+00, float 1.000000e+00)
  4330. %4333 = call float @llvm.AMDIL.clamp.(float %4331, float 0.000000e+00, float 1.000000e+00)
  4331. %4334 = bitcast float %4332 to i32
  4332. %4335 = bitcast float %4333 to i32
  4333. %4336 = insertelement <4 x i32> undef, i32 %4334, i32 0
  4334. %4337 = insertelement <4 x i32> %4336, i32 %4335, i32 1
  4335. %4338 = insertelement <4 x i32> %4337, i32 0, i32 2
  4336. %4339 = bitcast <8 x i32> %38 to <32 x i8>
  4337. %4340 = bitcast <4 x i32> %40 to <16 x i8>
  4338. %4341 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4338, <32 x i8> %4339, <16 x i8> %4340, i32 2)
  4339. %4342 = extractelement <4 x float> %4341, i32 0
  4340. %4343 = extractelement <4 x float> %4341, i32 1
  4341. %4344 = extractelement <4 x float> %4341, i32 2
  4342. %4345 = extractelement <4 x float> %4341, i32 3
  4343. %4346 = fmul float %4345, %4345
  4344. %4347 = fmul float %4332, %106
  4345. %4348 = fadd float %4347, %110
  4346. %4349 = fmul float %4333, %107
  4347. %4350 = fadd float %4349, %111
  4348. %4351 = fmul float %4348, %4348
  4349. %4352 = fmul float %4350, %4350
  4350. %4353 = fadd float %4352, %4351
  4351. %4354 = fadd float %4353, 1.000000e+00
  4352. %4355 = call float @fabs(float %4354)
  4353. %4356 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4355)
  4354. %4357 = call float @llvm.minnum.f32(float %4356, float 0x47EFFFFFE0000000)
  4355. %4358 = fmul float %4357, %4348
  4356. %4359 = fmul float %4357, %4350
  4357. %4360 = fmul float %4357, %4346
  4358. %4361 = fmul float %4358, %4346
  4359. %4362 = fsub float %4361, %101
  4360. %4363 = fmul float %4359, %4346
  4361. %4364 = fsub float %4363, %102
  4362. %4365 = fsub float -0.000000e+00, %103
  4363. %4366 = fsub float %4365, %4360
  4364. %4367 = fmul float %4362, %4362
  4365. %4368 = fmul float %4364, %4364
  4366. %4369 = fadd float %4368, %4367
  4367. %4370 = fmul float %4366, %4366
  4368. %4371 = fadd float %4369, %4370
  4369. %4372 = fmul float %32, %4371
  4370. %4373 = fsub float 1.000000e+00, %4372
  4371. %4374 = call float @llvm.AMDIL.clamp.(float %4373, float 0.000000e+00, float 1.000000e+00)
  4372. %4375 = call float @fabs(float %4371)
  4373. %4376 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4375)
  4374. %4377 = call float @llvm.minnum.f32(float %4376, float 0x47EFFFFFE0000000)
  4375. %4378 = fmul float %4377, %4362
  4376. %4379 = fmul float %4377, %4364
  4377. %4380 = fmul float %4377, %4366
  4378. %4381 = fmul float %4378, %4342
  4379. %4382 = fmul float %4379, %4343
  4380. %4383 = fadd float %4382, %4381
  4381. %4384 = fmul float %4380, %4344
  4382. %4385 = fadd float %4383, %4384
  4383. %4386 = fsub float %33, %4385
  4384. %4387 = call float @llvm.AMDIL.clamp.(float %4386, float 0.000000e+00, float 1.000000e+00)
  4385. %4388 = fmul float %4378, %68
  4386. %4389 = fmul float %4379, %69
  4387. %4390 = fadd float %4389, %4388
  4388. %4391 = fmul float %4380, %70
  4389. %4392 = fadd float %4390, %4391
  4390. %4393 = fadd float %4392, %34
  4391. %4394 = call float @llvm.AMDIL.clamp.(float %4393, float 0.000000e+00, float 1.000000e+00)
  4392. %4395 = fmul float %4387, %4394
  4393. %4396 = fmul float %4395, %4374
  4394. %4397 = bitcast float %4332 to i32
  4395. %4398 = bitcast float %4333 to i32
  4396. %4399 = insertelement <4 x i32> undef, i32 %4397, i32 0
  4397. %4400 = insertelement <4 x i32> %4399, i32 %4398, i32 1
  4398. %4401 = insertelement <4 x i32> %4400, i32 0, i32 2
  4399. %4402 = bitcast <8 x i32> %42 to <32 x i8>
  4400. %4403 = bitcast <4 x i32> %44 to <16 x i8>
  4401. %4404 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4401, <32 x i8> %4402, <16 x i8> %4403, i32 2)
  4402. %4405 = extractelement <4 x float> %4404, i32 0
  4403. %4406 = extractelement <4 x float> %4404, i32 1
  4404. %4407 = extractelement <4 x float> %4404, i32 2
  4405. %4408 = fmul float %4405, %4396
  4406. %4409 = fadd float %4408, %4311
  4407. %4410 = fmul float %4406, %4396
  4408. %4411 = fadd float %4410, %4313
  4409. %4412 = fmul float %4407, %4396
  4410. %4413 = fadd float %4412, %4315
  4411. %4414 = call float @llvm.AMDIL.clamp.(float %4325, float 0.000000e+00, float 1.000000e+00)
  4412. %4415 = call float @llvm.AMDIL.clamp.(float %4327, float 0.000000e+00, float 1.000000e+00)
  4413. %4416 = bitcast float %4414 to i32
  4414. %4417 = bitcast float %4415 to i32
  4415. %4418 = insertelement <4 x i32> undef, i32 %4416, i32 0
  4416. %4419 = insertelement <4 x i32> %4418, i32 %4417, i32 1
  4417. %4420 = insertelement <4 x i32> %4419, i32 0, i32 2
  4418. %4421 = bitcast <8 x i32> %38 to <32 x i8>
  4419. %4422 = bitcast <4 x i32> %40 to <16 x i8>
  4420. %4423 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4420, <32 x i8> %4421, <16 x i8> %4422, i32 2)
  4421. %4424 = extractelement <4 x float> %4423, i32 0
  4422. %4425 = extractelement <4 x float> %4423, i32 1
  4423. %4426 = extractelement <4 x float> %4423, i32 2
  4424. %4427 = extractelement <4 x float> %4423, i32 3
  4425. %4428 = fmul float %4427, %4427
  4426. %4429 = fmul float %4414, %106
  4427. %4430 = fadd float %4429, %110
  4428. %4431 = fmul float %4415, %107
  4429. %4432 = fadd float %4431, %111
  4430. %4433 = fmul float %4430, %4430
  4431. %4434 = fmul float %4432, %4432
  4432. %4435 = fadd float %4434, %4433
  4433. %4436 = fadd float %4435, 1.000000e+00
  4434. %4437 = call float @fabs(float %4436)
  4435. %4438 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4437)
  4436. %4439 = call float @llvm.minnum.f32(float %4438, float 0x47EFFFFFE0000000)
  4437. %4440 = fmul float %4439, %4430
  4438. %4441 = fmul float %4439, %4432
  4439. %4442 = fmul float %4439, %4428
  4440. %4443 = fmul float %4440, %4428
  4441. %4444 = fsub float %4443, %101
  4442. %4445 = fmul float %4441, %4428
  4443. %4446 = fsub float %4445, %102
  4444. %4447 = fsub float -0.000000e+00, %103
  4445. %4448 = fsub float %4447, %4442
  4446. %4449 = fmul float %4444, %4444
  4447. %4450 = fmul float %4446, %4446
  4448. %4451 = fadd float %4450, %4449
  4449. %4452 = fmul float %4448, %4448
  4450. %4453 = fadd float %4451, %4452
  4451. %4454 = fmul float %32, %4453
  4452. %4455 = fsub float 1.000000e+00, %4454
  4453. %4456 = call float @llvm.AMDIL.clamp.(float %4455, float 0.000000e+00, float 1.000000e+00)
  4454. %4457 = call float @fabs(float %4453)
  4455. %4458 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4457)
  4456. %4459 = call float @llvm.minnum.f32(float %4458, float 0x47EFFFFFE0000000)
  4457. %4460 = fmul float %4459, %4444
  4458. %4461 = fmul float %4459, %4446
  4459. %4462 = fmul float %4459, %4448
  4460. %4463 = fmul float %4460, %4424
  4461. %4464 = fmul float %4461, %4425
  4462. %4465 = fadd float %4464, %4463
  4463. %4466 = fmul float %4462, %4426
  4464. %4467 = fadd float %4465, %4466
  4465. %4468 = fsub float %33, %4467
  4466. %4469 = call float @llvm.AMDIL.clamp.(float %4468, float 0.000000e+00, float 1.000000e+00)
  4467. %4470 = fmul float %4460, %68
  4468. %4471 = fmul float %4461, %69
  4469. %4472 = fadd float %4471, %4470
  4470. %4473 = fmul float %4462, %70
  4471. %4474 = fadd float %4472, %4473
  4472. %4475 = fadd float %4474, %34
  4473. %4476 = call float @llvm.AMDIL.clamp.(float %4475, float 0.000000e+00, float 1.000000e+00)
  4474. %4477 = fmul float %4469, %4476
  4475. %4478 = fmul float %4477, %4456
  4476. %4479 = bitcast float %4414 to i32
  4477. %4480 = bitcast float %4415 to i32
  4478. %4481 = insertelement <4 x i32> undef, i32 %4479, i32 0
  4479. %4482 = insertelement <4 x i32> %4481, i32 %4480, i32 1
  4480. %4483 = insertelement <4 x i32> %4482, i32 0, i32 2
  4481. %4484 = bitcast <8 x i32> %42 to <32 x i8>
  4482. %4485 = bitcast <4 x i32> %44 to <16 x i8>
  4483. %4486 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4483, <32 x i8> %4484, <16 x i8> %4485, i32 2)
  4484. %4487 = extractelement <4 x float> %4486, i32 0
  4485. %4488 = extractelement <4 x float> %4486, i32 1
  4486. %4489 = extractelement <4 x float> %4486, i32 2
  4487. %4490 = fmul float %4487, %4478
  4488. %4491 = fadd float %4490, %4409
  4489. %4492 = fmul float %4488, %4478
  4490. %4493 = fadd float %4492, %4411
  4491. %4494 = fmul float %4489, %4478
  4492. %4495 = fadd float %4494, %4413
  4493. %4496 = fmul float %88, 0xBFC0418940000000
  4494. %4497 = fmul float %87, 0x3FC0418940000000
  4495. %4498 = fmul float %88, 0x3FC76C8B40000000
  4496. %4499 = fmul float %87, 0xBFC76C8B40000000
  4497. %4500 = fmul float %87, 0xBFEFBE76C0000000
  4498. %4501 = fadd float %4500, %4496
  4499. %4502 = fmul float %90, 0xBFEFBE76C0000000
  4500. %4503 = fadd float %4502, %4497
  4501. %4504 = fmul float %87, 0xBFEFBE76C0000000
  4502. %4505 = fadd float %4504, %4496
  4503. %4506 = fmul float %90, 0xBFEFBE76C0000000
  4504. %4507 = fadd float %4506, %4497
  4505. %4508 = fmul float %4505, 0x3FE224DD20000000
  4506. %4509 = fadd float %4508, %51
  4507. %4510 = fmul float %4507, 0x3FE224DD20000000
  4508. %4511 = fadd float %4510, %52
  4509. %4512 = fmul float %4501, 0x3FCB020C40000000
  4510. %4513 = fadd float %4512, %51
  4511. %4514 = fmul float %4503, 0x3FCB020C40000000
  4512. %4515 = fadd float %4514, %52
  4513. %4516 = call float @llvm.AMDIL.clamp.(float %4513, float 0.000000e+00, float 1.000000e+00)
  4514. %4517 = call float @llvm.AMDIL.clamp.(float %4515, float 0.000000e+00, float 1.000000e+00)
  4515. %4518 = bitcast float %4516 to i32
  4516. %4519 = bitcast float %4517 to i32
  4517. %4520 = insertelement <4 x i32> undef, i32 %4518, i32 0
  4518. %4521 = insertelement <4 x i32> %4520, i32 %4519, i32 1
  4519. %4522 = insertelement <4 x i32> %4521, i32 0, i32 2
  4520. %4523 = bitcast <8 x i32> %38 to <32 x i8>
  4521. %4524 = bitcast <4 x i32> %40 to <16 x i8>
  4522. %4525 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4522, <32 x i8> %4523, <16 x i8> %4524, i32 2)
  4523. %4526 = extractelement <4 x float> %4525, i32 0
  4524. %4527 = extractelement <4 x float> %4525, i32 1
  4525. %4528 = extractelement <4 x float> %4525, i32 2
  4526. %4529 = extractelement <4 x float> %4525, i32 3
  4527. %4530 = fmul float %4529, %4529
  4528. %4531 = fmul float %4516, %106
  4529. %4532 = fadd float %4531, %110
  4530. %4533 = fmul float %4517, %107
  4531. %4534 = fadd float %4533, %111
  4532. %4535 = fmul float %4532, %4532
  4533. %4536 = fmul float %4534, %4534
  4534. %4537 = fadd float %4536, %4535
  4535. %4538 = fadd float %4537, 1.000000e+00
  4536. %4539 = call float @fabs(float %4538)
  4537. %4540 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4539)
  4538. %4541 = call float @llvm.minnum.f32(float %4540, float 0x47EFFFFFE0000000)
  4539. %4542 = fmul float %4541, %4532
  4540. %4543 = fmul float %4541, %4534
  4541. %4544 = fmul float %4541, %4530
  4542. %4545 = fmul float %4542, %4530
  4543. %4546 = fsub float %4545, %101
  4544. %4547 = fmul float %4543, %4530
  4545. %4548 = fsub float %4547, %102
  4546. %4549 = fsub float -0.000000e+00, %103
  4547. %4550 = fsub float %4549, %4544
  4548. %4551 = fmul float %4546, %4546
  4549. %4552 = fmul float %4548, %4548
  4550. %4553 = fadd float %4552, %4551
  4551. %4554 = fmul float %4550, %4550
  4552. %4555 = fadd float %4553, %4554
  4553. %4556 = fmul float %32, %4555
  4554. %4557 = fsub float 1.000000e+00, %4556
  4555. %4558 = call float @llvm.AMDIL.clamp.(float %4557, float 0.000000e+00, float 1.000000e+00)
  4556. %4559 = call float @fabs(float %4555)
  4557. %4560 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4559)
  4558. %4561 = call float @llvm.minnum.f32(float %4560, float 0x47EFFFFFE0000000)
  4559. %4562 = fmul float %4561, %4546
  4560. %4563 = fmul float %4561, %4548
  4561. %4564 = fmul float %4561, %4550
  4562. %4565 = fmul float %4562, %4526
  4563. %4566 = fmul float %4563, %4527
  4564. %4567 = fadd float %4566, %4565
  4565. %4568 = fmul float %4564, %4528
  4566. %4569 = fadd float %4567, %4568
  4567. %4570 = fsub float %33, %4569
  4568. %4571 = call float @llvm.AMDIL.clamp.(float %4570, float 0.000000e+00, float 1.000000e+00)
  4569. %4572 = fmul float %4562, %68
  4570. %4573 = fmul float %4563, %69
  4571. %4574 = fadd float %4573, %4572
  4572. %4575 = fmul float %4564, %70
  4573. %4576 = fadd float %4574, %4575
  4574. %4577 = fadd float %4576, %34
  4575. %4578 = call float @llvm.AMDIL.clamp.(float %4577, float 0.000000e+00, float 1.000000e+00)
  4576. %4579 = fmul float %4571, %4578
  4577. %4580 = fmul float %4579, %4558
  4578. %4581 = bitcast float %4516 to i32
  4579. %4582 = bitcast float %4517 to i32
  4580. %4583 = insertelement <4 x i32> undef, i32 %4581, i32 0
  4581. %4584 = insertelement <4 x i32> %4583, i32 %4582, i32 1
  4582. %4585 = insertelement <4 x i32> %4584, i32 0, i32 2
  4583. %4586 = bitcast <8 x i32> %42 to <32 x i8>
  4584. %4587 = bitcast <4 x i32> %44 to <16 x i8>
  4585. %4588 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4585, <32 x i8> %4586, <16 x i8> %4587, i32 2)
  4586. %4589 = extractelement <4 x float> %4588, i32 0
  4587. %4590 = extractelement <4 x float> %4588, i32 1
  4588. %4591 = extractelement <4 x float> %4588, i32 2
  4589. %4592 = fmul float %4589, %4580
  4590. %4593 = fadd float %4592, %4491
  4591. %4594 = fmul float %4590, %4580
  4592. %4595 = fadd float %4594, %4493
  4593. %4596 = fmul float %4591, %4580
  4594. %4597 = fadd float %4596, %4495
  4595. %4598 = call float @llvm.AMDIL.clamp.(float %4509, float 0.000000e+00, float 1.000000e+00)
  4596. %4599 = call float @llvm.AMDIL.clamp.(float %4511, float 0.000000e+00, float 1.000000e+00)
  4597. %4600 = bitcast float %4598 to i32
  4598. %4601 = bitcast float %4599 to i32
  4599. %4602 = insertelement <4 x i32> undef, i32 %4600, i32 0
  4600. %4603 = insertelement <4 x i32> %4602, i32 %4601, i32 1
  4601. %4604 = insertelement <4 x i32> %4603, i32 0, i32 2
  4602. %4605 = bitcast <8 x i32> %38 to <32 x i8>
  4603. %4606 = bitcast <4 x i32> %40 to <16 x i8>
  4604. %4607 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4604, <32 x i8> %4605, <16 x i8> %4606, i32 2)
  4605. %4608 = extractelement <4 x float> %4607, i32 0
  4606. %4609 = extractelement <4 x float> %4607, i32 1
  4607. %4610 = extractelement <4 x float> %4607, i32 2
  4608. %4611 = extractelement <4 x float> %4607, i32 3
  4609. %4612 = fmul float %4611, %4611
  4610. %4613 = fmul float %4598, %106
  4611. %4614 = fadd float %4613, %110
  4612. %4615 = fmul float %4599, %107
  4613. %4616 = fadd float %4615, %111
  4614. %4617 = fmul float %4614, %4614
  4615. %4618 = fmul float %4616, %4616
  4616. %4619 = fadd float %4618, %4617
  4617. %4620 = fadd float %4619, 1.000000e+00
  4618. %4621 = call float @fabs(float %4620)
  4619. %4622 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4621)
  4620. %4623 = call float @llvm.minnum.f32(float %4622, float 0x47EFFFFFE0000000)
  4621. %4624 = fmul float %4623, %4614
  4622. %4625 = fmul float %4623, %4616
  4623. %4626 = fmul float %4623, %4612
  4624. %4627 = fmul float %4624, %4612
  4625. %4628 = fsub float %4627, %101
  4626. %4629 = fmul float %4625, %4612
  4627. %4630 = fsub float %4629, %102
  4628. %4631 = fsub float -0.000000e+00, %103
  4629. %4632 = fsub float %4631, %4626
  4630. %4633 = fmul float %4628, %4628
  4631. %4634 = fmul float %4630, %4630
  4632. %4635 = fadd float %4634, %4633
  4633. %4636 = fmul float %4632, %4632
  4634. %4637 = fadd float %4635, %4636
  4635. %4638 = fmul float %32, %4637
  4636. %4639 = fsub float 1.000000e+00, %4638
  4637. %4640 = call float @llvm.AMDIL.clamp.(float %4639, float 0.000000e+00, float 1.000000e+00)
  4638. %4641 = call float @fabs(float %4637)
  4639. %4642 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4641)
  4640. %4643 = call float @llvm.minnum.f32(float %4642, float 0x47EFFFFFE0000000)
  4641. %4644 = fmul float %4643, %4628
  4642. %4645 = fmul float %4643, %4630
  4643. %4646 = fmul float %4643, %4632
  4644. %4647 = fmul float %4644, %4608
  4645. %4648 = fmul float %4645, %4609
  4646. %4649 = fadd float %4648, %4647
  4647. %4650 = fmul float %4646, %4610
  4648. %4651 = fadd float %4649, %4650
  4649. %4652 = fsub float %33, %4651
  4650. %4653 = call float @llvm.AMDIL.clamp.(float %4652, float 0.000000e+00, float 1.000000e+00)
  4651. %4654 = fmul float %4644, %68
  4652. %4655 = fmul float %4645, %69
  4653. %4656 = fadd float %4655, %4654
  4654. %4657 = fmul float %4646, %70
  4655. %4658 = fadd float %4656, %4657
  4656. %4659 = fadd float %4658, %34
  4657. %4660 = call float @llvm.AMDIL.clamp.(float %4659, float 0.000000e+00, float 1.000000e+00)
  4658. %4661 = fmul float %4653, %4660
  4659. %4662 = fmul float %4661, %4640
  4660. %4663 = bitcast float %4598 to i32
  4661. %4664 = bitcast float %4599 to i32
  4662. %4665 = insertelement <4 x i32> undef, i32 %4663, i32 0
  4663. %4666 = insertelement <4 x i32> %4665, i32 %4664, i32 1
  4664. %4667 = insertelement <4 x i32> %4666, i32 0, i32 2
  4665. %4668 = bitcast <8 x i32> %42 to <32 x i8>
  4666. %4669 = bitcast <4 x i32> %44 to <16 x i8>
  4667. %4670 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4667, <32 x i8> %4668, <16 x i8> %4669, i32 2)
  4668. %4671 = extractelement <4 x float> %4670, i32 0
  4669. %4672 = extractelement <4 x float> %4670, i32 1
  4670. %4673 = extractelement <4 x float> %4670, i32 2
  4671. %4674 = fmul float %4671, %4662
  4672. %4675 = fadd float %4674, %4593
  4673. %4676 = fmul float %4672, %4662
  4674. %4677 = fadd float %4676, %4595
  4675. %4678 = fmul float %4673, %4662
  4676. %4679 = fadd float %4678, %4597
  4677. %4680 = fmul float %87, 0xBFEF74BC60000000
  4678. %4681 = fadd float %4680, %4498
  4679. %4682 = fmul float %90, 0xBFEF74BC60000000
  4680. %4683 = fadd float %4682, %4499
  4681. %4684 = fmul float %87, 0xBFEF74BC60000000
  4682. %4685 = fadd float %4684, %4498
  4683. %4686 = fmul float %90, 0xBFEF74BC60000000
  4684. %4687 = fadd float %4686, %4499
  4685. %4688 = fmul float %4685, 0x3FE4ED9160000000
  4686. %4689 = fadd float %4688, %51
  4687. %4690 = fmul float %4687, 0x3FE4ED9160000000
  4688. %4691 = fadd float %4690, %52
  4689. %4692 = fmul float %4681, 0x3FD2B020C0000000
  4690. %4693 = fadd float %4692, %51
  4691. %4694 = fmul float %4683, 0x3FD2B020C0000000
  4692. %4695 = fadd float %4694, %52
  4693. %4696 = call float @llvm.AMDIL.clamp.(float %4693, float 0.000000e+00, float 1.000000e+00)
  4694. %4697 = call float @llvm.AMDIL.clamp.(float %4695, float 0.000000e+00, float 1.000000e+00)
  4695. %4698 = bitcast float %4696 to i32
  4696. %4699 = bitcast float %4697 to i32
  4697. %4700 = insertelement <4 x i32> undef, i32 %4698, i32 0
  4698. %4701 = insertelement <4 x i32> %4700, i32 %4699, i32 1
  4699. %4702 = insertelement <4 x i32> %4701, i32 0, i32 2
  4700. %4703 = bitcast <8 x i32> %38 to <32 x i8>
  4701. %4704 = bitcast <4 x i32> %40 to <16 x i8>
  4702. %4705 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4702, <32 x i8> %4703, <16 x i8> %4704, i32 2)
  4703. %4706 = extractelement <4 x float> %4705, i32 0
  4704. %4707 = extractelement <4 x float> %4705, i32 1
  4705. %4708 = extractelement <4 x float> %4705, i32 2
  4706. %4709 = extractelement <4 x float> %4705, i32 3
  4707. %4710 = fmul float %4709, %4709
  4708. %4711 = fmul float %4696, %106
  4709. %4712 = fadd float %4711, %110
  4710. %4713 = fmul float %4697, %107
  4711. %4714 = fadd float %4713, %111
  4712. %4715 = fmul float %4712, %4712
  4713. %4716 = fmul float %4714, %4714
  4714. %4717 = fadd float %4716, %4715
  4715. %4718 = fadd float %4717, 1.000000e+00
  4716. %4719 = call float @fabs(float %4718)
  4717. %4720 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4719)
  4718. %4721 = call float @llvm.minnum.f32(float %4720, float 0x47EFFFFFE0000000)
  4719. %4722 = fmul float %4721, %4712
  4720. %4723 = fmul float %4721, %4714
  4721. %4724 = fmul float %4721, %4710
  4722. %4725 = fmul float %4722, %4710
  4723. %4726 = fsub float %4725, %101
  4724. %4727 = fmul float %4723, %4710
  4725. %4728 = fsub float %4727, %102
  4726. %4729 = fsub float -0.000000e+00, %103
  4727. %4730 = fsub float %4729, %4724
  4728. %4731 = fmul float %4726, %4726
  4729. %4732 = fmul float %4728, %4728
  4730. %4733 = fadd float %4732, %4731
  4731. %4734 = fmul float %4730, %4730
  4732. %4735 = fadd float %4733, %4734
  4733. %4736 = fmul float %32, %4735
  4734. %4737 = fsub float 1.000000e+00, %4736
  4735. %4738 = call float @llvm.AMDIL.clamp.(float %4737, float 0.000000e+00, float 1.000000e+00)
  4736. %4739 = call float @fabs(float %4735)
  4737. %4740 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4739)
  4738. %4741 = call float @llvm.minnum.f32(float %4740, float 0x47EFFFFFE0000000)
  4739. %4742 = fmul float %4741, %4726
  4740. %4743 = fmul float %4741, %4728
  4741. %4744 = fmul float %4741, %4730
  4742. %4745 = fmul float %4742, %4706
  4743. %4746 = fmul float %4743, %4707
  4744. %4747 = fadd float %4746, %4745
  4745. %4748 = fmul float %4744, %4708
  4746. %4749 = fadd float %4747, %4748
  4747. %4750 = fsub float %33, %4749
  4748. %4751 = call float @llvm.AMDIL.clamp.(float %4750, float 0.000000e+00, float 1.000000e+00)
  4749. %4752 = fmul float %4742, %68
  4750. %4753 = fmul float %4743, %69
  4751. %4754 = fadd float %4753, %4752
  4752. %4755 = fmul float %4744, %70
  4753. %4756 = fadd float %4754, %4755
  4754. %4757 = fadd float %4756, %34
  4755. %4758 = call float @llvm.AMDIL.clamp.(float %4757, float 0.000000e+00, float 1.000000e+00)
  4756. %4759 = fmul float %4751, %4758
  4757. %4760 = fmul float %4759, %4738
  4758. %4761 = bitcast float %4696 to i32
  4759. %4762 = bitcast float %4697 to i32
  4760. %4763 = insertelement <4 x i32> undef, i32 %4761, i32 0
  4761. %4764 = insertelement <4 x i32> %4763, i32 %4762, i32 1
  4762. %4765 = insertelement <4 x i32> %4764, i32 0, i32 2
  4763. %4766 = bitcast <8 x i32> %42 to <32 x i8>
  4764. %4767 = bitcast <4 x i32> %44 to <16 x i8>
  4765. %4768 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4765, <32 x i8> %4766, <16 x i8> %4767, i32 2)
  4766. %4769 = extractelement <4 x float> %4768, i32 0
  4767. %4770 = extractelement <4 x float> %4768, i32 1
  4768. %4771 = extractelement <4 x float> %4768, i32 2
  4769. %4772 = fmul float %4769, %4760
  4770. %4773 = fadd float %4772, %4675
  4771. %4774 = fmul float %4770, %4760
  4772. %4775 = fadd float %4774, %4677
  4773. %4776 = fmul float %4771, %4760
  4774. %4777 = fadd float %4776, %4679
  4775. %4778 = call float @llvm.AMDIL.clamp.(float %4689, float 0.000000e+00, float 1.000000e+00)
  4776. %4779 = call float @llvm.AMDIL.clamp.(float %4691, float 0.000000e+00, float 1.000000e+00)
  4777. %4780 = bitcast float %4778 to i32
  4778. %4781 = bitcast float %4779 to i32
  4779. %4782 = insertelement <4 x i32> undef, i32 %4780, i32 0
  4780. %4783 = insertelement <4 x i32> %4782, i32 %4781, i32 1
  4781. %4784 = insertelement <4 x i32> %4783, i32 0, i32 2
  4782. %4785 = bitcast <8 x i32> %38 to <32 x i8>
  4783. %4786 = bitcast <4 x i32> %40 to <16 x i8>
  4784. %4787 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4784, <32 x i8> %4785, <16 x i8> %4786, i32 2)
  4785. %4788 = extractelement <4 x float> %4787, i32 0
  4786. %4789 = extractelement <4 x float> %4787, i32 1
  4787. %4790 = extractelement <4 x float> %4787, i32 2
  4788. %4791 = extractelement <4 x float> %4787, i32 3
  4789. %4792 = fmul float %4791, %4791
  4790. %4793 = fmul float %4778, %106
  4791. %4794 = fadd float %4793, %110
  4792. %4795 = fmul float %4779, %107
  4793. %4796 = fadd float %4795, %111
  4794. %4797 = fmul float %4794, %4794
  4795. %4798 = fmul float %4796, %4796
  4796. %4799 = fadd float %4798, %4797
  4797. %4800 = fadd float %4799, 1.000000e+00
  4798. %4801 = call float @fabs(float %4800)
  4799. %4802 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4801)
  4800. %4803 = call float @llvm.minnum.f32(float %4802, float 0x47EFFFFFE0000000)
  4801. %4804 = fmul float %4803, %4794
  4802. %4805 = fmul float %4803, %4796
  4803. %4806 = fmul float %4803, %4792
  4804. %4807 = fmul float %4804, %4792
  4805. %4808 = fsub float %4807, %101
  4806. %4809 = fmul float %4805, %4792
  4807. %4810 = fsub float %4809, %102
  4808. %4811 = fsub float -0.000000e+00, %103
  4809. %4812 = fsub float %4811, %4806
  4810. %4813 = fmul float %4808, %4808
  4811. %4814 = fmul float %4810, %4810
  4812. %4815 = fadd float %4814, %4813
  4813. %4816 = fmul float %4812, %4812
  4814. %4817 = fadd float %4815, %4816
  4815. %4818 = fmul float %32, %4817
  4816. %4819 = fsub float 1.000000e+00, %4818
  4817. %4820 = call float @llvm.AMDIL.clamp.(float %4819, float 0.000000e+00, float 1.000000e+00)
  4818. %4821 = call float @fabs(float %4817)
  4819. %4822 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4821)
  4820. %4823 = call float @llvm.minnum.f32(float %4822, float 0x47EFFFFFE0000000)
  4821. %4824 = fmul float %4823, %4808
  4822. %4825 = fmul float %4823, %4810
  4823. %4826 = fmul float %4823, %4812
  4824. %4827 = fmul float %4824, %4788
  4825. %4828 = fmul float %4825, %4789
  4826. %4829 = fadd float %4828, %4827
  4827. %4830 = fmul float %4826, %4790
  4828. %4831 = fadd float %4829, %4830
  4829. %4832 = fsub float %33, %4831
  4830. %4833 = call float @llvm.AMDIL.clamp.(float %4832, float 0.000000e+00, float 1.000000e+00)
  4831. %4834 = fmul float %4824, %68
  4832. %4835 = fmul float %4825, %69
  4833. %4836 = fadd float %4835, %4834
  4834. %4837 = fmul float %4826, %70
  4835. %4838 = fadd float %4836, %4837
  4836. %4839 = fadd float %4838, %34
  4837. %4840 = call float @llvm.AMDIL.clamp.(float %4839, float 0.000000e+00, float 1.000000e+00)
  4838. %4841 = fmul float %4833, %4840
  4839. %4842 = fmul float %4841, %4820
  4840. %4843 = bitcast float %4778 to i32
  4841. %4844 = bitcast float %4779 to i32
  4842. %4845 = insertelement <4 x i32> undef, i32 %4843, i32 0
  4843. %4846 = insertelement <4 x i32> %4845, i32 %4844, i32 1
  4844. %4847 = insertelement <4 x i32> %4846, i32 0, i32 2
  4845. %4848 = bitcast <8 x i32> %42 to <32 x i8>
  4846. %4849 = bitcast <4 x i32> %44 to <16 x i8>
  4847. %4850 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4847, <32 x i8> %4848, <16 x i8> %4849, i32 2)
  4848. %4851 = extractelement <4 x float> %4850, i32 0
  4849. %4852 = extractelement <4 x float> %4850, i32 1
  4850. %4853 = extractelement <4 x float> %4850, i32 2
  4851. %4854 = fmul float %4851, %4842
  4852. %4855 = fadd float %4854, %4773
  4853. %4856 = fmul float %4852, %4842
  4854. %4857 = fadd float %4856, %4775
  4855. %4858 = fmul float %4853, %4842
  4856. %4859 = fadd float %4858, %4777
  4857. %4860 = fmul float %88, 0x3FE049BA60000000
  4858. %4861 = fmul float %87, 0xBFE049BA60000000
  4859. %4862 = fmul float %88, 0x3FE049BA60000000
  4860. %4863 = fmul float %87, 0xBFE049BA60000000
  4861. %4864 = fmul float %87, 0xBFEB8D4FE0000000
  4862. %4865 = fadd float %4864, %4860
  4863. %4866 = fmul float %90, 0xBFEB8D4FE0000000
  4864. %4867 = fadd float %4866, %4861
  4865. %4868 = fmul float %87, 0xBFEB8D4FE0000000
  4866. %4869 = fadd float %4868, %4862
  4867. %4870 = fmul float %90, 0xBFEB8D4FE0000000
  4868. %4871 = fadd float %4870, %4863
  4869. %4872 = fmul float %4869, 0x3FE9810620000000
  4870. %4873 = fadd float %4872, %51
  4871. %4874 = fmul float %4871, 0x3FE9810620000000
  4872. %4875 = fadd float %4874, %52
  4873. %4876 = fmul float %4865, 0x3FD0A3D700000000
  4874. %4877 = fadd float %4876, %51
  4875. %4878 = fmul float %4867, 0x3FD0A3D700000000
  4876. %4879 = fadd float %4878, %52
  4877. %4880 = call float @llvm.AMDIL.clamp.(float %4877, float 0.000000e+00, float 1.000000e+00)
  4878. %4881 = call float @llvm.AMDIL.clamp.(float %4879, float 0.000000e+00, float 1.000000e+00)
  4879. %4882 = bitcast float %4880 to i32
  4880. %4883 = bitcast float %4881 to i32
  4881. %4884 = insertelement <4 x i32> undef, i32 %4882, i32 0
  4882. %4885 = insertelement <4 x i32> %4884, i32 %4883, i32 1
  4883. %4886 = insertelement <4 x i32> %4885, i32 0, i32 2
  4884. %4887 = bitcast <8 x i32> %38 to <32 x i8>
  4885. %4888 = bitcast <4 x i32> %40 to <16 x i8>
  4886. %4889 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4886, <32 x i8> %4887, <16 x i8> %4888, i32 2)
  4887. %4890 = extractelement <4 x float> %4889, i32 0
  4888. %4891 = extractelement <4 x float> %4889, i32 1
  4889. %4892 = extractelement <4 x float> %4889, i32 2
  4890. %4893 = extractelement <4 x float> %4889, i32 3
  4891. %4894 = fmul float %4893, %4893
  4892. %4895 = fmul float %4880, %106
  4893. %4896 = fadd float %4895, %110
  4894. %4897 = fmul float %4881, %107
  4895. %4898 = fadd float %4897, %111
  4896. %4899 = fmul float %4896, %4896
  4897. %4900 = fmul float %4898, %4898
  4898. %4901 = fadd float %4900, %4899
  4899. %4902 = fadd float %4901, 1.000000e+00
  4900. %4903 = call float @fabs(float %4902)
  4901. %4904 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4903)
  4902. %4905 = call float @llvm.minnum.f32(float %4904, float 0x47EFFFFFE0000000)
  4903. %4906 = fmul float %4905, %4896
  4904. %4907 = fmul float %4905, %4898
  4905. %4908 = fmul float %4905, %4894
  4906. %4909 = fmul float %4906, %4894
  4907. %4910 = fsub float %4909, %101
  4908. %4911 = fmul float %4907, %4894
  4909. %4912 = fsub float %4911, %102
  4910. %4913 = fsub float -0.000000e+00, %103
  4911. %4914 = fsub float %4913, %4908
  4912. %4915 = fmul float %4910, %4910
  4913. %4916 = fmul float %4912, %4912
  4914. %4917 = fadd float %4916, %4915
  4915. %4918 = fmul float %4914, %4914
  4916. %4919 = fadd float %4917, %4918
  4917. %4920 = fmul float %32, %4919
  4918. %4921 = fsub float 1.000000e+00, %4920
  4919. %4922 = call float @llvm.AMDIL.clamp.(float %4921, float 0.000000e+00, float 1.000000e+00)
  4920. %4923 = call float @fabs(float %4919)
  4921. %4924 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4923)
  4922. %4925 = call float @llvm.minnum.f32(float %4924, float 0x47EFFFFFE0000000)
  4923. %4926 = fmul float %4925, %4910
  4924. %4927 = fmul float %4925, %4912
  4925. %4928 = fmul float %4925, %4914
  4926. %4929 = fmul float %4926, %4890
  4927. %4930 = fmul float %4927, %4891
  4928. %4931 = fadd float %4930, %4929
  4929. %4932 = fmul float %4928, %4892
  4930. %4933 = fadd float %4931, %4932
  4931. %4934 = fsub float %33, %4933
  4932. %4935 = call float @llvm.AMDIL.clamp.(float %4934, float 0.000000e+00, float 1.000000e+00)
  4933. %4936 = fmul float %4926, %68
  4934. %4937 = fmul float %4927, %69
  4935. %4938 = fadd float %4937, %4936
  4936. %4939 = fmul float %4928, %70
  4937. %4940 = fadd float %4938, %4939
  4938. %4941 = fadd float %4940, %34
  4939. %4942 = call float @llvm.AMDIL.clamp.(float %4941, float 0.000000e+00, float 1.000000e+00)
  4940. %4943 = fmul float %4935, %4942
  4941. %4944 = fmul float %4943, %4922
  4942. %4945 = bitcast float %4880 to i32
  4943. %4946 = bitcast float %4881 to i32
  4944. %4947 = insertelement <4 x i32> undef, i32 %4945, i32 0
  4945. %4948 = insertelement <4 x i32> %4947, i32 %4946, i32 1
  4946. %4949 = insertelement <4 x i32> %4948, i32 0, i32 2
  4947. %4950 = bitcast <8 x i32> %42 to <32 x i8>
  4948. %4951 = bitcast <4 x i32> %44 to <16 x i8>
  4949. %4952 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4949, <32 x i8> %4950, <16 x i8> %4951, i32 2)
  4950. %4953 = extractelement <4 x float> %4952, i32 0
  4951. %4954 = extractelement <4 x float> %4952, i32 1
  4952. %4955 = extractelement <4 x float> %4952, i32 2
  4953. %4956 = fmul float %4953, %4944
  4954. %4957 = fadd float %4956, %4855
  4955. %4958 = fmul float %4954, %4944
  4956. %4959 = fadd float %4958, %4857
  4957. %4960 = fmul float %4955, %4944
  4958. %4961 = fadd float %4960, %4859
  4959. %4962 = call float @llvm.AMDIL.clamp.(float %4873, float 0.000000e+00, float 1.000000e+00)
  4960. %4963 = call float @llvm.AMDIL.clamp.(float %4875, float 0.000000e+00, float 1.000000e+00)
  4961. %4964 = bitcast float %4962 to i32
  4962. %4965 = bitcast float %4963 to i32
  4963. %4966 = insertelement <4 x i32> undef, i32 %4964, i32 0
  4964. %4967 = insertelement <4 x i32> %4966, i32 %4965, i32 1
  4965. %4968 = insertelement <4 x i32> %4967, i32 0, i32 2
  4966. %4969 = bitcast <8 x i32> %38 to <32 x i8>
  4967. %4970 = bitcast <4 x i32> %40 to <16 x i8>
  4968. %4971 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %4968, <32 x i8> %4969, <16 x i8> %4970, i32 2)
  4969. %4972 = extractelement <4 x float> %4971, i32 0
  4970. %4973 = extractelement <4 x float> %4971, i32 1
  4971. %4974 = extractelement <4 x float> %4971, i32 2
  4972. %4975 = extractelement <4 x float> %4971, i32 3
  4973. %4976 = fmul float %4975, %4975
  4974. %4977 = fmul float %4962, %106
  4975. %4978 = fadd float %4977, %110
  4976. %4979 = fmul float %4963, %107
  4977. %4980 = fadd float %4979, %111
  4978. %4981 = fmul float %4978, %4978
  4979. %4982 = fmul float %4980, %4980
  4980. %4983 = fadd float %4982, %4981
  4981. %4984 = fadd float %4983, 1.000000e+00
  4982. %4985 = call float @fabs(float %4984)
  4983. %4986 = call float @llvm.AMDGPU.rsq.clamped.f32(float %4985)
  4984. %4987 = call float @llvm.minnum.f32(float %4986, float 0x47EFFFFFE0000000)
  4985. %4988 = fmul float %4987, %4978
  4986. %4989 = fmul float %4987, %4980
  4987. %4990 = fmul float %4987, %4976
  4988. %4991 = fmul float %4988, %4976
  4989. %4992 = fsub float %4991, %101
  4990. %4993 = fmul float %4989, %4976
  4991. %4994 = fsub float %4993, %102
  4992. %4995 = fsub float -0.000000e+00, %103
  4993. %4996 = fsub float %4995, %4990
  4994. %4997 = fmul float %4992, %4992
  4995. %4998 = fmul float %4994, %4994
  4996. %4999 = fadd float %4998, %4997
  4997. %5000 = fmul float %4996, %4996
  4998. %5001 = fadd float %4999, %5000
  4999. %5002 = fmul float %32, %5001
  5000. %5003 = fsub float 1.000000e+00, %5002
  5001. %5004 = call float @llvm.AMDIL.clamp.(float %5003, float 0.000000e+00, float 1.000000e+00)
  5002. %5005 = call float @fabs(float %5001)
  5003. %5006 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5005)
  5004. %5007 = call float @llvm.minnum.f32(float %5006, float 0x47EFFFFFE0000000)
  5005. %5008 = fmul float %5007, %4992
  5006. %5009 = fmul float %5007, %4994
  5007. %5010 = fmul float %5007, %4996
  5008. %5011 = fmul float %5008, %4972
  5009. %5012 = fmul float %5009, %4973
  5010. %5013 = fadd float %5012, %5011
  5011. %5014 = fmul float %5010, %4974
  5012. %5015 = fadd float %5013, %5014
  5013. %5016 = fsub float %33, %5015
  5014. %5017 = call float @llvm.AMDIL.clamp.(float %5016, float 0.000000e+00, float 1.000000e+00)
  5015. %5018 = fmul float %5008, %68
  5016. %5019 = fmul float %5009, %69
  5017. %5020 = fadd float %5019, %5018
  5018. %5021 = fmul float %5010, %70
  5019. %5022 = fadd float %5020, %5021
  5020. %5023 = fadd float %5022, %34
  5021. %5024 = call float @llvm.AMDIL.clamp.(float %5023, float 0.000000e+00, float 1.000000e+00)
  5022. %5025 = fmul float %5017, %5024
  5023. %5026 = fmul float %5025, %5004
  5024. %5027 = bitcast float %4962 to i32
  5025. %5028 = bitcast float %4963 to i32
  5026. %5029 = insertelement <4 x i32> undef, i32 %5027, i32 0
  5027. %5030 = insertelement <4 x i32> %5029, i32 %5028, i32 1
  5028. %5031 = insertelement <4 x i32> %5030, i32 0, i32 2
  5029. %5032 = bitcast <8 x i32> %42 to <32 x i8>
  5030. %5033 = bitcast <4 x i32> %44 to <16 x i8>
  5031. %5034 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5031, <32 x i8> %5032, <16 x i8> %5033, i32 2)
  5032. %5035 = extractelement <4 x float> %5034, i32 0
  5033. %5036 = extractelement <4 x float> %5034, i32 1
  5034. %5037 = extractelement <4 x float> %5034, i32 2
  5035. %5038 = fmul float %5035, %5026
  5036. %5039 = fadd float %5038, %4957
  5037. %5040 = fmul float %5036, %5026
  5038. %5041 = fadd float %5040, %4959
  5039. %5042 = fmul float %5037, %5026
  5040. %5043 = fadd float %5042, %4961
  5041. %5044 = fmul float %87, 0xBF9EB851E0000000
  5042. %5045 = fadd float %5044, %88
  5043. %5046 = fmul float %90, 0xBF9EB851E0000000
  5044. %5047 = fsub float %5046, %87
  5045. %5048 = fmul float %87, 0xBF9EB851E0000000
  5046. %5049 = fadd float %5048, %88
  5047. %5050 = fmul float %90, 0xBF9EB851E0000000
  5048. %5051 = fsub float %5050, %87
  5049. %5052 = fmul float %5049, 0x3FE820C4A0000000
  5050. %5053 = fadd float %5052, %51
  5051. %5054 = fmul float %5051, 0x3FE820C4A0000000
  5052. %5055 = fadd float %5054, %52
  5053. %5056 = fmul float %5045, 0x3FE028F5C0000000
  5054. %5057 = fadd float %5056, %51
  5055. %5058 = fmul float %5047, 0x3FE028F5C0000000
  5056. %5059 = fadd float %5058, %52
  5057. %5060 = call float @llvm.AMDIL.clamp.(float %5057, float 0.000000e+00, float 1.000000e+00)
  5058. %5061 = call float @llvm.AMDIL.clamp.(float %5059, float 0.000000e+00, float 1.000000e+00)
  5059. %5062 = bitcast float %5060 to i32
  5060. %5063 = bitcast float %5061 to i32
  5061. %5064 = insertelement <4 x i32> undef, i32 %5062, i32 0
  5062. %5065 = insertelement <4 x i32> %5064, i32 %5063, i32 1
  5063. %5066 = insertelement <4 x i32> %5065, i32 0, i32 2
  5064. %5067 = bitcast <8 x i32> %38 to <32 x i8>
  5065. %5068 = bitcast <4 x i32> %40 to <16 x i8>
  5066. %5069 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5066, <32 x i8> %5067, <16 x i8> %5068, i32 2)
  5067. %5070 = extractelement <4 x float> %5069, i32 0
  5068. %5071 = extractelement <4 x float> %5069, i32 1
  5069. %5072 = extractelement <4 x float> %5069, i32 2
  5070. %5073 = extractelement <4 x float> %5069, i32 3
  5071. %5074 = fmul float %5073, %5073
  5072. %5075 = fmul float %5060, %106
  5073. %5076 = fadd float %5075, %110
  5074. %5077 = fmul float %5061, %107
  5075. %5078 = fadd float %5077, %111
  5076. %5079 = fmul float %5076, %5076
  5077. %5080 = fmul float %5078, %5078
  5078. %5081 = fadd float %5080, %5079
  5079. %5082 = fadd float %5081, 1.000000e+00
  5080. %5083 = call float @fabs(float %5082)
  5081. %5084 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5083)
  5082. %5085 = call float @llvm.minnum.f32(float %5084, float 0x47EFFFFFE0000000)
  5083. %5086 = fmul float %5085, %5076
  5084. %5087 = fmul float %5085, %5078
  5085. %5088 = fmul float %5085, %5074
  5086. %5089 = fmul float %5086, %5074
  5087. %5090 = fsub float %5089, %101
  5088. %5091 = fmul float %5087, %5074
  5089. %5092 = fsub float %5091, %102
  5090. %5093 = fsub float -0.000000e+00, %103
  5091. %5094 = fsub float %5093, %5088
  5092. %5095 = fmul float %5090, %5090
  5093. %5096 = fmul float %5092, %5092
  5094. %5097 = fadd float %5096, %5095
  5095. %5098 = fmul float %5094, %5094
  5096. %5099 = fadd float %5097, %5098
  5097. %5100 = fmul float %32, %5099
  5098. %5101 = fsub float 1.000000e+00, %5100
  5099. %5102 = call float @llvm.AMDIL.clamp.(float %5101, float 0.000000e+00, float 1.000000e+00)
  5100. %5103 = call float @fabs(float %5099)
  5101. %5104 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5103)
  5102. %5105 = call float @llvm.minnum.f32(float %5104, float 0x47EFFFFFE0000000)
  5103. %5106 = fmul float %5105, %5090
  5104. %5107 = fmul float %5105, %5092
  5105. %5108 = fmul float %5105, %5094
  5106. %5109 = fmul float %5106, %5070
  5107. %5110 = fmul float %5107, %5071
  5108. %5111 = fadd float %5110, %5109
  5109. %5112 = fmul float %5108, %5072
  5110. %5113 = fadd float %5111, %5112
  5111. %5114 = fsub float %33, %5113
  5112. %5115 = call float @llvm.AMDIL.clamp.(float %5114, float 0.000000e+00, float 1.000000e+00)
  5113. %5116 = fmul float %5106, %68
  5114. %5117 = fmul float %5107, %69
  5115. %5118 = fadd float %5117, %5116
  5116. %5119 = fmul float %5108, %70
  5117. %5120 = fadd float %5118, %5119
  5118. %5121 = fadd float %5120, %34
  5119. %5122 = call float @llvm.AMDIL.clamp.(float %5121, float 0.000000e+00, float 1.000000e+00)
  5120. %5123 = fmul float %5115, %5122
  5121. %5124 = fmul float %5123, %5102
  5122. %5125 = bitcast float %5060 to i32
  5123. %5126 = bitcast float %5061 to i32
  5124. %5127 = insertelement <4 x i32> undef, i32 %5125, i32 0
  5125. %5128 = insertelement <4 x i32> %5127, i32 %5126, i32 1
  5126. %5129 = insertelement <4 x i32> %5128, i32 0, i32 2
  5127. %5130 = bitcast <8 x i32> %42 to <32 x i8>
  5128. %5131 = bitcast <4 x i32> %44 to <16 x i8>
  5129. %5132 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5129, <32 x i8> %5130, <16 x i8> %5131, i32 2)
  5130. %5133 = extractelement <4 x float> %5132, i32 0
  5131. %5134 = extractelement <4 x float> %5132, i32 1
  5132. %5135 = extractelement <4 x float> %5132, i32 2
  5133. %5136 = fmul float %5133, %5124
  5134. %5137 = fadd float %5136, %5039
  5135. %5138 = fmul float %5134, %5124
  5136. %5139 = fadd float %5138, %5041
  5137. %5140 = fmul float %5135, %5124
  5138. %5141 = fadd float %5140, %5043
  5139. %5142 = call float @llvm.AMDIL.clamp.(float %5053, float 0.000000e+00, float 1.000000e+00)
  5140. %5143 = call float @llvm.AMDIL.clamp.(float %5055, float 0.000000e+00, float 1.000000e+00)
  5141. %5144 = bitcast float %5142 to i32
  5142. %5145 = bitcast float %5143 to i32
  5143. %5146 = insertelement <4 x i32> undef, i32 %5144, i32 0
  5144. %5147 = insertelement <4 x i32> %5146, i32 %5145, i32 1
  5145. %5148 = insertelement <4 x i32> %5147, i32 0, i32 2
  5146. %5149 = bitcast <8 x i32> %38 to <32 x i8>
  5147. %5150 = bitcast <4 x i32> %40 to <16 x i8>
  5148. %5151 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5148, <32 x i8> %5149, <16 x i8> %5150, i32 2)
  5149. %5152 = extractelement <4 x float> %5151, i32 0
  5150. %5153 = extractelement <4 x float> %5151, i32 1
  5151. %5154 = extractelement <4 x float> %5151, i32 2
  5152. %5155 = extractelement <4 x float> %5151, i32 3
  5153. %5156 = fmul float %5155, %5155
  5154. %5157 = fmul float %5142, %106
  5155. %5158 = fadd float %5157, %110
  5156. %5159 = fmul float %5143, %107
  5157. %5160 = fadd float %5159, %111
  5158. %5161 = fmul float %5158, %5158
  5159. %5162 = fmul float %5160, %5160
  5160. %5163 = fadd float %5162, %5161
  5161. %5164 = fadd float %5163, 1.000000e+00
  5162. %5165 = call float @fabs(float %5164)
  5163. %5166 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5165)
  5164. %5167 = call float @llvm.minnum.f32(float %5166, float 0x47EFFFFFE0000000)
  5165. %5168 = fmul float %5167, %5158
  5166. %5169 = fmul float %5167, %5160
  5167. %5170 = fmul float %5167, %5156
  5168. %5171 = fmul float %5168, %5156
  5169. %5172 = fsub float %5171, %101
  5170. %5173 = fmul float %5169, %5156
  5171. %5174 = fsub float %5173, %102
  5172. %5175 = fsub float -0.000000e+00, %103
  5173. %5176 = fsub float %5175, %5170
  5174. %5177 = fmul float %5172, %5172
  5175. %5178 = fmul float %5174, %5174
  5176. %5179 = fadd float %5178, %5177
  5177. %5180 = fmul float %5176, %5176
  5178. %5181 = fadd float %5179, %5180
  5179. %5182 = fmul float %32, %5181
  5180. %5183 = fsub float 1.000000e+00, %5182
  5181. %5184 = call float @llvm.AMDIL.clamp.(float %5183, float 0.000000e+00, float 1.000000e+00)
  5182. %5185 = call float @fabs(float %5181)
  5183. %5186 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5185)
  5184. %5187 = call float @llvm.minnum.f32(float %5186, float 0x47EFFFFFE0000000)
  5185. %5188 = fmul float %5187, %5172
  5186. %5189 = fmul float %5187, %5174
  5187. %5190 = fmul float %5187, %5176
  5188. %5191 = fmul float %5188, %5152
  5189. %5192 = fmul float %5189, %5153
  5190. %5193 = fadd float %5192, %5191
  5191. %5194 = fmul float %5190, %5154
  5192. %5195 = fadd float %5193, %5194
  5193. %5196 = fsub float %33, %5195
  5194. %5197 = call float @llvm.AMDIL.clamp.(float %5196, float 0.000000e+00, float 1.000000e+00)
  5195. %5198 = fmul float %5188, %68
  5196. %5199 = fmul float %5189, %69
  5197. %5200 = fadd float %5199, %5198
  5198. %5201 = fmul float %5190, %70
  5199. %5202 = fadd float %5200, %5201
  5200. %5203 = fadd float %5202, %34
  5201. %5204 = call float @llvm.AMDIL.clamp.(float %5203, float 0.000000e+00, float 1.000000e+00)
  5202. %5205 = fmul float %5197, %5204
  5203. %5206 = fmul float %5205, %5184
  5204. %5207 = bitcast float %5142 to i32
  5205. %5208 = bitcast float %5143 to i32
  5206. %5209 = insertelement <4 x i32> undef, i32 %5207, i32 0
  5207. %5210 = insertelement <4 x i32> %5209, i32 %5208, i32 1
  5208. %5211 = insertelement <4 x i32> %5210, i32 0, i32 2
  5209. %5212 = bitcast <8 x i32> %42 to <32 x i8>
  5210. %5213 = bitcast <4 x i32> %44 to <16 x i8>
  5211. %5214 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5211, <32 x i8> %5212, <16 x i8> %5213, i32 2)
  5212. %5215 = extractelement <4 x float> %5214, i32 0
  5213. %5216 = extractelement <4 x float> %5214, i32 1
  5214. %5217 = extractelement <4 x float> %5214, i32 2
  5215. %5218 = fmul float %5215, %5206
  5216. %5219 = fadd float %5218, %5137
  5217. %5220 = fmul float %5216, %5206
  5218. %5221 = fadd float %5220, %5139
  5219. %5222 = fmul float %5217, %5206
  5220. %5223 = fadd float %5222, %5141
  5221. %5224 = fmul float %5219, 0x3FA5555560000000
  5222. %5225 = fmul float %5221, 0x3FA5555560000000
  5223. %5226 = fmul float %5223, 0x3FA5555560000000
  5224. br label %ENDIF
  5225.  
  5226. ELSE58: ; preds = %ELSE
  5227. %5227 = fcmp olt float %25, %75
  5228. br i1 %5227, label %IF60, label %ENDIF
  5229.  
  5230. IF60: ; preds = %ELSE58
  5231. %5228 = fmul float %87, 0x3F50624DE0000000
  5232. %5229 = fadd float %5228, %88
  5233. %5230 = fmul float %90, 0x3F50624DE0000000
  5234. %5231 = fsub float %5230, %87
  5235. %5232 = fmul float %87, 0x3F50624DE0000000
  5236. %5233 = fadd float %5232, %88
  5237. %5234 = fmul float %90, 0x3F50624DE0000000
  5238. %5235 = fsub float %5234, %87
  5239. %5236 = fmul float %5233, 0x3FE2147AE0000000
  5240. %5237 = fadd float %5236, %51
  5241. %5238 = fmul float %5235, 0x3FE2147AE0000000
  5242. %5239 = fadd float %5238, %52
  5243. %5240 = fmul float %5229, 0x3FDB53F7C0000000
  5244. %5241 = fadd float %5240, %51
  5245. %5242 = fmul float %5231, 0x3FDB53F7C0000000
  5246. %5243 = fadd float %5242, %52
  5247. %5244 = call float @llvm.AMDIL.clamp.(float %5241, float 0.000000e+00, float 1.000000e+00)
  5248. %5245 = call float @llvm.AMDIL.clamp.(float %5243, float 0.000000e+00, float 1.000000e+00)
  5249. %5246 = bitcast float %5244 to i32
  5250. %5247 = bitcast float %5245 to i32
  5251. %5248 = insertelement <4 x i32> undef, i32 %5246, i32 0
  5252. %5249 = insertelement <4 x i32> %5248, i32 %5247, i32 1
  5253. %5250 = insertelement <4 x i32> %5249, i32 0, i32 2
  5254. %5251 = bitcast <8 x i32> %38 to <32 x i8>
  5255. %5252 = bitcast <4 x i32> %40 to <16 x i8>
  5256. %5253 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5250, <32 x i8> %5251, <16 x i8> %5252, i32 2)
  5257. %5254 = extractelement <4 x float> %5253, i32 0
  5258. %5255 = extractelement <4 x float> %5253, i32 1
  5259. %5256 = extractelement <4 x float> %5253, i32 2
  5260. %5257 = extractelement <4 x float> %5253, i32 3
  5261. %5258 = fmul float %5257, %5257
  5262. %5259 = fmul float %5244, %106
  5263. %5260 = fadd float %5259, %110
  5264. %5261 = fmul float %5245, %107
  5265. %5262 = fadd float %5261, %111
  5266. %5263 = fmul float %5260, %5260
  5267. %5264 = fmul float %5262, %5262
  5268. %5265 = fadd float %5264, %5263
  5269. %5266 = fadd float %5265, 1.000000e+00
  5270. %5267 = call float @fabs(float %5266)
  5271. %5268 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5267)
  5272. %5269 = call float @llvm.minnum.f32(float %5268, float 0x47EFFFFFE0000000)
  5273. %5270 = fmul float %5269, %5260
  5274. %5271 = fmul float %5269, %5262
  5275. %5272 = fmul float %5269, %5258
  5276. %5273 = fmul float %5270, %5258
  5277. %5274 = fsub float %5273, %101
  5278. %5275 = fmul float %5271, %5258
  5279. %5276 = fsub float %5275, %102
  5280. %5277 = fsub float -0.000000e+00, %103
  5281. %5278 = fsub float %5277, %5272
  5282. %5279 = fmul float %5274, %5274
  5283. %5280 = fmul float %5276, %5276
  5284. %5281 = fadd float %5280, %5279
  5285. %5282 = fmul float %5278, %5278
  5286. %5283 = fadd float %5281, %5282
  5287. %5284 = fmul float %32, %5283
  5288. %5285 = fsub float 1.000000e+00, %5284
  5289. %5286 = call float @llvm.AMDIL.clamp.(float %5285, float 0.000000e+00, float 1.000000e+00)
  5290. %5287 = call float @fabs(float %5283)
  5291. %5288 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5287)
  5292. %5289 = call float @llvm.minnum.f32(float %5288, float 0x47EFFFFFE0000000)
  5293. %5290 = fmul float %5289, %5274
  5294. %5291 = fmul float %5289, %5276
  5295. %5292 = fmul float %5289, %5278
  5296. %5293 = fmul float %5290, %5254
  5297. %5294 = fmul float %5291, %5255
  5298. %5295 = fadd float %5294, %5293
  5299. %5296 = fmul float %5292, %5256
  5300. %5297 = fadd float %5295, %5296
  5301. %5298 = fsub float %33, %5297
  5302. %5299 = call float @llvm.AMDIL.clamp.(float %5298, float 0.000000e+00, float 1.000000e+00)
  5303. %5300 = fmul float %5290, %68
  5304. %5301 = fmul float %5291, %69
  5305. %5302 = fadd float %5301, %5300
  5306. %5303 = fmul float %5292, %70
  5307. %5304 = fadd float %5302, %5303
  5308. %5305 = fadd float %5304, %34
  5309. %5306 = call float @llvm.AMDIL.clamp.(float %5305, float 0.000000e+00, float 1.000000e+00)
  5310. %5307 = fmul float %5299, %5306
  5311. %5308 = fmul float %5307, %5286
  5312. %5309 = bitcast float %5244 to i32
  5313. %5310 = bitcast float %5245 to i32
  5314. %5311 = insertelement <4 x i32> undef, i32 %5309, i32 0
  5315. %5312 = insertelement <4 x i32> %5311, i32 %5310, i32 1
  5316. %5313 = insertelement <4 x i32> %5312, i32 0, i32 2
  5317. %5314 = bitcast <8 x i32> %42 to <32 x i8>
  5318. %5315 = bitcast <4 x i32> %44 to <16 x i8>
  5319. %5316 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5313, <32 x i8> %5314, <16 x i8> %5315, i32 2)
  5320. %5317 = extractelement <4 x float> %5316, i32 0
  5321. %5318 = extractelement <4 x float> %5316, i32 1
  5322. %5319 = extractelement <4 x float> %5316, i32 2
  5323. %5320 = call float @llvm.AMDIL.clamp.(float %5237, float 0.000000e+00, float 1.000000e+00)
  5324. %5321 = call float @llvm.AMDIL.clamp.(float %5239, float 0.000000e+00, float 1.000000e+00)
  5325. %5322 = bitcast float %5320 to i32
  5326. %5323 = bitcast float %5321 to i32
  5327. %5324 = insertelement <4 x i32> undef, i32 %5322, i32 0
  5328. %5325 = insertelement <4 x i32> %5324, i32 %5323, i32 1
  5329. %5326 = insertelement <4 x i32> %5325, i32 0, i32 2
  5330. %5327 = bitcast <8 x i32> %38 to <32 x i8>
  5331. %5328 = bitcast <4 x i32> %40 to <16 x i8>
  5332. %5329 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5326, <32 x i8> %5327, <16 x i8> %5328, i32 2)
  5333. %5330 = extractelement <4 x float> %5329, i32 0
  5334. %5331 = extractelement <4 x float> %5329, i32 1
  5335. %5332 = extractelement <4 x float> %5329, i32 2
  5336. %5333 = extractelement <4 x float> %5329, i32 3
  5337. %5334 = fmul float %5333, %5333
  5338. %5335 = fmul float %5320, %106
  5339. %5336 = fadd float %5335, %110
  5340. %5337 = fmul float %5321, %107
  5341. %5338 = fadd float %5337, %111
  5342. %5339 = fmul float %5336, %5336
  5343. %5340 = fmul float %5338, %5338
  5344. %5341 = fadd float %5340, %5339
  5345. %5342 = fadd float %5341, 1.000000e+00
  5346. %5343 = call float @fabs(float %5342)
  5347. %5344 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5343)
  5348. %5345 = call float @llvm.minnum.f32(float %5344, float 0x47EFFFFFE0000000)
  5349. %5346 = fmul float %5345, %5336
  5350. %5347 = fmul float %5345, %5338
  5351. %5348 = fmul float %5345, %5334
  5352. %5349 = fmul float %5346, %5334
  5353. %5350 = fsub float %5349, %101
  5354. %5351 = fmul float %5347, %5334
  5355. %5352 = fsub float %5351, %102
  5356. %5353 = fsub float -0.000000e+00, %103
  5357. %5354 = fsub float %5353, %5348
  5358. %5355 = fmul float %5350, %5350
  5359. %5356 = fmul float %5352, %5352
  5360. %5357 = fadd float %5356, %5355
  5361. %5358 = fmul float %5354, %5354
  5362. %5359 = fadd float %5357, %5358
  5363. %5360 = fmul float %32, %5359
  5364. %5361 = fsub float 1.000000e+00, %5360
  5365. %5362 = call float @llvm.AMDIL.clamp.(float %5361, float 0.000000e+00, float 1.000000e+00)
  5366. %5363 = call float @fabs(float %5359)
  5367. %5364 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5363)
  5368. %5365 = call float @llvm.minnum.f32(float %5364, float 0x47EFFFFFE0000000)
  5369. %5366 = fmul float %5365, %5350
  5370. %5367 = fmul float %5365, %5352
  5371. %5368 = fmul float %5365, %5354
  5372. %5369 = fmul float %5366, %5330
  5373. %5370 = fmul float %5367, %5331
  5374. %5371 = fadd float %5370, %5369
  5375. %5372 = fmul float %5368, %5332
  5376. %5373 = fadd float %5371, %5372
  5377. %5374 = fsub float %33, %5373
  5378. %5375 = call float @llvm.AMDIL.clamp.(float %5374, float 0.000000e+00, float 1.000000e+00)
  5379. %5376 = fmul float %5366, %68
  5380. %5377 = fmul float %5367, %69
  5381. %5378 = fadd float %5377, %5376
  5382. %5379 = fmul float %5368, %70
  5383. %5380 = fadd float %5378, %5379
  5384. %5381 = fadd float %5380, %34
  5385. %5382 = call float @llvm.AMDIL.clamp.(float %5381, float 0.000000e+00, float 1.000000e+00)
  5386. %5383 = fmul float %5375, %5382
  5387. %5384 = fmul float %5383, %5362
  5388. %5385 = bitcast float %5320 to i32
  5389. %5386 = bitcast float %5321 to i32
  5390. %5387 = insertelement <4 x i32> undef, i32 %5385, i32 0
  5391. %5388 = insertelement <4 x i32> %5387, i32 %5386, i32 1
  5392. %5389 = insertelement <4 x i32> %5388, i32 0, i32 2
  5393. %5390 = bitcast <8 x i32> %42 to <32 x i8>
  5394. %5391 = bitcast <4 x i32> %44 to <16 x i8>
  5395. %5392 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5389, <32 x i8> %5390, <16 x i8> %5391, i32 2)
  5396. %5393 = extractelement <4 x float> %5392, i32 0
  5397. %5394 = extractelement <4 x float> %5392, i32 1
  5398. %5395 = extractelement <4 x float> %5392, i32 2
  5399. %5396 = fmul float %5384, %5393
  5400. %5397 = fmul float %5384, %5394
  5401. %5398 = fmul float %5384, %5395
  5402. %5399 = fmul float %5317, %5308
  5403. %5400 = fadd float %5399, %5396
  5404. %5401 = fmul float %5318, %5308
  5405. %5402 = fadd float %5401, %5397
  5406. %5403 = fmul float %5319, %5308
  5407. %5404 = fadd float %5403, %5398
  5408. %5405 = fmul float %88, 0x3FC4FDF3C0000000
  5409. %5406 = fmul float %87, 0xBFC4FDF3C0000000
  5410. %5407 = fmul float %88, 0xBFD19999A0000000
  5411. %5408 = fmul float %87, 0x3FD19999A0000000
  5412. %5409 = fmul float %87, 0x3FEF8D4FE0000000
  5413. %5410 = fadd float %5409, %5405
  5414. %5411 = fmul float %90, 0x3FEF8D4FE0000000
  5415. %5412 = fadd float %5411, %5406
  5416. %5413 = fmul float %87, 0x3FEF8D4FE0000000
  5417. %5414 = fadd float %5413, %5405
  5418. %5415 = fmul float %90, 0x3FEF8D4FE0000000
  5419. %5416 = fadd float %5415, %5406
  5420. %5417 = fmul float %5414, 0x3FE5168720000000
  5421. %5418 = fadd float %5417, %51
  5422. %5419 = fmul float %5416, 0x3FE5168720000000
  5423. %5420 = fadd float %5419, %52
  5424. %5421 = fmul float %5410, 0x3FD0624DE0000000
  5425. %5422 = fadd float %5421, %51
  5426. %5423 = fmul float %5412, 0x3FD0624DE0000000
  5427. %5424 = fadd float %5423, %52
  5428. %5425 = call float @llvm.AMDIL.clamp.(float %5422, float 0.000000e+00, float 1.000000e+00)
  5429. %5426 = call float @llvm.AMDIL.clamp.(float %5424, float 0.000000e+00, float 1.000000e+00)
  5430. %5427 = bitcast float %5425 to i32
  5431. %5428 = bitcast float %5426 to i32
  5432. %5429 = insertelement <4 x i32> undef, i32 %5427, i32 0
  5433. %5430 = insertelement <4 x i32> %5429, i32 %5428, i32 1
  5434. %5431 = insertelement <4 x i32> %5430, i32 0, i32 2
  5435. %5432 = bitcast <8 x i32> %38 to <32 x i8>
  5436. %5433 = bitcast <4 x i32> %40 to <16 x i8>
  5437. %5434 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5431, <32 x i8> %5432, <16 x i8> %5433, i32 2)
  5438. %5435 = extractelement <4 x float> %5434, i32 0
  5439. %5436 = extractelement <4 x float> %5434, i32 1
  5440. %5437 = extractelement <4 x float> %5434, i32 2
  5441. %5438 = extractelement <4 x float> %5434, i32 3
  5442. %5439 = fmul float %5438, %5438
  5443. %5440 = fmul float %5425, %106
  5444. %5441 = fadd float %5440, %110
  5445. %5442 = fmul float %5426, %107
  5446. %5443 = fadd float %5442, %111
  5447. %5444 = fmul float %5441, %5441
  5448. %5445 = fmul float %5443, %5443
  5449. %5446 = fadd float %5445, %5444
  5450. %5447 = fadd float %5446, 1.000000e+00
  5451. %5448 = call float @fabs(float %5447)
  5452. %5449 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5448)
  5453. %5450 = call float @llvm.minnum.f32(float %5449, float 0x47EFFFFFE0000000)
  5454. %5451 = fmul float %5450, %5441
  5455. %5452 = fmul float %5450, %5443
  5456. %5453 = fmul float %5450, %5439
  5457. %5454 = fmul float %5451, %5439
  5458. %5455 = fsub float %5454, %101
  5459. %5456 = fmul float %5452, %5439
  5460. %5457 = fsub float %5456, %102
  5461. %5458 = fsub float -0.000000e+00, %103
  5462. %5459 = fsub float %5458, %5453
  5463. %5460 = fmul float %5455, %5455
  5464. %5461 = fmul float %5457, %5457
  5465. %5462 = fadd float %5461, %5460
  5466. %5463 = fmul float %5459, %5459
  5467. %5464 = fadd float %5462, %5463
  5468. %5465 = fmul float %32, %5464
  5469. %5466 = fsub float 1.000000e+00, %5465
  5470. %5467 = call float @llvm.AMDIL.clamp.(float %5466, float 0.000000e+00, float 1.000000e+00)
  5471. %5468 = call float @fabs(float %5464)
  5472. %5469 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5468)
  5473. %5470 = call float @llvm.minnum.f32(float %5469, float 0x47EFFFFFE0000000)
  5474. %5471 = fmul float %5470, %5455
  5475. %5472 = fmul float %5470, %5457
  5476. %5473 = fmul float %5470, %5459
  5477. %5474 = fmul float %5471, %5435
  5478. %5475 = fmul float %5472, %5436
  5479. %5476 = fadd float %5475, %5474
  5480. %5477 = fmul float %5473, %5437
  5481. %5478 = fadd float %5476, %5477
  5482. %5479 = fsub float %33, %5478
  5483. %5480 = call float @llvm.AMDIL.clamp.(float %5479, float 0.000000e+00, float 1.000000e+00)
  5484. %5481 = fmul float %5471, %68
  5485. %5482 = fmul float %5472, %69
  5486. %5483 = fadd float %5482, %5481
  5487. %5484 = fmul float %5473, %70
  5488. %5485 = fadd float %5483, %5484
  5489. %5486 = fadd float %5485, %34
  5490. %5487 = call float @llvm.AMDIL.clamp.(float %5486, float 0.000000e+00, float 1.000000e+00)
  5491. %5488 = fmul float %5480, %5487
  5492. %5489 = fmul float %5488, %5467
  5493. %5490 = bitcast float %5425 to i32
  5494. %5491 = bitcast float %5426 to i32
  5495. %5492 = insertelement <4 x i32> undef, i32 %5490, i32 0
  5496. %5493 = insertelement <4 x i32> %5492, i32 %5491, i32 1
  5497. %5494 = insertelement <4 x i32> %5493, i32 0, i32 2
  5498. %5495 = bitcast <8 x i32> %42 to <32 x i8>
  5499. %5496 = bitcast <4 x i32> %44 to <16 x i8>
  5500. %5497 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5494, <32 x i8> %5495, <16 x i8> %5496, i32 2)
  5501. %5498 = extractelement <4 x float> %5497, i32 0
  5502. %5499 = extractelement <4 x float> %5497, i32 1
  5503. %5500 = extractelement <4 x float> %5497, i32 2
  5504. %5501 = fmul float %5498, %5489
  5505. %5502 = fadd float %5501, %5400
  5506. %5503 = fmul float %5499, %5489
  5507. %5504 = fadd float %5503, %5402
  5508. %5505 = fmul float %5500, %5489
  5509. %5506 = fadd float %5505, %5404
  5510. %5507 = call float @llvm.AMDIL.clamp.(float %5418, float 0.000000e+00, float 1.000000e+00)
  5511. %5508 = call float @llvm.AMDIL.clamp.(float %5420, float 0.000000e+00, float 1.000000e+00)
  5512. %5509 = bitcast float %5507 to i32
  5513. %5510 = bitcast float %5508 to i32
  5514. %5511 = insertelement <4 x i32> undef, i32 %5509, i32 0
  5515. %5512 = insertelement <4 x i32> %5511, i32 %5510, i32 1
  5516. %5513 = insertelement <4 x i32> %5512, i32 0, i32 2
  5517. %5514 = bitcast <8 x i32> %38 to <32 x i8>
  5518. %5515 = bitcast <4 x i32> %40 to <16 x i8>
  5519. %5516 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5513, <32 x i8> %5514, <16 x i8> %5515, i32 2)
  5520. %5517 = extractelement <4 x float> %5516, i32 0
  5521. %5518 = extractelement <4 x float> %5516, i32 1
  5522. %5519 = extractelement <4 x float> %5516, i32 2
  5523. %5520 = extractelement <4 x float> %5516, i32 3
  5524. %5521 = fmul float %5520, %5520
  5525. %5522 = fmul float %5507, %106
  5526. %5523 = fadd float %5522, %110
  5527. %5524 = fmul float %5508, %107
  5528. %5525 = fadd float %5524, %111
  5529. %5526 = fmul float %5523, %5523
  5530. %5527 = fmul float %5525, %5525
  5531. %5528 = fadd float %5527, %5526
  5532. %5529 = fadd float %5528, 1.000000e+00
  5533. %5530 = call float @fabs(float %5529)
  5534. %5531 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5530)
  5535. %5532 = call float @llvm.minnum.f32(float %5531, float 0x47EFFFFFE0000000)
  5536. %5533 = fmul float %5532, %5523
  5537. %5534 = fmul float %5532, %5525
  5538. %5535 = fmul float %5532, %5521
  5539. %5536 = fmul float %5533, %5521
  5540. %5537 = fsub float %5536, %101
  5541. %5538 = fmul float %5534, %5521
  5542. %5539 = fsub float %5538, %102
  5543. %5540 = fsub float -0.000000e+00, %103
  5544. %5541 = fsub float %5540, %5535
  5545. %5542 = fmul float %5537, %5537
  5546. %5543 = fmul float %5539, %5539
  5547. %5544 = fadd float %5543, %5542
  5548. %5545 = fmul float %5541, %5541
  5549. %5546 = fadd float %5544, %5545
  5550. %5547 = fmul float %32, %5546
  5551. %5548 = fsub float 1.000000e+00, %5547
  5552. %5549 = call float @llvm.AMDIL.clamp.(float %5548, float 0.000000e+00, float 1.000000e+00)
  5553. %5550 = call float @fabs(float %5546)
  5554. %5551 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5550)
  5555. %5552 = call float @llvm.minnum.f32(float %5551, float 0x47EFFFFFE0000000)
  5556. %5553 = fmul float %5552, %5537
  5557. %5554 = fmul float %5552, %5539
  5558. %5555 = fmul float %5552, %5541
  5559. %5556 = fmul float %5553, %5517
  5560. %5557 = fmul float %5554, %5518
  5561. %5558 = fadd float %5557, %5556
  5562. %5559 = fmul float %5555, %5519
  5563. %5560 = fadd float %5558, %5559
  5564. %5561 = fsub float %33, %5560
  5565. %5562 = call float @llvm.AMDIL.clamp.(float %5561, float 0.000000e+00, float 1.000000e+00)
  5566. %5563 = fmul float %5553, %68
  5567. %5564 = fmul float %5554, %69
  5568. %5565 = fadd float %5564, %5563
  5569. %5566 = fmul float %5555, %70
  5570. %5567 = fadd float %5565, %5566
  5571. %5568 = fadd float %5567, %34
  5572. %5569 = call float @llvm.AMDIL.clamp.(float %5568, float 0.000000e+00, float 1.000000e+00)
  5573. %5570 = fmul float %5562, %5569
  5574. %5571 = fmul float %5570, %5549
  5575. %5572 = bitcast float %5507 to i32
  5576. %5573 = bitcast float %5508 to i32
  5577. %5574 = insertelement <4 x i32> undef, i32 %5572, i32 0
  5578. %5575 = insertelement <4 x i32> %5574, i32 %5573, i32 1
  5579. %5576 = insertelement <4 x i32> %5575, i32 0, i32 2
  5580. %5577 = bitcast <8 x i32> %42 to <32 x i8>
  5581. %5578 = bitcast <4 x i32> %44 to <16 x i8>
  5582. %5579 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5576, <32 x i8> %5577, <16 x i8> %5578, i32 2)
  5583. %5580 = extractelement <4 x float> %5579, i32 0
  5584. %5581 = extractelement <4 x float> %5579, i32 1
  5585. %5582 = extractelement <4 x float> %5579, i32 2
  5586. %5583 = fmul float %5580, %5571
  5587. %5584 = fadd float %5583, %5502
  5588. %5585 = fmul float %5581, %5571
  5589. %5586 = fadd float %5585, %5504
  5590. %5587 = fmul float %5582, %5571
  5591. %5588 = fadd float %5587, %5506
  5592. %5589 = fmul float %87, 0x3FEEC08320000000
  5593. %5590 = fadd float %5589, %5407
  5594. %5591 = fmul float %90, 0x3FEEC08320000000
  5595. %5592 = fadd float %5591, %5408
  5596. %5593 = fmul float %87, 0x3FEEC08320000000
  5597. %5594 = fadd float %5593, %5407
  5598. %5595 = fmul float %90, 0x3FEEC08320000000
  5599. %5596 = fadd float %5595, %5408
  5600. %5597 = fmul float %5594, 0x3FEBCED920000000
  5601. %5598 = fadd float %5597, %51
  5602. %5599 = fmul float %5596, 0x3FEBCED920000000
  5603. %5600 = fadd float %5599, %52
  5604. %5601 = fmul float %5590, 0x3FCB22D0E0000000
  5605. %5602 = fadd float %5601, %51
  5606. %5603 = fmul float %5592, 0x3FCB22D0E0000000
  5607. %5604 = fadd float %5603, %52
  5608. %5605 = call float @llvm.AMDIL.clamp.(float %5602, float 0.000000e+00, float 1.000000e+00)
  5609. %5606 = call float @llvm.AMDIL.clamp.(float %5604, float 0.000000e+00, float 1.000000e+00)
  5610. %5607 = bitcast float %5605 to i32
  5611. %5608 = bitcast float %5606 to i32
  5612. %5609 = insertelement <4 x i32> undef, i32 %5607, i32 0
  5613. %5610 = insertelement <4 x i32> %5609, i32 %5608, i32 1
  5614. %5611 = insertelement <4 x i32> %5610, i32 0, i32 2
  5615. %5612 = bitcast <8 x i32> %38 to <32 x i8>
  5616. %5613 = bitcast <4 x i32> %40 to <16 x i8>
  5617. %5614 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5611, <32 x i8> %5612, <16 x i8> %5613, i32 2)
  5618. %5615 = extractelement <4 x float> %5614, i32 0
  5619. %5616 = extractelement <4 x float> %5614, i32 1
  5620. %5617 = extractelement <4 x float> %5614, i32 2
  5621. %5618 = extractelement <4 x float> %5614, i32 3
  5622. %5619 = fmul float %5618, %5618
  5623. %5620 = fmul float %5605, %106
  5624. %5621 = fadd float %5620, %110
  5625. %5622 = fmul float %5606, %107
  5626. %5623 = fadd float %5622, %111
  5627. %5624 = fmul float %5621, %5621
  5628. %5625 = fmul float %5623, %5623
  5629. %5626 = fadd float %5625, %5624
  5630. %5627 = fadd float %5626, 1.000000e+00
  5631. %5628 = call float @fabs(float %5627)
  5632. %5629 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5628)
  5633. %5630 = call float @llvm.minnum.f32(float %5629, float 0x47EFFFFFE0000000)
  5634. %5631 = fmul float %5630, %5621
  5635. %5632 = fmul float %5630, %5623
  5636. %5633 = fmul float %5630, %5619
  5637. %5634 = fmul float %5631, %5619
  5638. %5635 = fsub float %5634, %101
  5639. %5636 = fmul float %5632, %5619
  5640. %5637 = fsub float %5636, %102
  5641. %5638 = fsub float -0.000000e+00, %103
  5642. %5639 = fsub float %5638, %5633
  5643. %5640 = fmul float %5635, %5635
  5644. %5641 = fmul float %5637, %5637
  5645. %5642 = fadd float %5641, %5640
  5646. %5643 = fmul float %5639, %5639
  5647. %5644 = fadd float %5642, %5643
  5648. %5645 = fmul float %32, %5644
  5649. %5646 = fsub float 1.000000e+00, %5645
  5650. %5647 = call float @llvm.AMDIL.clamp.(float %5646, float 0.000000e+00, float 1.000000e+00)
  5651. %5648 = call float @fabs(float %5644)
  5652. %5649 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5648)
  5653. %5650 = call float @llvm.minnum.f32(float %5649, float 0x47EFFFFFE0000000)
  5654. %5651 = fmul float %5650, %5635
  5655. %5652 = fmul float %5650, %5637
  5656. %5653 = fmul float %5650, %5639
  5657. %5654 = fmul float %5651, %5615
  5658. %5655 = fmul float %5652, %5616
  5659. %5656 = fadd float %5655, %5654
  5660. %5657 = fmul float %5653, %5617
  5661. %5658 = fadd float %5656, %5657
  5662. %5659 = fsub float %33, %5658
  5663. %5660 = call float @llvm.AMDIL.clamp.(float %5659, float 0.000000e+00, float 1.000000e+00)
  5664. %5661 = fmul float %5651, %68
  5665. %5662 = fmul float %5652, %69
  5666. %5663 = fadd float %5662, %5661
  5667. %5664 = fmul float %5653, %70
  5668. %5665 = fadd float %5663, %5664
  5669. %5666 = fadd float %5665, %34
  5670. %5667 = call float @llvm.AMDIL.clamp.(float %5666, float 0.000000e+00, float 1.000000e+00)
  5671. %5668 = fmul float %5660, %5667
  5672. %5669 = fmul float %5668, %5647
  5673. %5670 = bitcast float %5605 to i32
  5674. %5671 = bitcast float %5606 to i32
  5675. %5672 = insertelement <4 x i32> undef, i32 %5670, i32 0
  5676. %5673 = insertelement <4 x i32> %5672, i32 %5671, i32 1
  5677. %5674 = insertelement <4 x i32> %5673, i32 0, i32 2
  5678. %5675 = bitcast <8 x i32> %42 to <32 x i8>
  5679. %5676 = bitcast <4 x i32> %44 to <16 x i8>
  5680. %5677 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5674, <32 x i8> %5675, <16 x i8> %5676, i32 2)
  5681. %5678 = extractelement <4 x float> %5677, i32 0
  5682. %5679 = extractelement <4 x float> %5677, i32 1
  5683. %5680 = extractelement <4 x float> %5677, i32 2
  5684. %5681 = fmul float %5678, %5669
  5685. %5682 = fadd float %5681, %5584
  5686. %5683 = fmul float %5679, %5669
  5687. %5684 = fadd float %5683, %5586
  5688. %5685 = fmul float %5680, %5669
  5689. %5686 = fadd float %5685, %5588
  5690. %5687 = call float @llvm.AMDIL.clamp.(float %5598, float 0.000000e+00, float 1.000000e+00)
  5691. %5688 = call float @llvm.AMDIL.clamp.(float %5600, float 0.000000e+00, float 1.000000e+00)
  5692. %5689 = bitcast float %5687 to i32
  5693. %5690 = bitcast float %5688 to i32
  5694. %5691 = insertelement <4 x i32> undef, i32 %5689, i32 0
  5695. %5692 = insertelement <4 x i32> %5691, i32 %5690, i32 1
  5696. %5693 = insertelement <4 x i32> %5692, i32 0, i32 2
  5697. %5694 = bitcast <8 x i32> %38 to <32 x i8>
  5698. %5695 = bitcast <4 x i32> %40 to <16 x i8>
  5699. %5696 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5693, <32 x i8> %5694, <16 x i8> %5695, i32 2)
  5700. %5697 = extractelement <4 x float> %5696, i32 0
  5701. %5698 = extractelement <4 x float> %5696, i32 1
  5702. %5699 = extractelement <4 x float> %5696, i32 2
  5703. %5700 = extractelement <4 x float> %5696, i32 3
  5704. %5701 = fmul float %5700, %5700
  5705. %5702 = fmul float %5687, %106
  5706. %5703 = fadd float %5702, %110
  5707. %5704 = fmul float %5688, %107
  5708. %5705 = fadd float %5704, %111
  5709. %5706 = fmul float %5703, %5703
  5710. %5707 = fmul float %5705, %5705
  5711. %5708 = fadd float %5707, %5706
  5712. %5709 = fadd float %5708, 1.000000e+00
  5713. %5710 = call float @fabs(float %5709)
  5714. %5711 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5710)
  5715. %5712 = call float @llvm.minnum.f32(float %5711, float 0x47EFFFFFE0000000)
  5716. %5713 = fmul float %5712, %5703
  5717. %5714 = fmul float %5712, %5705
  5718. %5715 = fmul float %5712, %5701
  5719. %5716 = fmul float %5713, %5701
  5720. %5717 = fsub float %5716, %101
  5721. %5718 = fmul float %5714, %5701
  5722. %5719 = fsub float %5718, %102
  5723. %5720 = fsub float -0.000000e+00, %103
  5724. %5721 = fsub float %5720, %5715
  5725. %5722 = fmul float %5717, %5717
  5726. %5723 = fmul float %5719, %5719
  5727. %5724 = fadd float %5723, %5722
  5728. %5725 = fmul float %5721, %5721
  5729. %5726 = fadd float %5724, %5725
  5730. %5727 = fmul float %32, %5726
  5731. %5728 = fsub float 1.000000e+00, %5727
  5732. %5729 = call float @llvm.AMDIL.clamp.(float %5728, float 0.000000e+00, float 1.000000e+00)
  5733. %5730 = call float @fabs(float %5726)
  5734. %5731 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5730)
  5735. %5732 = call float @llvm.minnum.f32(float %5731, float 0x47EFFFFFE0000000)
  5736. %5733 = fmul float %5732, %5717
  5737. %5734 = fmul float %5732, %5719
  5738. %5735 = fmul float %5732, %5721
  5739. %5736 = fmul float %5733, %5697
  5740. %5737 = fmul float %5734, %5698
  5741. %5738 = fadd float %5737, %5736
  5742. %5739 = fmul float %5735, %5699
  5743. %5740 = fadd float %5738, %5739
  5744. %5741 = fsub float %33, %5740
  5745. %5742 = call float @llvm.AMDIL.clamp.(float %5741, float 0.000000e+00, float 1.000000e+00)
  5746. %5743 = fmul float %5733, %68
  5747. %5744 = fmul float %5734, %69
  5748. %5745 = fadd float %5744, %5743
  5749. %5746 = fmul float %5735, %70
  5750. %5747 = fadd float %5745, %5746
  5751. %5748 = fadd float %5747, %34
  5752. %5749 = call float @llvm.AMDIL.clamp.(float %5748, float 0.000000e+00, float 1.000000e+00)
  5753. %5750 = fmul float %5742, %5749
  5754. %5751 = fmul float %5750, %5729
  5755. %5752 = bitcast float %5687 to i32
  5756. %5753 = bitcast float %5688 to i32
  5757. %5754 = insertelement <4 x i32> undef, i32 %5752, i32 0
  5758. %5755 = insertelement <4 x i32> %5754, i32 %5753, i32 1
  5759. %5756 = insertelement <4 x i32> %5755, i32 0, i32 2
  5760. %5757 = bitcast <8 x i32> %42 to <32 x i8>
  5761. %5758 = bitcast <4 x i32> %44 to <16 x i8>
  5762. %5759 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5756, <32 x i8> %5757, <16 x i8> %5758, i32 2)
  5763. %5760 = extractelement <4 x float> %5759, i32 0
  5764. %5761 = extractelement <4 x float> %5759, i32 1
  5765. %5762 = extractelement <4 x float> %5759, i32 2
  5766. %5763 = fmul float %5760, %5751
  5767. %5764 = fadd float %5763, %5682
  5768. %5765 = fmul float %5761, %5751
  5769. %5766 = fadd float %5765, %5684
  5770. %5767 = fmul float %5762, %5751
  5771. %5768 = fadd float %5767, %5686
  5772. %5769 = fmul float %88, 0xBFEF2B0200000000
  5773. %5770 = fmul float %87, 0x3FEF2B0200000000
  5774. %5771 = fmul float %88, 0xBFEF8D4FE0000000
  5775. %5772 = fmul float %87, 0x3FEF8D4FE0000000
  5776. %5773 = fmul float %87, 0x3FCD2F1AA0000000
  5777. %5774 = fadd float %5773, %5769
  5778. %5775 = fmul float %90, 0x3FCD2F1AA0000000
  5779. %5776 = fadd float %5775, %5770
  5780. %5777 = fmul float %87, 0x3FCD2F1AA0000000
  5781. %5778 = fadd float %5777, %5769
  5782. %5779 = fmul float %90, 0x3FCD2F1AA0000000
  5783. %5780 = fadd float %5779, %5770
  5784. %5781 = fmul float %5778, 0x3FE69FBE80000000
  5785. %5782 = fadd float %5781, %51
  5786. %5783 = fmul float %5780, 0x3FE69FBE80000000
  5787. %5784 = fadd float %5783, %52
  5788. %5785 = fmul float %5774, 0x3FDD4FDF40000000
  5789. %5786 = fadd float %5785, %51
  5790. %5787 = fmul float %5776, 0x3FDD4FDF40000000
  5791. %5788 = fadd float %5787, %52
  5792. %5789 = call float @llvm.AMDIL.clamp.(float %5786, float 0.000000e+00, float 1.000000e+00)
  5793. %5790 = call float @llvm.AMDIL.clamp.(float %5788, float 0.000000e+00, float 1.000000e+00)
  5794. %5791 = bitcast float %5789 to i32
  5795. %5792 = bitcast float %5790 to i32
  5796. %5793 = insertelement <4 x i32> undef, i32 %5791, i32 0
  5797. %5794 = insertelement <4 x i32> %5793, i32 %5792, i32 1
  5798. %5795 = insertelement <4 x i32> %5794, i32 0, i32 2
  5799. %5796 = bitcast <8 x i32> %38 to <32 x i8>
  5800. %5797 = bitcast <4 x i32> %40 to <16 x i8>
  5801. %5798 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5795, <32 x i8> %5796, <16 x i8> %5797, i32 2)
  5802. %5799 = extractelement <4 x float> %5798, i32 0
  5803. %5800 = extractelement <4 x float> %5798, i32 1
  5804. %5801 = extractelement <4 x float> %5798, i32 2
  5805. %5802 = extractelement <4 x float> %5798, i32 3
  5806. %5803 = fmul float %5802, %5802
  5807. %5804 = fmul float %5789, %106
  5808. %5805 = fadd float %5804, %110
  5809. %5806 = fmul float %5790, %107
  5810. %5807 = fadd float %5806, %111
  5811. %5808 = fmul float %5805, %5805
  5812. %5809 = fmul float %5807, %5807
  5813. %5810 = fadd float %5809, %5808
  5814. %5811 = fadd float %5810, 1.000000e+00
  5815. %5812 = call float @fabs(float %5811)
  5816. %5813 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5812)
  5817. %5814 = call float @llvm.minnum.f32(float %5813, float 0x47EFFFFFE0000000)
  5818. %5815 = fmul float %5814, %5805
  5819. %5816 = fmul float %5814, %5807
  5820. %5817 = fmul float %5814, %5803
  5821. %5818 = fmul float %5815, %5803
  5822. %5819 = fsub float %5818, %101
  5823. %5820 = fmul float %5816, %5803
  5824. %5821 = fsub float %5820, %102
  5825. %5822 = fsub float -0.000000e+00, %103
  5826. %5823 = fsub float %5822, %5817
  5827. %5824 = fmul float %5819, %5819
  5828. %5825 = fmul float %5821, %5821
  5829. %5826 = fadd float %5825, %5824
  5830. %5827 = fmul float %5823, %5823
  5831. %5828 = fadd float %5826, %5827
  5832. %5829 = fmul float %32, %5828
  5833. %5830 = fsub float 1.000000e+00, %5829
  5834. %5831 = call float @llvm.AMDIL.clamp.(float %5830, float 0.000000e+00, float 1.000000e+00)
  5835. %5832 = call float @fabs(float %5828)
  5836. %5833 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5832)
  5837. %5834 = call float @llvm.minnum.f32(float %5833, float 0x47EFFFFFE0000000)
  5838. %5835 = fmul float %5834, %5819
  5839. %5836 = fmul float %5834, %5821
  5840. %5837 = fmul float %5834, %5823
  5841. %5838 = fmul float %5835, %5799
  5842. %5839 = fmul float %5836, %5800
  5843. %5840 = fadd float %5839, %5838
  5844. %5841 = fmul float %5837, %5801
  5845. %5842 = fadd float %5840, %5841
  5846. %5843 = fsub float %33, %5842
  5847. %5844 = call float @llvm.AMDIL.clamp.(float %5843, float 0.000000e+00, float 1.000000e+00)
  5848. %5845 = fmul float %5835, %68
  5849. %5846 = fmul float %5836, %69
  5850. %5847 = fadd float %5846, %5845
  5851. %5848 = fmul float %5837, %70
  5852. %5849 = fadd float %5847, %5848
  5853. %5850 = fadd float %5849, %34
  5854. %5851 = call float @llvm.AMDIL.clamp.(float %5850, float 0.000000e+00, float 1.000000e+00)
  5855. %5852 = fmul float %5844, %5851
  5856. %5853 = fmul float %5852, %5831
  5857. %5854 = bitcast float %5789 to i32
  5858. %5855 = bitcast float %5790 to i32
  5859. %5856 = insertelement <4 x i32> undef, i32 %5854, i32 0
  5860. %5857 = insertelement <4 x i32> %5856, i32 %5855, i32 1
  5861. %5858 = insertelement <4 x i32> %5857, i32 0, i32 2
  5862. %5859 = bitcast <8 x i32> %42 to <32 x i8>
  5863. %5860 = bitcast <4 x i32> %44 to <16 x i8>
  5864. %5861 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5858, <32 x i8> %5859, <16 x i8> %5860, i32 2)
  5865. %5862 = extractelement <4 x float> %5861, i32 0
  5866. %5863 = extractelement <4 x float> %5861, i32 1
  5867. %5864 = extractelement <4 x float> %5861, i32 2
  5868. %5865 = fmul float %5862, %5853
  5869. %5866 = fadd float %5865, %5764
  5870. %5867 = fmul float %5863, %5853
  5871. %5868 = fadd float %5867, %5766
  5872. %5869 = fmul float %5864, %5853
  5873. %5870 = fadd float %5869, %5768
  5874. %5871 = call float @llvm.AMDIL.clamp.(float %5782, float 0.000000e+00, float 1.000000e+00)
  5875. %5872 = call float @llvm.AMDIL.clamp.(float %5784, float 0.000000e+00, float 1.000000e+00)
  5876. %5873 = bitcast float %5871 to i32
  5877. %5874 = bitcast float %5872 to i32
  5878. %5875 = insertelement <4 x i32> undef, i32 %5873, i32 0
  5879. %5876 = insertelement <4 x i32> %5875, i32 %5874, i32 1
  5880. %5877 = insertelement <4 x i32> %5876, i32 0, i32 2
  5881. %5878 = bitcast <8 x i32> %38 to <32 x i8>
  5882. %5879 = bitcast <4 x i32> %40 to <16 x i8>
  5883. %5880 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5877, <32 x i8> %5878, <16 x i8> %5879, i32 2)
  5884. %5881 = extractelement <4 x float> %5880, i32 0
  5885. %5882 = extractelement <4 x float> %5880, i32 1
  5886. %5883 = extractelement <4 x float> %5880, i32 2
  5887. %5884 = extractelement <4 x float> %5880, i32 3
  5888. %5885 = fmul float %5884, %5884
  5889. %5886 = fmul float %5871, %106
  5890. %5887 = fadd float %5886, %110
  5891. %5888 = fmul float %5872, %107
  5892. %5889 = fadd float %5888, %111
  5893. %5890 = fmul float %5887, %5887
  5894. %5891 = fmul float %5889, %5889
  5895. %5892 = fadd float %5891, %5890
  5896. %5893 = fadd float %5892, 1.000000e+00
  5897. %5894 = call float @fabs(float %5893)
  5898. %5895 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5894)
  5899. %5896 = call float @llvm.minnum.f32(float %5895, float 0x47EFFFFFE0000000)
  5900. %5897 = fmul float %5896, %5887
  5901. %5898 = fmul float %5896, %5889
  5902. %5899 = fmul float %5896, %5885
  5903. %5900 = fmul float %5897, %5885
  5904. %5901 = fsub float %5900, %101
  5905. %5902 = fmul float %5898, %5885
  5906. %5903 = fsub float %5902, %102
  5907. %5904 = fsub float -0.000000e+00, %103
  5908. %5905 = fsub float %5904, %5899
  5909. %5906 = fmul float %5901, %5901
  5910. %5907 = fmul float %5903, %5903
  5911. %5908 = fadd float %5907, %5906
  5912. %5909 = fmul float %5905, %5905
  5913. %5910 = fadd float %5908, %5909
  5914. %5911 = fmul float %32, %5910
  5915. %5912 = fsub float 1.000000e+00, %5911
  5916. %5913 = call float @llvm.AMDIL.clamp.(float %5912, float 0.000000e+00, float 1.000000e+00)
  5917. %5914 = call float @fabs(float %5910)
  5918. %5915 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5914)
  5919. %5916 = call float @llvm.minnum.f32(float %5915, float 0x47EFFFFFE0000000)
  5920. %5917 = fmul float %5916, %5901
  5921. %5918 = fmul float %5916, %5903
  5922. %5919 = fmul float %5916, %5905
  5923. %5920 = fmul float %5917, %5881
  5924. %5921 = fmul float %5918, %5882
  5925. %5922 = fadd float %5921, %5920
  5926. %5923 = fmul float %5919, %5883
  5927. %5924 = fadd float %5922, %5923
  5928. %5925 = fsub float %33, %5924
  5929. %5926 = call float @llvm.AMDIL.clamp.(float %5925, float 0.000000e+00, float 1.000000e+00)
  5930. %5927 = fmul float %5917, %68
  5931. %5928 = fmul float %5918, %69
  5932. %5929 = fadd float %5928, %5927
  5933. %5930 = fmul float %5919, %70
  5934. %5931 = fadd float %5929, %5930
  5935. %5932 = fadd float %5931, %34
  5936. %5933 = call float @llvm.AMDIL.clamp.(float %5932, float 0.000000e+00, float 1.000000e+00)
  5937. %5934 = fmul float %5926, %5933
  5938. %5935 = fmul float %5934, %5913
  5939. %5936 = bitcast float %5871 to i32
  5940. %5937 = bitcast float %5872 to i32
  5941. %5938 = insertelement <4 x i32> undef, i32 %5936, i32 0
  5942. %5939 = insertelement <4 x i32> %5938, i32 %5937, i32 1
  5943. %5940 = insertelement <4 x i32> %5939, i32 0, i32 2
  5944. %5941 = bitcast <8 x i32> %42 to <32 x i8>
  5945. %5942 = bitcast <4 x i32> %44 to <16 x i8>
  5946. %5943 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5940, <32 x i8> %5941, <16 x i8> %5942, i32 2)
  5947. %5944 = extractelement <4 x float> %5943, i32 0
  5948. %5945 = extractelement <4 x float> %5943, i32 1
  5949. %5946 = extractelement <4 x float> %5943, i32 2
  5950. %5947 = fmul float %5944, %5935
  5951. %5948 = fadd float %5947, %5866
  5952. %5949 = fmul float %5945, %5935
  5953. %5950 = fadd float %5949, %5868
  5954. %5951 = fmul float %5946, %5935
  5955. %5952 = fadd float %5951, %5870
  5956. %5953 = fmul float %87, 0xBFC5A1CAC0000000
  5957. %5954 = fadd float %5953, %5771
  5958. %5955 = fmul float %90, 0xBFC5A1CAC0000000
  5959. %5956 = fadd float %5955, %5772
  5960. %5957 = fmul float %87, 0xBFC5A1CAC0000000
  5961. %5958 = fadd float %5957, %5771
  5962. %5959 = fmul float %90, 0xBFC5A1CAC0000000
  5963. %5960 = fadd float %5959, %5772
  5964. %5961 = fmul float %5958, 0x3FEC51EB80000000
  5965. %5962 = fadd float %5961, %51
  5966. %5963 = fmul float %5960, 0x3FEC51EB80000000
  5967. %5964 = fadd float %5963, %52
  5968. %5965 = fmul float %5954, 0x3FCBA5E360000000
  5969. %5966 = fadd float %5965, %51
  5970. %5967 = fmul float %5956, 0x3FCBA5E360000000
  5971. %5968 = fadd float %5967, %52
  5972. %5969 = call float @llvm.AMDIL.clamp.(float %5966, float 0.000000e+00, float 1.000000e+00)
  5973. %5970 = call float @llvm.AMDIL.clamp.(float %5968, float 0.000000e+00, float 1.000000e+00)
  5974. %5971 = bitcast float %5969 to i32
  5975. %5972 = bitcast float %5970 to i32
  5976. %5973 = insertelement <4 x i32> undef, i32 %5971, i32 0
  5977. %5974 = insertelement <4 x i32> %5973, i32 %5972, i32 1
  5978. %5975 = insertelement <4 x i32> %5974, i32 0, i32 2
  5979. %5976 = bitcast <8 x i32> %38 to <32 x i8>
  5980. %5977 = bitcast <4 x i32> %40 to <16 x i8>
  5981. %5978 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %5975, <32 x i8> %5976, <16 x i8> %5977, i32 2)
  5982. %5979 = extractelement <4 x float> %5978, i32 0
  5983. %5980 = extractelement <4 x float> %5978, i32 1
  5984. %5981 = extractelement <4 x float> %5978, i32 2
  5985. %5982 = extractelement <4 x float> %5978, i32 3
  5986. %5983 = fmul float %5982, %5982
  5987. %5984 = fmul float %5969, %106
  5988. %5985 = fadd float %5984, %110
  5989. %5986 = fmul float %5970, %107
  5990. %5987 = fadd float %5986, %111
  5991. %5988 = fmul float %5985, %5985
  5992. %5989 = fmul float %5987, %5987
  5993. %5990 = fadd float %5989, %5988
  5994. %5991 = fadd float %5990, 1.000000e+00
  5995. %5992 = call float @fabs(float %5991)
  5996. %5993 = call float @llvm.AMDGPU.rsq.clamped.f32(float %5992)
  5997. %5994 = call float @llvm.minnum.f32(float %5993, float 0x47EFFFFFE0000000)
  5998. %5995 = fmul float %5994, %5985
  5999. %5996 = fmul float %5994, %5987
  6000. %5997 = fmul float %5994, %5983
  6001. %5998 = fmul float %5995, %5983
  6002. %5999 = fsub float %5998, %101
  6003. %6000 = fmul float %5996, %5983
  6004. %6001 = fsub float %6000, %102
  6005. %6002 = fsub float -0.000000e+00, %103
  6006. %6003 = fsub float %6002, %5997
  6007. %6004 = fmul float %5999, %5999
  6008. %6005 = fmul float %6001, %6001
  6009. %6006 = fadd float %6005, %6004
  6010. %6007 = fmul float %6003, %6003
  6011. %6008 = fadd float %6006, %6007
  6012. %6009 = fmul float %32, %6008
  6013. %6010 = fsub float 1.000000e+00, %6009
  6014. %6011 = call float @llvm.AMDIL.clamp.(float %6010, float 0.000000e+00, float 1.000000e+00)
  6015. %6012 = call float @fabs(float %6008)
  6016. %6013 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6012)
  6017. %6014 = call float @llvm.minnum.f32(float %6013, float 0x47EFFFFFE0000000)
  6018. %6015 = fmul float %6014, %5999
  6019. %6016 = fmul float %6014, %6001
  6020. %6017 = fmul float %6014, %6003
  6021. %6018 = fmul float %6015, %5979
  6022. %6019 = fmul float %6016, %5980
  6023. %6020 = fadd float %6019, %6018
  6024. %6021 = fmul float %6017, %5981
  6025. %6022 = fadd float %6020, %6021
  6026. %6023 = fsub float %33, %6022
  6027. %6024 = call float @llvm.AMDIL.clamp.(float %6023, float 0.000000e+00, float 1.000000e+00)
  6028. %6025 = fmul float %6015, %68
  6029. %6026 = fmul float %6016, %69
  6030. %6027 = fadd float %6026, %6025
  6031. %6028 = fmul float %6017, %70
  6032. %6029 = fadd float %6027, %6028
  6033. %6030 = fadd float %6029, %34
  6034. %6031 = call float @llvm.AMDIL.clamp.(float %6030, float 0.000000e+00, float 1.000000e+00)
  6035. %6032 = fmul float %6024, %6031
  6036. %6033 = fmul float %6032, %6011
  6037. %6034 = bitcast float %5969 to i32
  6038. %6035 = bitcast float %5970 to i32
  6039. %6036 = insertelement <4 x i32> undef, i32 %6034, i32 0
  6040. %6037 = insertelement <4 x i32> %6036, i32 %6035, i32 1
  6041. %6038 = insertelement <4 x i32> %6037, i32 0, i32 2
  6042. %6039 = bitcast <8 x i32> %42 to <32 x i8>
  6043. %6040 = bitcast <4 x i32> %44 to <16 x i8>
  6044. %6041 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6038, <32 x i8> %6039, <16 x i8> %6040, i32 2)
  6045. %6042 = extractelement <4 x float> %6041, i32 0
  6046. %6043 = extractelement <4 x float> %6041, i32 1
  6047. %6044 = extractelement <4 x float> %6041, i32 2
  6048. %6045 = fmul float %6042, %6033
  6049. %6046 = fadd float %6045, %5948
  6050. %6047 = fmul float %6043, %6033
  6051. %6048 = fadd float %6047, %5950
  6052. %6049 = fmul float %6044, %6033
  6053. %6050 = fadd float %6049, %5952
  6054. %6051 = call float @llvm.AMDIL.clamp.(float %5962, float 0.000000e+00, float 1.000000e+00)
  6055. %6052 = call float @llvm.AMDIL.clamp.(float %5964, float 0.000000e+00, float 1.000000e+00)
  6056. %6053 = bitcast float %6051 to i32
  6057. %6054 = bitcast float %6052 to i32
  6058. %6055 = insertelement <4 x i32> undef, i32 %6053, i32 0
  6059. %6056 = insertelement <4 x i32> %6055, i32 %6054, i32 1
  6060. %6057 = insertelement <4 x i32> %6056, i32 0, i32 2
  6061. %6058 = bitcast <8 x i32> %38 to <32 x i8>
  6062. %6059 = bitcast <4 x i32> %40 to <16 x i8>
  6063. %6060 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6057, <32 x i8> %6058, <16 x i8> %6059, i32 2)
  6064. %6061 = extractelement <4 x float> %6060, i32 0
  6065. %6062 = extractelement <4 x float> %6060, i32 1
  6066. %6063 = extractelement <4 x float> %6060, i32 2
  6067. %6064 = extractelement <4 x float> %6060, i32 3
  6068. %6065 = fmul float %6064, %6064
  6069. %6066 = fmul float %6051, %106
  6070. %6067 = fadd float %6066, %110
  6071. %6068 = fmul float %6052, %107
  6072. %6069 = fadd float %6068, %111
  6073. %6070 = fmul float %6067, %6067
  6074. %6071 = fmul float %6069, %6069
  6075. %6072 = fadd float %6071, %6070
  6076. %6073 = fadd float %6072, 1.000000e+00
  6077. %6074 = call float @fabs(float %6073)
  6078. %6075 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6074)
  6079. %6076 = call float @llvm.minnum.f32(float %6075, float 0x47EFFFFFE0000000)
  6080. %6077 = fmul float %6076, %6067
  6081. %6078 = fmul float %6076, %6069
  6082. %6079 = fmul float %6076, %6065
  6083. %6080 = fmul float %6077, %6065
  6084. %6081 = fsub float %6080, %101
  6085. %6082 = fmul float %6078, %6065
  6086. %6083 = fsub float %6082, %102
  6087. %6084 = fsub float -0.000000e+00, %103
  6088. %6085 = fsub float %6084, %6079
  6089. %6086 = fmul float %6081, %6081
  6090. %6087 = fmul float %6083, %6083
  6091. %6088 = fadd float %6087, %6086
  6092. %6089 = fmul float %6085, %6085
  6093. %6090 = fadd float %6088, %6089
  6094. %6091 = fmul float %32, %6090
  6095. %6092 = fsub float 1.000000e+00, %6091
  6096. %6093 = call float @llvm.AMDIL.clamp.(float %6092, float 0.000000e+00, float 1.000000e+00)
  6097. %6094 = call float @fabs(float %6090)
  6098. %6095 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6094)
  6099. %6096 = call float @llvm.minnum.f32(float %6095, float 0x47EFFFFFE0000000)
  6100. %6097 = fmul float %6096, %6081
  6101. %6098 = fmul float %6096, %6083
  6102. %6099 = fmul float %6096, %6085
  6103. %6100 = fmul float %6097, %6061
  6104. %6101 = fmul float %6098, %6062
  6105. %6102 = fadd float %6101, %6100
  6106. %6103 = fmul float %6099, %6063
  6107. %6104 = fadd float %6102, %6103
  6108. %6105 = fsub float %33, %6104
  6109. %6106 = call float @llvm.AMDIL.clamp.(float %6105, float 0.000000e+00, float 1.000000e+00)
  6110. %6107 = fmul float %6097, %68
  6111. %6108 = fmul float %6098, %69
  6112. %6109 = fadd float %6108, %6107
  6113. %6110 = fmul float %6099, %70
  6114. %6111 = fadd float %6109, %6110
  6115. %6112 = fadd float %6111, %34
  6116. %6113 = call float @llvm.AMDIL.clamp.(float %6112, float 0.000000e+00, float 1.000000e+00)
  6117. %6114 = fmul float %6106, %6113
  6118. %6115 = fmul float %6114, %6093
  6119. %6116 = bitcast float %6051 to i32
  6120. %6117 = bitcast float %6052 to i32
  6121. %6118 = insertelement <4 x i32> undef, i32 %6116, i32 0
  6122. %6119 = insertelement <4 x i32> %6118, i32 %6117, i32 1
  6123. %6120 = insertelement <4 x i32> %6119, i32 0, i32 2
  6124. %6121 = bitcast <8 x i32> %42 to <32 x i8>
  6125. %6122 = bitcast <4 x i32> %44 to <16 x i8>
  6126. %6123 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6120, <32 x i8> %6121, <16 x i8> %6122, i32 2)
  6127. %6124 = extractelement <4 x float> %6123, i32 0
  6128. %6125 = extractelement <4 x float> %6123, i32 1
  6129. %6126 = extractelement <4 x float> %6123, i32 2
  6130. %6127 = fmul float %6124, %6115
  6131. %6128 = fadd float %6127, %6046
  6132. %6129 = fmul float %6125, %6115
  6133. %6130 = fadd float %6129, %6048
  6134. %6131 = fmul float %6126, %6115
  6135. %6132 = fadd float %6131, %6050
  6136. %6133 = fmul float %88, 0xBFE3C6A7E0000000
  6137. %6134 = fmul float %87, 0x3FE3C6A7E0000000
  6138. %6135 = fmul float %88, 0x3FE3CED920000000
  6139. %6136 = fmul float %87, 0xBFE3CED920000000
  6140. %6137 = fmul float %87, 0xBFE926E980000000
  6141. %6138 = fadd float %6137, %6133
  6142. %6139 = fmul float %90, 0xBFE926E980000000
  6143. %6140 = fadd float %6139, %6134
  6144. %6141 = fmul float %87, 0xBFE926E980000000
  6145. %6142 = fadd float %6141, %6133
  6146. %6143 = fmul float %90, 0xBFE926E980000000
  6147. %6144 = fadd float %6143, %6134
  6148. %6145 = fmul float %6142, 0x3FEF3B6460000000
  6149. %6146 = fadd float %6145, %51
  6150. %6147 = fmul float %6144, 0x3FEF3B6460000000
  6151. %6148 = fadd float %6147, %52
  6152. %6149 = fmul float %6138, 0x3FDFCED920000000
  6153. %6150 = fadd float %6149, %51
  6154. %6151 = fmul float %6140, 0x3FDFCED920000000
  6155. %6152 = fadd float %6151, %52
  6156. %6153 = call float @llvm.AMDIL.clamp.(float %6150, float 0.000000e+00, float 1.000000e+00)
  6157. %6154 = call float @llvm.AMDIL.clamp.(float %6152, float 0.000000e+00, float 1.000000e+00)
  6158. %6155 = bitcast float %6153 to i32
  6159. %6156 = bitcast float %6154 to i32
  6160. %6157 = insertelement <4 x i32> undef, i32 %6155, i32 0
  6161. %6158 = insertelement <4 x i32> %6157, i32 %6156, i32 1
  6162. %6159 = insertelement <4 x i32> %6158, i32 0, i32 2
  6163. %6160 = bitcast <8 x i32> %38 to <32 x i8>
  6164. %6161 = bitcast <4 x i32> %40 to <16 x i8>
  6165. %6162 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6159, <32 x i8> %6160, <16 x i8> %6161, i32 2)
  6166. %6163 = extractelement <4 x float> %6162, i32 0
  6167. %6164 = extractelement <4 x float> %6162, i32 1
  6168. %6165 = extractelement <4 x float> %6162, i32 2
  6169. %6166 = extractelement <4 x float> %6162, i32 3
  6170. %6167 = fmul float %6166, %6166
  6171. %6168 = fmul float %6153, %106
  6172. %6169 = fadd float %6168, %110
  6173. %6170 = fmul float %6154, %107
  6174. %6171 = fadd float %6170, %111
  6175. %6172 = fmul float %6169, %6169
  6176. %6173 = fmul float %6171, %6171
  6177. %6174 = fadd float %6173, %6172
  6178. %6175 = fadd float %6174, 1.000000e+00
  6179. %6176 = call float @fabs(float %6175)
  6180. %6177 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6176)
  6181. %6178 = call float @llvm.minnum.f32(float %6177, float 0x47EFFFFFE0000000)
  6182. %6179 = fmul float %6178, %6169
  6183. %6180 = fmul float %6178, %6171
  6184. %6181 = fmul float %6178, %6167
  6185. %6182 = fmul float %6179, %6167
  6186. %6183 = fsub float %6182, %101
  6187. %6184 = fmul float %6180, %6167
  6188. %6185 = fsub float %6184, %102
  6189. %6186 = fsub float -0.000000e+00, %103
  6190. %6187 = fsub float %6186, %6181
  6191. %6188 = fmul float %6183, %6183
  6192. %6189 = fmul float %6185, %6185
  6193. %6190 = fadd float %6189, %6188
  6194. %6191 = fmul float %6187, %6187
  6195. %6192 = fadd float %6190, %6191
  6196. %6193 = fmul float %32, %6192
  6197. %6194 = fsub float 1.000000e+00, %6193
  6198. %6195 = call float @llvm.AMDIL.clamp.(float %6194, float 0.000000e+00, float 1.000000e+00)
  6199. %6196 = call float @fabs(float %6192)
  6200. %6197 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6196)
  6201. %6198 = call float @llvm.minnum.f32(float %6197, float 0x47EFFFFFE0000000)
  6202. %6199 = fmul float %6198, %6183
  6203. %6200 = fmul float %6198, %6185
  6204. %6201 = fmul float %6198, %6187
  6205. %6202 = fmul float %6199, %6163
  6206. %6203 = fmul float %6200, %6164
  6207. %6204 = fadd float %6203, %6202
  6208. %6205 = fmul float %6201, %6165
  6209. %6206 = fadd float %6204, %6205
  6210. %6207 = fsub float %33, %6206
  6211. %6208 = call float @llvm.AMDIL.clamp.(float %6207, float 0.000000e+00, float 1.000000e+00)
  6212. %6209 = fmul float %6199, %68
  6213. %6210 = fmul float %6200, %69
  6214. %6211 = fadd float %6210, %6209
  6215. %6212 = fmul float %6201, %70
  6216. %6213 = fadd float %6211, %6212
  6217. %6214 = fadd float %6213, %34
  6218. %6215 = call float @llvm.AMDIL.clamp.(float %6214, float 0.000000e+00, float 1.000000e+00)
  6219. %6216 = fmul float %6208, %6215
  6220. %6217 = fmul float %6216, %6195
  6221. %6218 = bitcast float %6153 to i32
  6222. %6219 = bitcast float %6154 to i32
  6223. %6220 = insertelement <4 x i32> undef, i32 %6218, i32 0
  6224. %6221 = insertelement <4 x i32> %6220, i32 %6219, i32 1
  6225. %6222 = insertelement <4 x i32> %6221, i32 0, i32 2
  6226. %6223 = bitcast <8 x i32> %42 to <32 x i8>
  6227. %6224 = bitcast <4 x i32> %44 to <16 x i8>
  6228. %6225 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6222, <32 x i8> %6223, <16 x i8> %6224, i32 2)
  6229. %6226 = extractelement <4 x float> %6225, i32 0
  6230. %6227 = extractelement <4 x float> %6225, i32 1
  6231. %6228 = extractelement <4 x float> %6225, i32 2
  6232. %6229 = fmul float %6226, %6217
  6233. %6230 = fadd float %6229, %6128
  6234. %6231 = fmul float %6227, %6217
  6235. %6232 = fadd float %6231, %6130
  6236. %6233 = fmul float %6228, %6217
  6237. %6234 = fadd float %6233, %6132
  6238. %6235 = call float @llvm.AMDIL.clamp.(float %6146, float 0.000000e+00, float 1.000000e+00)
  6239. %6236 = call float @llvm.AMDIL.clamp.(float %6148, float 0.000000e+00, float 1.000000e+00)
  6240. %6237 = bitcast float %6235 to i32
  6241. %6238 = bitcast float %6236 to i32
  6242. %6239 = insertelement <4 x i32> undef, i32 %6237, i32 0
  6243. %6240 = insertelement <4 x i32> %6239, i32 %6238, i32 1
  6244. %6241 = insertelement <4 x i32> %6240, i32 0, i32 2
  6245. %6242 = bitcast <8 x i32> %38 to <32 x i8>
  6246. %6243 = bitcast <4 x i32> %40 to <16 x i8>
  6247. %6244 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6241, <32 x i8> %6242, <16 x i8> %6243, i32 2)
  6248. %6245 = extractelement <4 x float> %6244, i32 0
  6249. %6246 = extractelement <4 x float> %6244, i32 1
  6250. %6247 = extractelement <4 x float> %6244, i32 2
  6251. %6248 = extractelement <4 x float> %6244, i32 3
  6252. %6249 = fmul float %6248, %6248
  6253. %6250 = fmul float %6235, %106
  6254. %6251 = fadd float %6250, %110
  6255. %6252 = fmul float %6236, %107
  6256. %6253 = fadd float %6252, %111
  6257. %6254 = fmul float %6251, %6251
  6258. %6255 = fmul float %6253, %6253
  6259. %6256 = fadd float %6255, %6254
  6260. %6257 = fadd float %6256, 1.000000e+00
  6261. %6258 = call float @fabs(float %6257)
  6262. %6259 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6258)
  6263. %6260 = call float @llvm.minnum.f32(float %6259, float 0x47EFFFFFE0000000)
  6264. %6261 = fmul float %6260, %6251
  6265. %6262 = fmul float %6260, %6253
  6266. %6263 = fmul float %6260, %6249
  6267. %6264 = fmul float %6261, %6249
  6268. %6265 = fsub float %6264, %101
  6269. %6266 = fmul float %6262, %6249
  6270. %6267 = fsub float %6266, %102
  6271. %6268 = fsub float -0.000000e+00, %103
  6272. %6269 = fsub float %6268, %6263
  6273. %6270 = fmul float %6265, %6265
  6274. %6271 = fmul float %6267, %6267
  6275. %6272 = fadd float %6271, %6270
  6276. %6273 = fmul float %6269, %6269
  6277. %6274 = fadd float %6272, %6273
  6278. %6275 = fmul float %32, %6274
  6279. %6276 = fsub float 1.000000e+00, %6275
  6280. %6277 = call float @llvm.AMDIL.clamp.(float %6276, float 0.000000e+00, float 1.000000e+00)
  6281. %6278 = call float @fabs(float %6274)
  6282. %6279 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6278)
  6283. %6280 = call float @llvm.minnum.f32(float %6279, float 0x47EFFFFFE0000000)
  6284. %6281 = fmul float %6280, %6265
  6285. %6282 = fmul float %6280, %6267
  6286. %6283 = fmul float %6280, %6269
  6287. %6284 = fmul float %6281, %6245
  6288. %6285 = fmul float %6282, %6246
  6289. %6286 = fadd float %6285, %6284
  6290. %6287 = fmul float %6283, %6247
  6291. %6288 = fadd float %6286, %6287
  6292. %6289 = fsub float %33, %6288
  6293. %6290 = call float @llvm.AMDIL.clamp.(float %6289, float 0.000000e+00, float 1.000000e+00)
  6294. %6291 = fmul float %6281, %68
  6295. %6292 = fmul float %6282, %69
  6296. %6293 = fadd float %6292, %6291
  6297. %6294 = fmul float %6283, %70
  6298. %6295 = fadd float %6293, %6294
  6299. %6296 = fadd float %6295, %34
  6300. %6297 = call float @llvm.AMDIL.clamp.(float %6296, float 0.000000e+00, float 1.000000e+00)
  6301. %6298 = fmul float %6290, %6297
  6302. %6299 = fmul float %6298, %6277
  6303. %6300 = bitcast float %6235 to i32
  6304. %6301 = bitcast float %6236 to i32
  6305. %6302 = insertelement <4 x i32> undef, i32 %6300, i32 0
  6306. %6303 = insertelement <4 x i32> %6302, i32 %6301, i32 1
  6307. %6304 = insertelement <4 x i32> %6303, i32 0, i32 2
  6308. %6305 = bitcast <8 x i32> %42 to <32 x i8>
  6309. %6306 = bitcast <4 x i32> %44 to <16 x i8>
  6310. %6307 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6304, <32 x i8> %6305, <16 x i8> %6306, i32 2)
  6311. %6308 = extractelement <4 x float> %6307, i32 0
  6312. %6309 = extractelement <4 x float> %6307, i32 1
  6313. %6310 = extractelement <4 x float> %6307, i32 2
  6314. %6311 = fmul float %6308, %6299
  6315. %6312 = fadd float %6311, %6230
  6316. %6313 = fmul float %6309, %6299
  6317. %6314 = fadd float %6313, %6232
  6318. %6315 = fmul float %6310, %6299
  6319. %6316 = fadd float %6315, %6234
  6320. %6317 = fmul float %87, 0xBFE91EB860000000
  6321. %6318 = fadd float %6317, %6135
  6322. %6319 = fmul float %90, 0xBFE91EB860000000
  6323. %6320 = fadd float %6319, %6136
  6324. %6321 = fmul float %87, 0xBFE91EB860000000
  6325. %6322 = fadd float %6321, %6135
  6326. %6323 = fmul float %90, 0xBFE91EB860000000
  6327. %6324 = fadd float %6323, %6136
  6328. %6325 = fmul float %6322, 0x3FE36C8B40000000
  6329. %6326 = fadd float %6325, %51
  6330. %6327 = fmul float %6324, 0x3FE36C8B40000000
  6331. %6328 = fadd float %6327, %52
  6332. %6329 = fmul float %6318, 0x3FE1604180000000
  6333. %6330 = fadd float %6329, %51
  6334. %6331 = fmul float %6320, 0x3FE1604180000000
  6335. %6332 = fadd float %6331, %52
  6336. %6333 = call float @llvm.AMDIL.clamp.(float %6330, float 0.000000e+00, float 1.000000e+00)
  6337. %6334 = call float @llvm.AMDIL.clamp.(float %6332, float 0.000000e+00, float 1.000000e+00)
  6338. %6335 = bitcast float %6333 to i32
  6339. %6336 = bitcast float %6334 to i32
  6340. %6337 = insertelement <4 x i32> undef, i32 %6335, i32 0
  6341. %6338 = insertelement <4 x i32> %6337, i32 %6336, i32 1
  6342. %6339 = insertelement <4 x i32> %6338, i32 0, i32 2
  6343. %6340 = bitcast <8 x i32> %38 to <32 x i8>
  6344. %6341 = bitcast <4 x i32> %40 to <16 x i8>
  6345. %6342 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6339, <32 x i8> %6340, <16 x i8> %6341, i32 2)
  6346. %6343 = extractelement <4 x float> %6342, i32 0
  6347. %6344 = extractelement <4 x float> %6342, i32 1
  6348. %6345 = extractelement <4 x float> %6342, i32 2
  6349. %6346 = extractelement <4 x float> %6342, i32 3
  6350. %6347 = fmul float %6346, %6346
  6351. %6348 = fmul float %6333, %106
  6352. %6349 = fadd float %6348, %110
  6353. %6350 = fmul float %6334, %107
  6354. %6351 = fadd float %6350, %111
  6355. %6352 = fmul float %6349, %6349
  6356. %6353 = fmul float %6351, %6351
  6357. %6354 = fadd float %6353, %6352
  6358. %6355 = fadd float %6354, 1.000000e+00
  6359. %6356 = call float @fabs(float %6355)
  6360. %6357 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6356)
  6361. %6358 = call float @llvm.minnum.f32(float %6357, float 0x47EFFFFFE0000000)
  6362. %6359 = fmul float %6358, %6349
  6363. %6360 = fmul float %6358, %6351
  6364. %6361 = fmul float %6358, %6347
  6365. %6362 = fmul float %6359, %6347
  6366. %6363 = fsub float %6362, %101
  6367. %6364 = fmul float %6360, %6347
  6368. %6365 = fsub float %6364, %102
  6369. %6366 = fsub float -0.000000e+00, %103
  6370. %6367 = fsub float %6366, %6361
  6371. %6368 = fmul float %6363, %6363
  6372. %6369 = fmul float %6365, %6365
  6373. %6370 = fadd float %6369, %6368
  6374. %6371 = fmul float %6367, %6367
  6375. %6372 = fadd float %6370, %6371
  6376. %6373 = fmul float %32, %6372
  6377. %6374 = fsub float 1.000000e+00, %6373
  6378. %6375 = call float @llvm.AMDIL.clamp.(float %6374, float 0.000000e+00, float 1.000000e+00)
  6379. %6376 = call float @fabs(float %6372)
  6380. %6377 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6376)
  6381. %6378 = call float @llvm.minnum.f32(float %6377, float 0x47EFFFFFE0000000)
  6382. %6379 = fmul float %6378, %6363
  6383. %6380 = fmul float %6378, %6365
  6384. %6381 = fmul float %6378, %6367
  6385. %6382 = fmul float %6379, %6343
  6386. %6383 = fmul float %6380, %6344
  6387. %6384 = fadd float %6383, %6382
  6388. %6385 = fmul float %6381, %6345
  6389. %6386 = fadd float %6384, %6385
  6390. %6387 = fsub float %33, %6386
  6391. %6388 = call float @llvm.AMDIL.clamp.(float %6387, float 0.000000e+00, float 1.000000e+00)
  6392. %6389 = fmul float %6379, %68
  6393. %6390 = fmul float %6380, %69
  6394. %6391 = fadd float %6390, %6389
  6395. %6392 = fmul float %6381, %70
  6396. %6393 = fadd float %6391, %6392
  6397. %6394 = fadd float %6393, %34
  6398. %6395 = call float @llvm.AMDIL.clamp.(float %6394, float 0.000000e+00, float 1.000000e+00)
  6399. %6396 = fmul float %6388, %6395
  6400. %6397 = fmul float %6396, %6375
  6401. %6398 = bitcast float %6333 to i32
  6402. %6399 = bitcast float %6334 to i32
  6403. %6400 = insertelement <4 x i32> undef, i32 %6398, i32 0
  6404. %6401 = insertelement <4 x i32> %6400, i32 %6399, i32 1
  6405. %6402 = insertelement <4 x i32> %6401, i32 0, i32 2
  6406. %6403 = bitcast <8 x i32> %42 to <32 x i8>
  6407. %6404 = bitcast <4 x i32> %44 to <16 x i8>
  6408. %6405 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6402, <32 x i8> %6403, <16 x i8> %6404, i32 2)
  6409. %6406 = extractelement <4 x float> %6405, i32 0
  6410. %6407 = extractelement <4 x float> %6405, i32 1
  6411. %6408 = extractelement <4 x float> %6405, i32 2
  6412. %6409 = fmul float %6406, %6397
  6413. %6410 = fadd float %6409, %6312
  6414. %6411 = fmul float %6407, %6397
  6415. %6412 = fadd float %6411, %6314
  6416. %6413 = fmul float %6408, %6397
  6417. %6414 = fadd float %6413, %6316
  6418. %6415 = call float @llvm.AMDIL.clamp.(float %6326, float 0.000000e+00, float 1.000000e+00)
  6419. %6416 = call float @llvm.AMDIL.clamp.(float %6328, float 0.000000e+00, float 1.000000e+00)
  6420. %6417 = bitcast float %6415 to i32
  6421. %6418 = bitcast float %6416 to i32
  6422. %6419 = insertelement <4 x i32> undef, i32 %6417, i32 0
  6423. %6420 = insertelement <4 x i32> %6419, i32 %6418, i32 1
  6424. %6421 = insertelement <4 x i32> %6420, i32 0, i32 2
  6425. %6422 = bitcast <8 x i32> %38 to <32 x i8>
  6426. %6423 = bitcast <4 x i32> %40 to <16 x i8>
  6427. %6424 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6421, <32 x i8> %6422, <16 x i8> %6423, i32 2)
  6428. %6425 = extractelement <4 x float> %6424, i32 0
  6429. %6426 = extractelement <4 x float> %6424, i32 1
  6430. %6427 = extractelement <4 x float> %6424, i32 2
  6431. %6428 = extractelement <4 x float> %6424, i32 3
  6432. %6429 = fmul float %6428, %6428
  6433. %6430 = fmul float %6415, %106
  6434. %6431 = fadd float %6430, %110
  6435. %6432 = fmul float %6416, %107
  6436. %6433 = fadd float %6432, %111
  6437. %6434 = fmul float %6431, %6431
  6438. %6435 = fmul float %6433, %6433
  6439. %6436 = fadd float %6435, %6434
  6440. %6437 = fadd float %6436, 1.000000e+00
  6441. %6438 = call float @fabs(float %6437)
  6442. %6439 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6438)
  6443. %6440 = call float @llvm.minnum.f32(float %6439, float 0x47EFFFFFE0000000)
  6444. %6441 = fmul float %6440, %6431
  6445. %6442 = fmul float %6440, %6433
  6446. %6443 = fmul float %6440, %6429
  6447. %6444 = fmul float %6441, %6429
  6448. %6445 = fsub float %6444, %101
  6449. %6446 = fmul float %6442, %6429
  6450. %6447 = fsub float %6446, %102
  6451. %6448 = fsub float -0.000000e+00, %103
  6452. %6449 = fsub float %6448, %6443
  6453. %6450 = fmul float %6445, %6445
  6454. %6451 = fmul float %6447, %6447
  6455. %6452 = fadd float %6451, %6450
  6456. %6453 = fmul float %6449, %6449
  6457. %6454 = fadd float %6452, %6453
  6458. %6455 = fmul float %32, %6454
  6459. %6456 = fsub float 1.000000e+00, %6455
  6460. %6457 = call float @llvm.AMDIL.clamp.(float %6456, float 0.000000e+00, float 1.000000e+00)
  6461. %6458 = call float @fabs(float %6454)
  6462. %6459 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6458)
  6463. %6460 = call float @llvm.minnum.f32(float %6459, float 0x47EFFFFFE0000000)
  6464. %6461 = fmul float %6460, %6445
  6465. %6462 = fmul float %6460, %6447
  6466. %6463 = fmul float %6460, %6449
  6467. %6464 = fmul float %6461, %6425
  6468. %6465 = fmul float %6462, %6426
  6469. %6466 = fadd float %6465, %6464
  6470. %6467 = fmul float %6463, %6427
  6471. %6468 = fadd float %6466, %6467
  6472. %6469 = fsub float %33, %6468
  6473. %6470 = call float @llvm.AMDIL.clamp.(float %6469, float 0.000000e+00, float 1.000000e+00)
  6474. %6471 = fmul float %6461, %68
  6475. %6472 = fmul float %6462, %69
  6476. %6473 = fadd float %6472, %6471
  6477. %6474 = fmul float %6463, %70
  6478. %6475 = fadd float %6473, %6474
  6479. %6476 = fadd float %6475, %34
  6480. %6477 = call float @llvm.AMDIL.clamp.(float %6476, float 0.000000e+00, float 1.000000e+00)
  6481. %6478 = fmul float %6470, %6477
  6482. %6479 = fmul float %6478, %6457
  6483. %6480 = bitcast float %6415 to i32
  6484. %6481 = bitcast float %6416 to i32
  6485. %6482 = insertelement <4 x i32> undef, i32 %6480, i32 0
  6486. %6483 = insertelement <4 x i32> %6482, i32 %6481, i32 1
  6487. %6484 = insertelement <4 x i32> %6483, i32 0, i32 2
  6488. %6485 = bitcast <8 x i32> %42 to <32 x i8>
  6489. %6486 = bitcast <4 x i32> %44 to <16 x i8>
  6490. %6487 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6484, <32 x i8> %6485, <16 x i8> %6486, i32 2)
  6491. %6488 = extractelement <4 x float> %6487, i32 0
  6492. %6489 = extractelement <4 x float> %6487, i32 1
  6493. %6490 = extractelement <4 x float> %6487, i32 2
  6494. %6491 = fmul float %6488, %6479
  6495. %6492 = fadd float %6491, %6410
  6496. %6493 = fmul float %6489, %6479
  6497. %6494 = fadd float %6493, %6412
  6498. %6495 = fmul float %6490, %6479
  6499. %6496 = fadd float %6495, %6414
  6500. %6497 = fmul float %87, 0xBF60624DE0000000
  6501. %6498 = fadd float %6497, %88
  6502. %6499 = fmul float %90, 0xBF60624DE0000000
  6503. %6500 = fsub float %6499, %87
  6504. %6501 = fmul float %87, 0xBF60624DE0000000
  6505. %6502 = fadd float %6501, %88
  6506. %6503 = fmul float %90, 0xBF60624DE0000000
  6507. %6504 = fsub float %6503, %87
  6508. %6505 = fmul float %6502, 0x3FE6E978E0000000
  6509. %6506 = fadd float %6505, %51
  6510. %6507 = fmul float %6504, 0x3FE6E978E0000000
  6511. %6508 = fadd float %6507, %52
  6512. %6509 = fmul float %6498, 0x3FC9168720000000
  6513. %6510 = fadd float %6509, %51
  6514. %6511 = fmul float %6500, 0x3FC9168720000000
  6515. %6512 = fadd float %6511, %52
  6516. %6513 = call float @llvm.AMDIL.clamp.(float %6510, float 0.000000e+00, float 1.000000e+00)
  6517. %6514 = call float @llvm.AMDIL.clamp.(float %6512, float 0.000000e+00, float 1.000000e+00)
  6518. %6515 = bitcast float %6513 to i32
  6519. %6516 = bitcast float %6514 to i32
  6520. %6517 = insertelement <4 x i32> undef, i32 %6515, i32 0
  6521. %6518 = insertelement <4 x i32> %6517, i32 %6516, i32 1
  6522. %6519 = insertelement <4 x i32> %6518, i32 0, i32 2
  6523. %6520 = bitcast <8 x i32> %38 to <32 x i8>
  6524. %6521 = bitcast <4 x i32> %40 to <16 x i8>
  6525. %6522 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6519, <32 x i8> %6520, <16 x i8> %6521, i32 2)
  6526. %6523 = extractelement <4 x float> %6522, i32 0
  6527. %6524 = extractelement <4 x float> %6522, i32 1
  6528. %6525 = extractelement <4 x float> %6522, i32 2
  6529. %6526 = extractelement <4 x float> %6522, i32 3
  6530. %6527 = fmul float %6526, %6526
  6531. %6528 = fmul float %6513, %106
  6532. %6529 = fadd float %6528, %110
  6533. %6530 = fmul float %6514, %107
  6534. %6531 = fadd float %6530, %111
  6535. %6532 = fmul float %6529, %6529
  6536. %6533 = fmul float %6531, %6531
  6537. %6534 = fadd float %6533, %6532
  6538. %6535 = fadd float %6534, 1.000000e+00
  6539. %6536 = call float @fabs(float %6535)
  6540. %6537 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6536)
  6541. %6538 = call float @llvm.minnum.f32(float %6537, float 0x47EFFFFFE0000000)
  6542. %6539 = fmul float %6538, %6529
  6543. %6540 = fmul float %6538, %6531
  6544. %6541 = fmul float %6538, %6527
  6545. %6542 = fmul float %6539, %6527
  6546. %6543 = fsub float %6542, %101
  6547. %6544 = fmul float %6540, %6527
  6548. %6545 = fsub float %6544, %102
  6549. %6546 = fsub float -0.000000e+00, %103
  6550. %6547 = fsub float %6546, %6541
  6551. %6548 = fmul float %6543, %6543
  6552. %6549 = fmul float %6545, %6545
  6553. %6550 = fadd float %6549, %6548
  6554. %6551 = fmul float %6547, %6547
  6555. %6552 = fadd float %6550, %6551
  6556. %6553 = fmul float %32, %6552
  6557. %6554 = fsub float 1.000000e+00, %6553
  6558. %6555 = call float @llvm.AMDIL.clamp.(float %6554, float 0.000000e+00, float 1.000000e+00)
  6559. %6556 = call float @fabs(float %6552)
  6560. %6557 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6556)
  6561. %6558 = call float @llvm.minnum.f32(float %6557, float 0x47EFFFFFE0000000)
  6562. %6559 = fmul float %6558, %6543
  6563. %6560 = fmul float %6558, %6545
  6564. %6561 = fmul float %6558, %6547
  6565. %6562 = fmul float %6559, %6523
  6566. %6563 = fmul float %6560, %6524
  6567. %6564 = fadd float %6563, %6562
  6568. %6565 = fmul float %6561, %6525
  6569. %6566 = fadd float %6564, %6565
  6570. %6567 = fsub float %33, %6566
  6571. %6568 = call float @llvm.AMDIL.clamp.(float %6567, float 0.000000e+00, float 1.000000e+00)
  6572. %6569 = fmul float %6559, %68
  6573. %6570 = fmul float %6560, %69
  6574. %6571 = fadd float %6570, %6569
  6575. %6572 = fmul float %6561, %70
  6576. %6573 = fadd float %6571, %6572
  6577. %6574 = fadd float %6573, %34
  6578. %6575 = call float @llvm.AMDIL.clamp.(float %6574, float 0.000000e+00, float 1.000000e+00)
  6579. %6576 = fmul float %6568, %6575
  6580. %6577 = fmul float %6576, %6555
  6581. %6578 = bitcast float %6513 to i32
  6582. %6579 = bitcast float %6514 to i32
  6583. %6580 = insertelement <4 x i32> undef, i32 %6578, i32 0
  6584. %6581 = insertelement <4 x i32> %6580, i32 %6579, i32 1
  6585. %6582 = insertelement <4 x i32> %6581, i32 0, i32 2
  6586. %6583 = bitcast <8 x i32> %42 to <32 x i8>
  6587. %6584 = bitcast <4 x i32> %44 to <16 x i8>
  6588. %6585 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6582, <32 x i8> %6583, <16 x i8> %6584, i32 2)
  6589. %6586 = extractelement <4 x float> %6585, i32 0
  6590. %6587 = extractelement <4 x float> %6585, i32 1
  6591. %6588 = extractelement <4 x float> %6585, i32 2
  6592. %6589 = fmul float %6586, %6577
  6593. %6590 = fadd float %6589, %6492
  6594. %6591 = fmul float %6587, %6577
  6595. %6592 = fadd float %6591, %6494
  6596. %6593 = fmul float %6588, %6577
  6597. %6594 = fadd float %6593, %6496
  6598. %6595 = call float @llvm.AMDIL.clamp.(float %6506, float 0.000000e+00, float 1.000000e+00)
  6599. %6596 = call float @llvm.AMDIL.clamp.(float %6508, float 0.000000e+00, float 1.000000e+00)
  6600. %6597 = bitcast float %6595 to i32
  6601. %6598 = bitcast float %6596 to i32
  6602. %6599 = insertelement <4 x i32> undef, i32 %6597, i32 0
  6603. %6600 = insertelement <4 x i32> %6599, i32 %6598, i32 1
  6604. %6601 = insertelement <4 x i32> %6600, i32 0, i32 2
  6605. %6602 = bitcast <8 x i32> %38 to <32 x i8>
  6606. %6603 = bitcast <4 x i32> %40 to <16 x i8>
  6607. %6604 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6601, <32 x i8> %6602, <16 x i8> %6603, i32 2)
  6608. %6605 = extractelement <4 x float> %6604, i32 0
  6609. %6606 = extractelement <4 x float> %6604, i32 1
  6610. %6607 = extractelement <4 x float> %6604, i32 2
  6611. %6608 = extractelement <4 x float> %6604, i32 3
  6612. %6609 = fmul float %6608, %6608
  6613. %6610 = fmul float %6595, %106
  6614. %6611 = fadd float %6610, %110
  6615. %6612 = fmul float %6596, %107
  6616. %6613 = fadd float %6612, %111
  6617. %6614 = fmul float %6611, %6611
  6618. %6615 = fmul float %6613, %6613
  6619. %6616 = fadd float %6615, %6614
  6620. %6617 = fadd float %6616, 1.000000e+00
  6621. %6618 = call float @fabs(float %6617)
  6622. %6619 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6618)
  6623. %6620 = call float @llvm.minnum.f32(float %6619, float 0x47EFFFFFE0000000)
  6624. %6621 = fmul float %6620, %6611
  6625. %6622 = fmul float %6620, %6613
  6626. %6623 = fmul float %6620, %6609
  6627. %6624 = fmul float %6621, %6609
  6628. %6625 = fsub float %6624, %101
  6629. %6626 = fmul float %6622, %6609
  6630. %6627 = fsub float %6626, %102
  6631. %6628 = fsub float -0.000000e+00, %103
  6632. %6629 = fsub float %6628, %6623
  6633. %6630 = fmul float %6625, %6625
  6634. %6631 = fmul float %6627, %6627
  6635. %6632 = fadd float %6631, %6630
  6636. %6633 = fmul float %6629, %6629
  6637. %6634 = fadd float %6632, %6633
  6638. %6635 = fmul float %32, %6634
  6639. %6636 = fsub float 1.000000e+00, %6635
  6640. %6637 = call float @llvm.AMDIL.clamp.(float %6636, float 0.000000e+00, float 1.000000e+00)
  6641. %6638 = call float @fabs(float %6634)
  6642. %6639 = call float @llvm.AMDGPU.rsq.clamped.f32(float %6638)
  6643. %6640 = call float @llvm.minnum.f32(float %6639, float 0x47EFFFFFE0000000)
  6644. %6641 = fmul float %6640, %6625
  6645. %6642 = fmul float %6640, %6627
  6646. %6643 = fmul float %6640, %6629
  6647. %6644 = fmul float %6641, %6605
  6648. %6645 = fmul float %6642, %6606
  6649. %6646 = fadd float %6645, %6644
  6650. %6647 = fmul float %6643, %6607
  6651. %6648 = fadd float %6646, %6647
  6652. %6649 = fsub float %33, %6648
  6653. %6650 = call float @llvm.AMDIL.clamp.(float %6649, float 0.000000e+00, float 1.000000e+00)
  6654. %6651 = fmul float %6641, %68
  6655. %6652 = fmul float %6642, %69
  6656. %6653 = fadd float %6652, %6651
  6657. %6654 = fmul float %6643, %70
  6658. %6655 = fadd float %6653, %6654
  6659. %6656 = fadd float %6655, %34
  6660. %6657 = call float @llvm.AMDIL.clamp.(float %6656, float 0.000000e+00, float 1.000000e+00)
  6661. %6658 = fmul float %6657, %6650
  6662. %6659 = fmul float %6658, %6637
  6663. %6660 = bitcast float %6595 to i32
  6664. %6661 = bitcast float %6596 to i32
  6665. %6662 = insertelement <4 x i32> undef, i32 %6660, i32 0
  6666. %6663 = insertelement <4 x i32> %6662, i32 %6661, i32 1
  6667. %6664 = insertelement <4 x i32> %6663, i32 0, i32 2
  6668. %6665 = bitcast <8 x i32> %42 to <32 x i8>
  6669. %6666 = bitcast <4 x i32> %44 to <16 x i8>
  6670. %6667 = call <4 x float> @llvm.SI.samplel.v4i32(<4 x i32> %6664, <32 x i8> %6665, <16 x i8> %6666, i32 2)
  6671. %6668 = extractelement <4 x float> %6667, i32 0
  6672. %6669 = extractelement <4 x float> %6667, i32 1
  6673. %6670 = extractelement <4 x float> %6667, i32 2
  6674. %6671 = fmul float %6668, %6659
  6675. %6672 = fadd float %6671, %6590
  6676. %6673 = fmul float %6669, %6659
  6677. %6674 = fadd float %6673, %6592
  6678. %6675 = fmul float %6670, %6659
  6679. %6676 = fadd float %6675, %6594
  6680. %6677 = fmul float %6672, 6.250000e-02
  6681. %6678 = fmul float %6674, 6.250000e-02
  6682. %6679 = fmul float %6676, 6.250000e-02
  6683. br label %ENDIF
  6684. }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement