Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- //
- // Generated by NVIDIA NVVM Compiler
- //
- // Compiler Build ID: CL-26218862
- // Cuda compilation tools, release 10.1, V10.1.168
- // Based on LLVM 3.4svn
- //
- .version 6.4
- .target sm_30
- .address_size 64
- .func (.param .b64 func_retval0) __internal_accurate_pow
- (
- .param .b64 __internal_accurate_pow_param_0
- )
- ;
- .func (.param .align 4 .b8 func_retval0[12]) _Z5traceRK4Vec3IfES2_PK6SpherejRKi(
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_0,
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_1,
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_2,
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_3,
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_4,
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_5,
- .param .b64 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_6,
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_7,
- .param .b32 _Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_8
- )
- {
- .reg .pred %p<111>;
- .reg .b16 %rs<5>;
- .reg .f32 %f<474>;
- .reg .b32 %r<66>;
- .reg .f64 %fd<20>;
- .reg .b64 %rd<78>;
- ld.param.f32 %f185, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_0];
- ld.param.f32 %f186, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_1];
- ld.param.f32 %f187, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_2];
- ld.param.f32 %f188, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_3];
- ld.param.f32 %f189, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_4];
- ld.param.f32 %f190, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_5];
- ld.param.u64 %rd35, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_6];
- ld.param.u32 %r16, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_7];
- ld.param.u32 %r17, [_Z5traceRK4Vec3IfES2_PK6SpherejRKi_param_8];
- setp.eq.s32 %p9, %r16, 0;
- mov.f32 %f422, 0f7F800000;
- mov.u64 %rd68, 0;
- @%p9 bra BB0_61;
- and.b32 %r1, %r16, 3;
- setp.eq.s32 %p10, %r1, 0;
- mov.f32 %f428, 0f00000000;
- mov.f32 %f422, 0f7F800000;
- mov.u64 %rd68, 0;
- mov.u32 %r62, 0;
- @%p10 bra BB0_30;
- setp.eq.s32 %p11, %r1, 1;
- mov.f32 %f424, 0f7F800000;
- mov.u64 %rd68, 0;
- mov.u32 %r61, 0;
- mov.f32 %f422, %f424;
- @%p11 bra BB0_22;
- setp.eq.s32 %p12, %r1, 2;
- mov.f32 %f420, 0f7F800000;
- mov.u64 %rd68, 0;
- mov.u32 %r60, 0;
- @%p12 bra BB0_4;
- bra.uni BB0_5;
- BB0_4:
- mov.f32 %f422, %f420;
- bra.uni BB0_14;
- BB0_5:
- add.s64 %rd1, %rd35, 8;
- ld.f32 %f198, [%rd35+8];
- sub.f32 %f1, %f198, %f185;
- ld.f32 %f199, [%rd35+12];
- sub.f32 %f2, %f199, %f186;
- ld.f32 %f200, [%rd35+16];
- sub.f32 %f3, %f200, %f187;
- mul.f32 %f201, %f2, %f189;
- fma.rn.f32 %f202, %f1, %f188, %f201;
- fma.rn.f32 %f4, %f3, %f190, %f202;
- setp.lt.f32 %p14, %f4, 0f00000000;
- mov.pred %p104, -1;
- mov.f32 %f197, 0f7F800000;
- @%p14 bra BB0_6;
- bra.uni BB0_7;
- BB0_6:
- mov.f32 %f417, %f197;
- mov.f32 %f418, %f197;
- bra.uni BB0_9;
- BB0_7:
- mul.f32 %f205, %f2, %f2;
- fma.rn.f32 %f206, %f1, %f1, %f205;
- fma.rn.f32 %f207, %f3, %f3, %f206;
- mul.f32 %f208, %f4, %f4;
- sub.f32 %f5, %f207, %f208;
- ld.f32 %f6, [%rd1+16];
- setp.gt.f32 %p16, %f5, %f6;
- mov.f32 %f417, %f197;
- mov.f32 %f418, %f197;
- @%p16 bra BB0_9;
- sub.f32 %f209, %f6, %f5;
- sqrt.rn.f32 %f210, %f209;
- sub.f32 %f418, %f4, %f210;
- add.f32 %f417, %f4, %f210;
- mov.pred %p104, 0;
- BB0_9:
- mov.u32 %r60, 1;
- @%p104 bra BB0_10;
- bra.uni BB0_11;
- BB0_10:
- mov.f32 %f422, %f197;
- bra.uni BB0_14;
- BB0_11:
- setp.lt.f32 %p18, %f418, 0f00000000;
- selp.f32 %f422, %f417, %f418, %p18;
- setp.geu.f32 %p19, %f422, 0f7F800000;
- @%p19 bra BB0_12;
- mov.u64 %rd68, %rd35;
- bra.uni BB0_14;
- BB0_12:
- mov.f32 %f422, %f197;
- BB0_14:
- cvt.u64.u32 %rd3, %r60;
- mul.wide.u32 %rd42, %r60, 80;
- add.s64 %rd43, %rd35, %rd42;
- add.s64 %rd4, %rd43, 8;
- ld.f32 %f215, [%rd43+8];
- sub.f32 %f13, %f215, %f185;
- ld.f32 %f216, [%rd43+12];
- sub.f32 %f14, %f216, %f186;
- ld.f32 %f217, [%rd43+16];
- sub.f32 %f15, %f217, %f187;
- mul.f32 %f218, %f14, %f189;
- fma.rn.f32 %f219, %f13, %f188, %f218;
- fma.rn.f32 %f16, %f15, %f190, %f219;
- setp.lt.f32 %p21, %f16, 0f00000000;
- mov.pred %p105, -1;
- @%p21 bra BB0_15;
- bra.uni BB0_16;
- BB0_15:
- mov.f32 %f421, %f420;
- bra.uni BB0_18;
- BB0_16:
- mul.f32 %f222, %f14, %f14;
- fma.rn.f32 %f223, %f13, %f13, %f222;
- fma.rn.f32 %f224, %f15, %f15, %f223;
- mul.f32 %f225, %f16, %f16;
- sub.f32 %f17, %f224, %f225;
- ld.f32 %f18, [%rd4+16];
- setp.gt.f32 %p23, %f17, %f18;
- mov.f32 %f421, %f420;
- @%p23 bra BB0_18;
- sub.f32 %f226, %f18, %f17;
- sqrt.rn.f32 %f227, %f226;
- sub.f32 %f421, %f16, %f227;
- add.f32 %f420, %f16, %f227;
- mov.pred %p105, 0;
- BB0_18:
- @%p105 bra BB0_21;
- setp.lt.f32 %p25, %f421, 0f00000000;
- selp.f32 %f23, %f420, %f421, %p25;
- setp.geu.f32 %p26, %f23, %f422;
- @%p26 bra BB0_21;
- mul.lo.s64 %rd44, %rd3, 80;
- add.s64 %rd68, %rd35, %rd44;
- mov.f32 %f422, %f23;
- BB0_21:
- cvt.u32.u64 %r24, %rd3;
- add.s32 %r61, %r24, 1;
- BB0_22:
- cvt.u64.u32 %rd8, %r61;
- mul.wide.u32 %rd45, %r61, 80;
- add.s64 %rd46, %rd35, %rd45;
- add.s64 %rd9, %rd46, 8;
- ld.f32 %f230, [%rd46+8];
- sub.f32 %f26, %f230, %f185;
- ld.f32 %f231, [%rd46+12];
- sub.f32 %f27, %f231, %f186;
- ld.f32 %f232, [%rd46+16];
- sub.f32 %f28, %f232, %f187;
- mul.f32 %f233, %f27, %f189;
- fma.rn.f32 %f234, %f26, %f188, %f233;
- fma.rn.f32 %f29, %f28, %f190, %f234;
- setp.lt.f32 %p28, %f29, 0f00000000;
- mov.pred %p106, -1;
- @%p28 bra BB0_23;
- bra.uni BB0_24;
- BB0_23:
- mov.f32 %f425, %f424;
- bra.uni BB0_26;
- BB0_24:
- mul.f32 %f237, %f27, %f27;
- fma.rn.f32 %f238, %f26, %f26, %f237;
- fma.rn.f32 %f239, %f28, %f28, %f238;
- mul.f32 %f240, %f29, %f29;
- sub.f32 %f30, %f239, %f240;
- ld.f32 %f31, [%rd9+16];
- setp.gt.f32 %p30, %f30, %f31;
- mov.f32 %f425, %f424;
- @%p30 bra BB0_26;
- sub.f32 %f241, %f31, %f30;
- sqrt.rn.f32 %f242, %f241;
- sub.f32 %f425, %f29, %f242;
- add.f32 %f424, %f29, %f242;
- mov.pred %p106, 0;
- BB0_26:
- @%p106 bra BB0_29;
- setp.lt.f32 %p32, %f425, 0f00000000;
- selp.f32 %f36, %f424, %f425, %p32;
- setp.geu.f32 %p33, %f36, %f422;
- @%p33 bra BB0_29;
- mul.lo.s64 %rd47, %rd8, 80;
- add.s64 %rd68, %rd35, %rd47;
- mov.f32 %f422, %f36;
- BB0_29:
- cvt.u32.u64 %r25, %rd8;
- add.s32 %r62, %r25, 1;
- mov.f32 %f428, %f422;
- BB0_30:
- setp.lt.u32 %p34, %r16, 4;
- @%p34 bra BB0_31;
- bra.uni BB0_32;
- BB0_31:
- mov.f32 %f422, %f428;
- bra.uni BB0_61;
- BB0_32:
- cvt.u64.u32 %rd14, %r62;
- mul.wide.u32 %rd48, %r62, 80;
- add.s64 %rd49, %rd35, %rd48;
- add.s64 %rd15, %rd49, 8;
- ld.f32 %f245, [%rd49+8];
- sub.f32 %f41, %f245, %f185;
- ld.f32 %f246, [%rd49+12];
- sub.f32 %f42, %f246, %f186;
- ld.f32 %f247, [%rd49+16];
- sub.f32 %f43, %f247, %f187;
- mul.f32 %f248, %f42, %f189;
- fma.rn.f32 %f249, %f41, %f188, %f248;
- fma.rn.f32 %f44, %f43, %f190, %f249;
- setp.lt.f32 %p36, %f44, 0f00000000;
- mov.pred %p107, -1;
- mov.f32 %f430, 0f7F800000;
- @%p36 bra BB0_33;
- bra.uni BB0_34;
- BB0_33:
- mov.f32 %f431, %f430;
- bra.uni BB0_36;
- BB0_34:
- mul.f32 %f252, %f42, %f42;
- fma.rn.f32 %f253, %f41, %f41, %f252;
- fma.rn.f32 %f254, %f43, %f43, %f253;
- mul.f32 %f255, %f44, %f44;
- sub.f32 %f45, %f254, %f255;
- ld.f32 %f46, [%rd15+16];
- setp.gt.f32 %p38, %f45, %f46;
- mov.f32 %f431, %f430;
- @%p38 bra BB0_36;
- sub.f32 %f256, %f46, %f45;
- sqrt.rn.f32 %f257, %f256;
- sub.f32 %f431, %f44, %f257;
- add.f32 %f430, %f44, %f257;
- mov.pred %p107, 0;
- BB0_36:
- @%p107 bra BB0_39;
- setp.lt.f32 %p40, %f431, 0f00000000;
- selp.f32 %f51, %f430, %f431, %p40;
- setp.geu.f32 %p41, %f51, %f422;
- @%p41 bra BB0_39;
- mul.lo.s64 %rd50, %rd14, 80;
- add.s64 %rd68, %rd35, %rd50;
- mov.f32 %f422, %f51;
- BB0_39:
- add.s32 %r26, %r62, 1;
- cvt.u64.u32 %rd18, %r26;
- mul.wide.u32 %rd51, %r26, 80;
- add.s64 %rd52, %rd35, %rd51;
- add.s64 %rd19, %rd52, 8;
- ld.f32 %f260, [%rd52+8];
- sub.f32 %f53, %f260, %f185;
- ld.f32 %f261, [%rd52+12];
- sub.f32 %f54, %f261, %f186;
- ld.f32 %f262, [%rd52+16];
- sub.f32 %f55, %f262, %f187;
- mul.f32 %f263, %f54, %f189;
- fma.rn.f32 %f264, %f53, %f188, %f263;
- fma.rn.f32 %f56, %f55, %f190, %f264;
- setp.lt.f32 %p43, %f56, 0f00000000;
- mov.pred %p108, -1;
- mov.f32 %f433, 0f7F800000;
- @%p43 bra BB0_40;
- bra.uni BB0_41;
- BB0_40:
- mov.f32 %f434, %f433;
- bra.uni BB0_43;
- BB0_41:
- mul.f32 %f267, %f54, %f54;
- fma.rn.f32 %f268, %f53, %f53, %f267;
- fma.rn.f32 %f269, %f55, %f55, %f268;
- mul.f32 %f270, %f56, %f56;
- sub.f32 %f57, %f269, %f270;
- ld.f32 %f58, [%rd19+16];
- setp.gt.f32 %p45, %f57, %f58;
- mov.f32 %f434, %f433;
- @%p45 bra BB0_43;
- sub.f32 %f271, %f58, %f57;
- sqrt.rn.f32 %f272, %f271;
- sub.f32 %f434, %f56, %f272;
- add.f32 %f433, %f56, %f272;
- mov.pred %p108, 0;
- BB0_43:
- @%p108 bra BB0_46;
- setp.lt.f32 %p47, %f434, 0f00000000;
- selp.f32 %f63, %f433, %f434, %p47;
- setp.geu.f32 %p48, %f63, %f422;
- @%p48 bra BB0_46;
- mul.lo.s64 %rd53, %rd18, 80;
- add.s64 %rd68, %rd35, %rd53;
- mov.f32 %f422, %f63;
- BB0_46:
- add.s32 %r27, %r62, 2;
- cvt.u64.u32 %rd22, %r27;
- mul.wide.u32 %rd54, %r27, 80;
- add.s64 %rd55, %rd35, %rd54;
- add.s64 %rd23, %rd55, 8;
- ld.f32 %f275, [%rd55+8];
- sub.f32 %f65, %f275, %f185;
- ld.f32 %f276, [%rd55+12];
- sub.f32 %f66, %f276, %f186;
- ld.f32 %f277, [%rd55+16];
- sub.f32 %f67, %f277, %f187;
- mul.f32 %f278, %f66, %f189;
- fma.rn.f32 %f279, %f65, %f188, %f278;
- fma.rn.f32 %f68, %f67, %f190, %f279;
- setp.lt.f32 %p50, %f68, 0f00000000;
- mov.pred %p109, -1;
- mov.f32 %f436, 0f7F800000;
- @%p50 bra BB0_47;
- bra.uni BB0_48;
- BB0_47:
- mov.f32 %f437, %f436;
- bra.uni BB0_50;
- BB0_48:
- mul.f32 %f282, %f66, %f66;
- fma.rn.f32 %f283, %f65, %f65, %f282;
- fma.rn.f32 %f284, %f67, %f67, %f283;
- mul.f32 %f285, %f68, %f68;
- sub.f32 %f69, %f284, %f285;
- ld.f32 %f70, [%rd23+16];
- setp.gt.f32 %p52, %f69, %f70;
- mov.f32 %f437, %f436;
- @%p52 bra BB0_50;
- sub.f32 %f286, %f70, %f69;
- sqrt.rn.f32 %f287, %f286;
- sub.f32 %f437, %f68, %f287;
- add.f32 %f436, %f68, %f287;
- mov.pred %p109, 0;
- BB0_50:
- @%p109 bra BB0_53;
- setp.lt.f32 %p54, %f437, 0f00000000;
- selp.f32 %f75, %f436, %f437, %p54;
- setp.geu.f32 %p55, %f75, %f422;
- @%p55 bra BB0_53;
- mul.lo.s64 %rd56, %rd22, 80;
- add.s64 %rd68, %rd35, %rd56;
- mov.f32 %f422, %f75;
- BB0_53:
- add.s32 %r28, %r62, 3;
- cvt.u64.u32 %rd26, %r28;
- mul.wide.u32 %rd57, %r28, 80;
- add.s64 %rd58, %rd35, %rd57;
- add.s64 %rd27, %rd58, 8;
- ld.f32 %f290, [%rd58+8];
- sub.f32 %f77, %f290, %f185;
- ld.f32 %f291, [%rd58+12];
- sub.f32 %f78, %f291, %f186;
- ld.f32 %f292, [%rd58+16];
- sub.f32 %f79, %f292, %f187;
- mul.f32 %f293, %f78, %f189;
- fma.rn.f32 %f294, %f77, %f188, %f293;
- fma.rn.f32 %f80, %f79, %f190, %f294;
- setp.lt.f32 %p57, %f80, 0f00000000;
- mov.pred %p110, -1;
- mov.f32 %f439, 0f7F800000;
- @%p57 bra BB0_54;
- bra.uni BB0_55;
- BB0_54:
- mov.f32 %f440, %f439;
- bra.uni BB0_57;
- BB0_55:
- mul.f32 %f297, %f78, %f78;
- fma.rn.f32 %f298, %f77, %f77, %f297;
- fma.rn.f32 %f299, %f79, %f79, %f298;
- mul.f32 %f300, %f80, %f80;
- sub.f32 %f81, %f299, %f300;
- ld.f32 %f82, [%rd27+16];
- setp.gt.f32 %p59, %f81, %f82;
- mov.f32 %f440, %f439;
- @%p59 bra BB0_57;
- sub.f32 %f301, %f82, %f81;
- sqrt.rn.f32 %f302, %f301;
- sub.f32 %f440, %f80, %f302;
- add.f32 %f439, %f80, %f302;
- mov.pred %p110, 0;
- BB0_57:
- @%p110 bra BB0_60;
- setp.lt.f32 %p61, %f440, 0f00000000;
- selp.f32 %f87, %f439, %f440, %p61;
- setp.geu.f32 %p62, %f87, %f422;
- @%p62 bra BB0_60;
- mul.lo.s64 %rd59, %rd26, 80;
- add.s64 %rd68, %rd35, %rd59;
- mov.f32 %f422, %f87;
- BB0_60:
- cvt.u32.u64 %r29, %rd14;
- add.s32 %r62, %r29, 4;
- setp.lt.u32 %p63, %r62, %r16;
- @%p63 bra BB0_32;
- BB0_61:
- setp.eq.s64 %p64, %rd68, 0;
- mov.f32 %f471, 0f40000000;
- mov.f32 %f472, %f471;
- mov.f32 %f473, %f471;
- @%p64 bra BB0_105;
- fma.rn.f32 %f90, %f422, %f188, %f185;
- fma.rn.f32 %f91, %f422, %f189, %f186;
- fma.rn.f32 %f92, %f422, %f190, %f187;
- add.s64 %rd31, %rd68, 8;
- ld.f32 %f306, [%rd68+8];
- sub.f32 %f443, %f90, %f306;
- ld.f32 %f307, [%rd68+12];
- sub.f32 %f444, %f91, %f307;
- ld.f32 %f308, [%rd68+16];
- sub.f32 %f445, %f92, %f308;
- mul.f32 %f309, %f444, %f444;
- fma.rn.f32 %f310, %f443, %f443, %f309;
- fma.rn.f32 %f96, %f445, %f445, %f310;
- setp.leu.f32 %p65, %f96, 0f00000000;
- @%p65 bra BB0_64;
- sqrt.rn.f32 %f311, %f96;
- rcp.rn.f32 %f312, %f311;
- mul.f32 %f443, %f443, %f312;
- mul.f32 %f444, %f444, %f312;
- mul.f32 %f445, %f445, %f312;
- BB0_64:
- mul.f32 %f313, %f444, %f189;
- fma.rn.f32 %f314, %f443, %f188, %f313;
- fma.rn.f32 %f315, %f445, %f190, %f314;
- mov.u16 %rs4, 0;
- setp.leu.f32 %p66, %f315, 0f00000000;
- @%p66 bra BB0_66;
- neg.f32 %f443, %f443;
- neg.f32 %f444, %f444;
- neg.f32 %f445, %f445;
- mov.u16 %rs4, 1;
- BB0_66:
- ld.f32 %f109, [%rd31+44];
- setp.gt.f32 %p67, %f109, 0f00000000;
- @%p67 bra BB0_73;
- bra.uni BB0_67;
- BB0_73:
- setp.lt.s32 %p71, %r17, 5;
- @%p71 bra BB0_68;
- bra.uni BB0_74;
- BB0_67:
- setp.lt.s32 %p68, %r17, 5;
- ld.f32 %f316, [%rd31+48];
- setp.gt.f32 %p69, %f316, 0f00000000;
- and.pred %p70, %p69, %p68;
- @%p70 bra BB0_68;
- bra.uni BB0_74;
- BB0_68:
- mul.f32 %f359, %f444, %f189;
- fma.rn.f32 %f360, %f443, %f188, %f359;
- fma.rn.f32 %f138, %f445, %f190, %f360;
- add.f32 %f139, %f138, 0f3F800000;
- cvt.f64.f32 %fd1, %f139;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r13}, %fd1;
- }
- mov.f64 %fd13, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r14}, %fd13;
- }
- bfe.u32 %r33, %r14, 20, 11;
- add.s32 %r34, %r33, -1012;
- mov.u64 %rd66, 4613937818241073152;
- shl.b64 %rd34, %rd66, %r34;
- setp.ne.s64 %p80, %rd34, -9223372036854775808;
- setp.eq.s64 %p81, %rd34, -9223372036854775808;
- abs.f64 %fd2, %fd1;
- // Callseq Start 0
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b64 param0;
- st.param.f64 [param0+0], %fd2;
- .param .b64 retval0;
- call.uni (retval0),
- __internal_accurate_pow,
- (
- param0
- );
- ld.param.f64 %fd18, [retval0+0];
- //{
- }// Callseq End 0
- setp.gt.s32 %p82, %r13, -1;
- setp.lt.s32 %p83, %r13, 0;
- and.pred %p8, %p83, %p81;
- or.pred %p84, %p82, %p80;
- @%p84 bra BB0_70;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r35}, %fd18;
- }
- xor.b32 %r36, %r35, -2147483648;
- {
- .reg .b32 %temp;
- mov.b64 {%r37, %temp}, %fd18;
- }
- mov.b64 %fd18, {%r37, %r36};
- BB0_70:
- setp.eq.f32 %p85, %f139, 0f00000000;
- @%p85 bra BB0_86;
- bra.uni BB0_71;
- BB0_86:
- selp.b32 %r38, %r13, 0, %p81;
- mov.u32 %r39, 0;
- or.b32 %r40, %r38, 2146435072;
- setp.lt.s32 %p89, %r14, 0;
- selp.b32 %r41, %r40, %r38, %p89;
- mov.b64 %fd18, {%r39, %r41};
- bra.uni BB0_87;
- BB0_74:
- mov.f32 %f468, 0f00000000;
- mov.f32 %f469, %f468;
- mov.f32 %f470, %f468;
- @%p9 bra BB0_104;
- fma.rn.f32 %f110, %f443, 0f38D1B717, %f90;
- fma.rn.f32 %f111, %f444, 0f38D1B717, %f91;
- fma.rn.f32 %f112, %f445, 0f38D1B717, %f92;
- mov.f32 %f470, 0f00000000;
- mov.u32 %r64, 0;
- mov.f32 %f469, %f470;
- mov.f32 %f468, %f470;
- BB0_76:
- cvt.u64.u32 %rd32, %r64;
- mul.wide.u32 %rd60, %r64, 80;
- add.s64 %rd61, %rd35, %rd60;
- add.s64 %rd33, %rd61, 40;
- ld.f32 %f116, [%rd61+40];
- setp.leu.f32 %p73, %f116, 0f00000000;
- @%p73 bra BB0_85;
- ld.f32 %f323, [%rd33+-32];
- sub.f32 %f454, %f323, %f90;
- ld.f32 %f324, [%rd33+-28];
- sub.f32 %f453, %f324, %f91;
- ld.f32 %f325, [%rd33+-24];
- sub.f32 %f452, %f325, %f92;
- mul.f32 %f326, %f453, %f453;
- fma.rn.f32 %f327, %f454, %f454, %f326;
- fma.rn.f32 %f120, %f452, %f452, %f327;
- setp.leu.f32 %p74, %f120, 0f00000000;
- @%p74 bra BB0_79;
- sqrt.rn.f32 %f328, %f120;
- rcp.rn.f32 %f329, %f328;
- mul.f32 %f454, %f454, %f329;
- mul.f32 %f453, %f453, %f329;
- mul.f32 %f452, %f452, %f329;
- BB0_79:
- mov.u32 %r65, 0;
- BB0_80:
- cvt.u32.u64 %r32, %rd32;
- setp.eq.s32 %p75, %r32, %r65;
- @%p75 bra BB0_83;
- mul.wide.u32 %rd62, %r65, 80;
- add.s64 %rd63, %rd35, %rd62;
- ld.f32 %f330, [%rd63+8];
- sub.f32 %f127, %f330, %f110;
- ld.f32 %f331, [%rd63+12];
- sub.f32 %f128, %f331, %f111;
- ld.f32 %f332, [%rd63+16];
- sub.f32 %f129, %f332, %f112;
- mul.f32 %f333, %f453, %f128;
- fma.rn.f32 %f334, %f454, %f127, %f333;
- fma.rn.f32 %f130, %f452, %f129, %f334;
- setp.lt.f32 %p76, %f130, 0f00000000;
- @%p76 bra BB0_83;
- mul.f32 %f336, %f128, %f128;
- fma.rn.f32 %f337, %f127, %f127, %f336;
- fma.rn.f32 %f338, %f129, %f129, %f337;
- mul.f32 %f339, %f130, %f130;
- sub.f32 %f340, %f338, %f339;
- ld.f32 %f341, [%rd63+24];
- mov.f32 %f455, 0f00000000;
- setp.leu.f32 %p77, %f340, %f341;
- @%p77 bra BB0_84;
- BB0_83:
- add.s32 %r65, %r65, 1;
- setp.lt.u32 %p78, %r65, %r16;
- mov.f32 %f455, 0f3F800000;
- @%p78 bra BB0_80;
- BB0_84:
- ld.f32 %f343, [%rd31+20];
- mul.f32 %f344, %f455, %f343;
- ld.f32 %f345, [%rd31+24];
- mul.f32 %f346, %f455, %f345;
- ld.f32 %f347, [%rd31+28];
- mul.f32 %f348, %f455, %f347;
- mul.f32 %f349, %f443, %f454;
- fma.rn.f32 %f350, %f444, %f453, %f349;
- fma.rn.f32 %f351, %f445, %f452, %f350;
- mov.f32 %f352, 0f00000000;
- max.f32 %f353, %f352, %f351;
- mul.f32 %f354, %f344, %f353;
- mul.f32 %f355, %f346, %f353;
- mul.f32 %f356, %f348, %f353;
- ld.f32 %f357, [%rd33+4];
- ld.f32 %f358, [%rd33+8];
- fma.rn.f32 %f468, %f354, %f116, %f468;
- fma.rn.f32 %f469, %f355, %f357, %f469;
- fma.rn.f32 %f470, %f356, %f358, %f470;
- BB0_85:
- add.s32 %r64, %r64, 1;
- setp.lt.u32 %p79, %r64, %r16;
- @%p79 bra BB0_76;
- bra.uni BB0_104;
- BB0_71:
- @%p82 bra BB0_87;
- cvt.rzi.f64.f64 %fd15, %fd13;
- setp.neu.f64 %p87, %fd15, 0d4008000000000000;
- selp.f64 %fd18, 0dFFF8000000000000, %fd18, %p87;
- BB0_87:
- add.f64 %fd19, %fd1, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r42}, %fd19;
- }
- and.b32 %r43, %r42, 2146435072;
- setp.ne.s32 %p90, %r43, 2146435072;
- @%p90 bra BB0_88;
- setp.gtu.f64 %p91, %fd2, 0d7FF0000000000000;
- @%p91 bra BB0_97;
- and.b32 %r44, %r14, 2147483647;
- setp.ne.s32 %p92, %r44, 2146435072;
- @%p92 bra BB0_92;
- {
- .reg .b32 %temp;
- mov.b64 {%r45, %temp}, %fd13;
- }
- setp.eq.s32 %p93, %r45, 0;
- @%p93 bra BB0_96;
- BB0_92:
- and.b32 %r46, %r13, 2147483647;
- setp.ne.s32 %p94, %r46, 2146435072;
- @%p94 bra BB0_93;
- {
- .reg .b32 %temp;
- mov.b64 {%r47, %temp}, %fd1;
- }
- setp.ne.s32 %p95, %r47, 0;
- mov.f64 %fd19, %fd18;
- @%p95 bra BB0_97;
- shr.s32 %r48, %r14, 31;
- and.b32 %r49, %r48, -2146435072;
- add.s32 %r50, %r49, 2146435072;
- or.b32 %r51, %r50, -2147483648;
- selp.b32 %r52, %r51, %r50, %p8;
- mov.u32 %r53, 0;
- mov.b64 %fd19, {%r53, %r52};
- bra.uni BB0_97;
- BB0_88:
- mov.f64 %fd19, %fd18;
- bra.uni BB0_97;
- BB0_93:
- mov.f64 %fd19, %fd18;
- bra.uni BB0_97;
- BB0_96:
- setp.gt.f64 %p96, %fd2, 0d3FF0000000000000;
- selp.b32 %r54, 2146435072, 0, %p96;
- mov.u32 %r55, 0;
- xor.b32 %r56, %r54, 2146435072;
- setp.lt.s32 %p97, %r14, 0;
- selp.b32 %r57, %r56, %r54, %p97;
- setp.eq.f32 %p98, %f139, 0fBF800000;
- selp.b32 %r58, 1072693248, %r57, %p98;
- mov.b64 %fd19, {%r55, %r58};
- BB0_97:
- cvt.rn.f32.f64 %f361, %fd19;
- fma.rn.f32 %f362, %f361, 0f3F666666, 0f3DCCCCCD;
- setp.eq.f32 %p99, %f139, 0f3F800000;
- selp.f32 %f140, 0f3F800000, %f362, %p99;
- add.f32 %f363, %f443, %f443;
- mul.f32 %f364, %f363, %f138;
- add.f32 %f365, %f444, %f444;
- mul.f32 %f366, %f365, %f138;
- add.f32 %f367, %f445, %f445;
- mul.f32 %f368, %f367, %f138;
- sub.f32 %f459, %f188, %f364;
- sub.f32 %f460, %f189, %f366;
- sub.f32 %f461, %f190, %f368;
- mul.f32 %f369, %f460, %f460;
- fma.rn.f32 %f370, %f459, %f459, %f369;
- fma.rn.f32 %f144, %f461, %f461, %f370;
- setp.leu.f32 %p100, %f144, 0f00000000;
- @%p100 bra BB0_99;
- sqrt.rn.f32 %f371, %f144;
- rcp.rn.f32 %f372, %f371;
- mul.f32 %f459, %f459, %f372;
- mul.f32 %f460, %f460, %f372;
- mul.f32 %f461, %f461, %f372;
- BB0_99:
- mul.f32 %f151, %f443, 0f38D1B717;
- add.f32 %f376, %f90, %f151;
- mul.f32 %f152, %f444, 0f38D1B717;
- add.f32 %f377, %f91, %f152;
- mul.f32 %f153, %f445, 0f38D1B717;
- add.f32 %f378, %f92, %f153;
- add.s32 %r15, %r17, 1;
- // Callseq Start 1
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b32 param0;
- st.param.f32 [param0+0], %f376;
- .param .b32 param1;
- st.param.f32 [param1+0], %f377;
- .param .b32 param2;
- st.param.f32 [param2+0], %f378;
- .param .b32 param3;
- st.param.f32 [param3+0], %f459;
- .param .b32 param4;
- st.param.f32 [param4+0], %f460;
- .param .b32 param5;
- st.param.f32 [param5+0], %f461;
- .param .b64 param6;
- st.param.b64 [param6+0], %rd35;
- .param .b32 param7;
- st.param.b32 [param7+0], %r16;
- .param .b32 param8;
- st.param.b32 [param8+0], %r15;
- .param .align 4 .b8 retval0[12];
- call.uni (retval0),
- _Z5traceRK4Vec3IfES2_PK6SpherejRKi,
- (
- param0,
- param1,
- param2,
- param3,
- param4,
- param5,
- param6,
- param7,
- param8
- );
- ld.param.f32 %f154, [retval0+0];
- ld.param.f32 %f155, [retval0+4];
- ld.param.f32 %f156, [retval0+8];
- //{
- }// Callseq End 1
- mov.f32 %f465, 0f00000000;
- setp.eq.f32 %p101, %f109, 0f00000000;
- mov.f32 %f466, %f465;
- mov.f32 %f467, %f465;
- @%p101 bra BB0_103;
- setp.eq.s16 %p102, %rs4, 0;
- selp.f32 %f379, 0f3F68BA2E, 0f3F8CCCCD, %p102;
- mul.f32 %f380, %f379, %f379;
- mul.f32 %f381, %f138, %f138;
- mov.f32 %f382, 0f3F800000;
- sub.f32 %f383, %f382, %f381;
- mul.f32 %f384, %f380, %f383;
- sub.f32 %f385, %f382, %f384;
- mul.f32 %f386, %f138, %f379;
- neg.f32 %f387, %f386;
- sqrt.rn.f32 %f388, %f385;
- sub.f32 %f389, %f387, %f388;
- mul.f32 %f390, %f443, %f389;
- mul.f32 %f391, %f444, %f389;
- mul.f32 %f392, %f445, %f389;
- fma.rn.f32 %f464, %f379, %f188, %f390;
- fma.rn.f32 %f463, %f379, %f189, %f391;
- fma.rn.f32 %f462, %f379, %f190, %f392;
- mul.f32 %f393, %f463, %f463;
- fma.rn.f32 %f394, %f464, %f464, %f393;
- fma.rn.f32 %f160, %f462, %f462, %f394;
- setp.leu.f32 %p103, %f160, 0f00000000;
- @%p103 bra BB0_102;
- sqrt.rn.f32 %f395, %f160;
- rcp.rn.f32 %f396, %f395;
- mul.f32 %f464, %f464, %f396;
- mul.f32 %f463, %f463, %f396;
- mul.f32 %f462, %f462, %f396;
- BB0_102:
- sub.f32 %f397, %f92, %f153;
- sub.f32 %f398, %f91, %f152;
- sub.f32 %f399, %f90, %f151;
- // Callseq Start 2
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b32 param0;
- st.param.f32 [param0+0], %f399;
- .param .b32 param1;
- st.param.f32 [param1+0], %f398;
- .param .b32 param2;
- st.param.f32 [param2+0], %f397;
- .param .b32 param3;
- st.param.f32 [param3+0], %f464;
- .param .b32 param4;
- st.param.f32 [param4+0], %f463;
- .param .b32 param5;
- st.param.f32 [param5+0], %f462;
- .param .b64 param6;
- st.param.b64 [param6+0], %rd35;
- .param .b32 param7;
- st.param.b32 [param7+0], %r16;
- .param .b32 param8;
- add.s32 %r59, %r17, 1;
- st.param.b32 [param8+0], %r59;
- .param .align 4 .b8 retval0[12];
- call.uni (retval0),
- _Z5traceRK4Vec3IfES2_PK6SpherejRKi,
- (
- param0,
- param1,
- param2,
- param3,
- param4,
- param5,
- param6,
- param7,
- param8
- );
- ld.param.f32 %f465, [retval0+0];
- ld.param.f32 %f466, [retval0+4];
- ld.param.f32 %f467, [retval0+8];
- //{
- }// Callseq End 2
- BB0_103:
- mov.f32 %f400, 0f3F800000;
- sub.f32 %f401, %f400, %f140;
- mul.f32 %f402, %f401, %f465;
- mul.f32 %f403, %f401, %f466;
- mul.f32 %f404, %f401, %f467;
- mul.f32 %f405, %f402, %f109;
- mul.f32 %f406, %f403, %f109;
- mul.f32 %f407, %f404, %f109;
- fma.rn.f32 %f408, %f140, %f154, %f405;
- fma.rn.f32 %f409, %f140, %f155, %f406;
- fma.rn.f32 %f410, %f140, %f156, %f407;
- ld.f32 %f411, [%rd31+20];
- mul.f32 %f468, %f411, %f408;
- ld.f32 %f412, [%rd31+24];
- mul.f32 %f469, %f409, %f412;
- ld.f32 %f413, [%rd31+28];
- mul.f32 %f470, %f410, %f413;
- BB0_104:
- ld.f32 %f414, [%rd31+32];
- add.f32 %f471, %f468, %f414;
- ld.f32 %f415, [%rd31+36];
- add.f32 %f472, %f469, %f415;
- ld.f32 %f416, [%rd31+40];
- add.f32 %f473, %f470, %f416;
- BB0_105:
- st.param.f32 [func_retval0+0], %f471;
- st.param.f32 [func_retval0+4], %f472;
- st.param.f32 [func_retval0+8], %f473;
- ret;
- }
- // .globl raytrace_kernel
- .visible .entry raytrace_kernel(
- .param .u32 raytrace_kernel_param_0,
- .param .u32 raytrace_kernel_param_1,
- .param .u64 raytrace_kernel_param_2,
- .param .u64 raytrace_kernel_param_3,
- .param .u32 raytrace_kernel_param_4,
- .param .f32 raytrace_kernel_param_5,
- .param .f32 raytrace_kernel_param_6,
- .param .f32 raytrace_kernel_param_7,
- .param .f32 raytrace_kernel_param_8
- )
- {
- .reg .pred %p<326>;
- .reg .b16 %rs<13>;
- .reg .f32 %f<1415>;
- .reg .b32 %r<220>;
- .reg .f64 %fd<79>;
- .reg .b64 %rd<373>;
- ld.param.u32 %r40, [raytrace_kernel_param_0];
- ld.param.u32 %r42, [raytrace_kernel_param_1];
- ld.param.u64 %rd153, [raytrace_kernel_param_3];
- ld.param.u32 %r41, [raytrace_kernel_param_4];
- ld.param.f32 %f559, [raytrace_kernel_param_5];
- ld.param.f32 %f560, [raytrace_kernel_param_6];
- ld.param.f32 %f561, [raytrace_kernel_param_7];
- ld.param.f32 %f562, [raytrace_kernel_param_8];
- cvta.to.global.u64 %rd1, %rd153;
- mov.u32 %r43, %ntid.x;
- mov.u32 %r44, %ctaid.x;
- mov.u32 %r45, %tid.x;
- mad.lo.s32 %r1, %r43, %r44, %r45;
- mov.u32 %r46, %ntid.y;
- mov.u32 %r47, %ctaid.y;
- mov.u32 %r48, %tid.y;
- mad.lo.s32 %r2, %r46, %r47, %r48;
- setp.ge.u32 %p25, %r2, %r42;
- setp.ge.u32 %p26, %r1, %r40;
- or.pred %p27, %p25, %p26;
- @%p27 bra BB1_317;
- cvt.rn.f64.s32 %fd37, %r1;
- add.f64 %fd38, %fd37, 0d3FE0000000000000;
- cvt.f64.f32 %fd39, %f559;
- mul.f64 %fd40, %fd39, %fd38;
- fma.rn.f64 %fd41, %fd40, 0d4000000000000000, 0dBFF0000000000000;
- cvt.f64.f32 %fd42, %f562;
- mul.f64 %fd43, %fd42, %fd41;
- cvt.f64.f32 %fd44, %f561;
- mul.f64 %fd45, %fd44, %fd43;
- cvt.rn.f32.f64 %f1246, %fd45;
- cvt.rn.f64.s32 %fd46, %r2;
- add.f64 %fd47, %fd46, 0d3FE0000000000000;
- cvt.f64.f32 %fd48, %f560;
- mul.f64 %fd49, %fd48, %fd47;
- fma.rn.f64 %fd50, %fd48, %fd47, %fd49;
- mov.f64 %fd51, 0d3FF0000000000000;
- sub.f64 %fd52, %fd51, %fd50;
- mul.f64 %fd53, %fd42, %fd52;
- cvt.rn.f32.f64 %f1245, %fd53;
- mul.f32 %f564, %f1245, %f1245;
- fma.rn.f32 %f565, %f1246, %f1246, %f564;
- add.f32 %f3, %f565, 0f3F800000;
- mov.f32 %f1244, 0fBF800000;
- setp.leu.f32 %p28, %f3, 0f00000000;
- @%p28 bra BB1_3;
- sqrt.rn.f32 %f566, %f3;
- rcp.rn.f32 %f567, %f566;
- mul.f32 %f1246, %f1246, %f567;
- mul.f32 %f1245, %f1245, %f567;
- neg.f32 %f1244, %f567;
- BB1_3:
- setp.eq.s32 %p29, %r41, 0;
- mov.f32 %f1252, 0f7F800000;
- mov.u64 %rd310, 0;
- mov.u64 %rd309, %rd310;
- @%p29 bra BB1_63;
- and.b32 %r52, %r41, 3;
- mov.f32 %f1252, 0f7F800000;
- mov.u64 %rd310, 0;
- mov.u32 %r204, 0;
- mov.f32 %f1258, 0f00000000;
- setp.eq.s32 %p30, %r52, 0;
- mov.u64 %rd309, %rd310;
- @%p30 bra BB1_32;
- mov.f32 %f1252, 0f7F800000;
- mov.u64 %rd310, 0;
- mov.u32 %r203, 0;
- and.b32 %r192, %r41, 3;
- setp.eq.s32 %p31, %r192, 1;
- mov.u64 %rd309, %rd310;
- @%p31 bra BB1_24;
- mov.f32 %f1252, 0f7F800000;
- mov.u64 %rd310, 0;
- mov.u32 %r202, 0;
- and.b32 %r194, %r41, 3;
- setp.eq.s32 %p32, %r194, 2;
- mov.u64 %rd309, %rd310;
- @%p32 bra BB1_16;
- ld.global.f32 %f10, [%rd1+8];
- ld.global.f32 %f11, [%rd1+12];
- mul.f32 %f575, %f1245, %f11;
- fma.rn.f32 %f576, %f1246, %f10, %f575;
- ld.global.f32 %f12, [%rd1+16];
- fma.rn.f32 %f13, %f1244, %f12, %f576;
- setp.lt.f32 %p34, %f13, 0f00000000;
- mov.pred %p305, -1;
- mov.f32 %f1247, 0f7F800000;
- @%p34 bra BB1_8;
- bra.uni BB1_9;
- BB1_8:
- mov.f32 %f1248, %f1247;
- bra.uni BB1_11;
- BB1_9:
- mov.f32 %f1247, 0f7F800000;
- add.s64 %rd268, %rd1, 8;
- mul.f32 %f579, %f11, %f11;
- fma.rn.f32 %f580, %f10, %f10, %f579;
- fma.rn.f32 %f581, %f12, %f12, %f580;
- mul.f32 %f582, %f13, %f13;
- sub.f32 %f14, %f581, %f582;
- ld.global.f32 %f15, [%rd268+16];
- setp.gt.f32 %p36, %f14, %f15;
- mov.f32 %f1248, %f1247;
- @%p36 bra BB1_11;
- sub.f32 %f583, %f15, %f14;
- sqrt.rn.f32 %f584, %f583;
- sub.f32 %f1248, %f13, %f584;
- add.f32 %f1247, %f13, %f584;
- mov.pred %p305, 0;
- BB1_11:
- mov.u64 %rd310, 0;
- mov.f32 %f1252, 0f7F800000;
- mov.u32 %r202, 1;
- @%p305 bra BB1_12;
- bra.uni BB1_13;
- BB1_12:
- mov.u64 %rd309, %rd310;
- bra.uni BB1_16;
- BB1_13:
- mov.u64 %rd310, 0;
- mov.f32 %f1224, 0f7F800000;
- setp.lt.f32 %p38, %f1248, 0f00000000;
- selp.f32 %f1252, %f1247, %f1248, %p38;
- setp.geu.f32 %p39, %f1252, 0f7F800000;
- @%p39 bra BB1_14;
- mov.u64 %rd310, %rd153;
- mov.u64 %rd309, %rd1;
- bra.uni BB1_16;
- BB1_14:
- mov.u64 %rd309, %rd310;
- mov.f32 %f1252, %f1224;
- BB1_16:
- mov.f32 %f1250, 0f7F800000;
- mul.wide.u32 %rd166, %r202, 80;
- add.s64 %rd167, %rd1, %rd166;
- ld.global.f32 %f22, [%rd167+8];
- ld.global.f32 %f23, [%rd167+12];
- mul.f32 %f589, %f1245, %f23;
- fma.rn.f32 %f590, %f1246, %f22, %f589;
- ld.global.f32 %f24, [%rd167+16];
- fma.rn.f32 %f25, %f1244, %f24, %f590;
- setp.lt.f32 %p41, %f25, 0f00000000;
- mov.pred %p306, -1;
- @%p41 bra BB1_17;
- bra.uni BB1_18;
- BB1_17:
- mov.f32 %f1251, %f1250;
- bra.uni BB1_20;
- BB1_18:
- mul.wide.u32 %rd263, %r202, 80;
- add.s64 %rd262, %rd1, %rd263;
- mov.f32 %f1250, 0f7F800000;
- mul.f32 %f593, %f23, %f23;
- fma.rn.f32 %f594, %f22, %f22, %f593;
- fma.rn.f32 %f595, %f24, %f24, %f594;
- mul.f32 %f596, %f25, %f25;
- sub.f32 %f26, %f595, %f596;
- ld.global.f32 %f27, [%rd262+24];
- setp.gt.f32 %p43, %f26, %f27;
- mov.f32 %f1251, %f1250;
- @%p43 bra BB1_20;
- sub.f32 %f597, %f27, %f26;
- sqrt.rn.f32 %f598, %f597;
- sub.f32 %f1251, %f25, %f598;
- add.f32 %f1250, %f25, %f598;
- mov.pred %p306, 0;
- BB1_20:
- @%p306 bra BB1_23;
- setp.lt.f32 %p45, %f1251, 0f00000000;
- selp.f32 %f32, %f1250, %f1251, %p45;
- setp.geu.f32 %p46, %f32, %f1252;
- @%p46 bra BB1_23;
- mul.wide.u32 %rd265, %r202, 80;
- add.s64 %rd309, %rd1, %rd265;
- add.s64 %rd310, %rd153, %rd265;
- mov.f32 %f1252, %f32;
- BB1_23:
- add.s32 %r203, %r202, 1;
- BB1_24:
- mov.f32 %f1254, 0f7F800000;
- mul.wide.u32 %rd171, %r203, 80;
- add.s64 %rd172, %rd1, %rd171;
- ld.global.f32 %f35, [%rd172+8];
- ld.global.f32 %f36, [%rd172+12];
- mul.f32 %f601, %f1245, %f36;
- fma.rn.f32 %f602, %f1246, %f35, %f601;
- ld.global.f32 %f37, [%rd172+16];
- fma.rn.f32 %f38, %f1244, %f37, %f602;
- setp.lt.f32 %p48, %f38, 0f00000000;
- mov.pred %p307, -1;
- @%p48 bra BB1_25;
- bra.uni BB1_26;
- BB1_25:
- mov.f32 %f1255, %f1254;
- bra.uni BB1_28;
- BB1_26:
- mul.wide.u32 %rd273, %r203, 80;
- add.s64 %rd272, %rd1, %rd273;
- add.s64 %rd271, %rd272, 8;
- mov.f32 %f1254, 0f7F800000;
- mul.f32 %f605, %f36, %f36;
- fma.rn.f32 %f606, %f35, %f35, %f605;
- fma.rn.f32 %f607, %f37, %f37, %f606;
- mul.f32 %f608, %f38, %f38;
- sub.f32 %f39, %f607, %f608;
- ld.global.f32 %f40, [%rd271+16];
- setp.gt.f32 %p50, %f39, %f40;
- mov.f32 %f1255, %f1254;
- @%p50 bra BB1_28;
- sub.f32 %f609, %f40, %f39;
- sqrt.rn.f32 %f610, %f609;
- sub.f32 %f1255, %f38, %f610;
- add.f32 %f1254, %f38, %f610;
- mov.pred %p307, 0;
- BB1_28:
- @%p307 bra BB1_31;
- setp.lt.f32 %p52, %f1255, 0f00000000;
- selp.f32 %f45, %f1254, %f1255, %p52;
- setp.geu.f32 %p53, %f45, %f1252;
- @%p53 bra BB1_31;
- cvt.u64.u32 %rd274, %r203;
- mul.lo.s64 %rd173, %rd274, 80;
- add.s64 %rd309, %rd1, %rd173;
- add.s64 %rd310, %rd153, %rd173;
- mov.f32 %f1252, %f45;
- BB1_31:
- cvt.u64.u32 %rd275, %r203;
- cvt.u32.u64 %r56, %rd275;
- add.s32 %r204, %r56, 1;
- mov.f32 %f1258, %f1252;
- BB1_32:
- setp.lt.u32 %p54, %r41, 4;
- @%p54 bra BB1_33;
- bra.uni BB1_34;
- BB1_33:
- mov.f32 %f1252, %f1258;
- bra.uni BB1_63;
- BB1_34:
- mul.wide.u32 %rd174, %r204, 80;
- add.s64 %rd175, %rd1, %rd174;
- ld.global.f32 %f50, [%rd175+8];
- ld.global.f32 %f51, [%rd175+12];
- mul.f32 %f613, %f1245, %f51;
- fma.rn.f32 %f614, %f1246, %f50, %f613;
- ld.global.f32 %f52, [%rd175+16];
- fma.rn.f32 %f53, %f1244, %f52, %f614;
- setp.lt.f32 %p56, %f53, 0f00000000;
- mov.pred %p308, -1;
- mov.f32 %f1260, 0f7F800000;
- @%p56 bra BB1_35;
- bra.uni BB1_36;
- BB1_35:
- mov.f32 %f1261, %f1260;
- bra.uni BB1_38;
- BB1_36:
- mul.wide.u32 %rd290, %r204, 80;
- add.s64 %rd289, %rd1, %rd290;
- add.s64 %rd288, %rd289, 8;
- mul.f32 %f617, %f51, %f51;
- fma.rn.f32 %f618, %f50, %f50, %f617;
- fma.rn.f32 %f619, %f52, %f52, %f618;
- mul.f32 %f620, %f53, %f53;
- sub.f32 %f54, %f619, %f620;
- ld.global.f32 %f55, [%rd288+16];
- setp.gt.f32 %p58, %f54, %f55;
- mov.f32 %f1261, %f1260;
- @%p58 bra BB1_38;
- sub.f32 %f621, %f55, %f54;
- sqrt.rn.f32 %f622, %f621;
- sub.f32 %f1261, %f53, %f622;
- add.f32 %f1260, %f53, %f622;
- mov.pred %p308, 0;
- BB1_38:
- @%p308 bra BB1_41;
- setp.lt.f32 %p60, %f1261, 0f00000000;
- selp.f32 %f60, %f1260, %f1261, %p60;
- setp.geu.f32 %p61, %f60, %f1252;
- @%p61 bra BB1_41;
- cvt.u64.u32 %rd291, %r204;
- mul.lo.s64 %rd176, %rd291, 80;
- add.s64 %rd309, %rd1, %rd176;
- add.s64 %rd310, %rd153, %rd176;
- mov.f32 %f1252, %f60;
- BB1_41:
- add.s32 %r57, %r204, 1;
- mul.wide.u32 %rd177, %r57, 80;
- add.s64 %rd178, %rd1, %rd177;
- ld.global.f32 %f62, [%rd178+8];
- ld.global.f32 %f63, [%rd178+12];
- mul.f32 %f625, %f1245, %f63;
- fma.rn.f32 %f626, %f1246, %f62, %f625;
- ld.global.f32 %f64, [%rd178+16];
- fma.rn.f32 %f65, %f1244, %f64, %f626;
- setp.lt.f32 %p63, %f65, 0f00000000;
- mov.pred %p309, -1;
- mov.f32 %f1263, 0f7F800000;
- @%p63 bra BB1_42;
- bra.uni BB1_43;
- BB1_42:
- mov.f32 %f1264, %f1263;
- bra.uni BB1_45;
- BB1_43:
- add.s32 %r196, %r204, 1;
- mul.wide.u32 %rd295, %r196, 80;
- add.s64 %rd294, %rd1, %rd295;
- add.s64 %rd293, %rd294, 8;
- mul.f32 %f629, %f63, %f63;
- fma.rn.f32 %f630, %f62, %f62, %f629;
- fma.rn.f32 %f631, %f64, %f64, %f630;
- mul.f32 %f632, %f65, %f65;
- sub.f32 %f66, %f631, %f632;
- ld.global.f32 %f67, [%rd293+16];
- setp.gt.f32 %p65, %f66, %f67;
- mov.f32 %f1264, %f1263;
- @%p65 bra BB1_45;
- sub.f32 %f633, %f67, %f66;
- sqrt.rn.f32 %f634, %f633;
- sub.f32 %f1264, %f65, %f634;
- add.f32 %f1263, %f65, %f634;
- mov.pred %p309, 0;
- BB1_45:
- @%p309 bra BB1_48;
- setp.lt.f32 %p67, %f1264, 0f00000000;
- selp.f32 %f72, %f1263, %f1264, %p67;
- setp.geu.f32 %p68, %f72, %f1252;
- @%p68 bra BB1_48;
- add.s32 %r197, %r204, 1;
- cvt.u64.u32 %rd296, %r197;
- mul.lo.s64 %rd179, %rd296, 80;
- add.s64 %rd309, %rd1, %rd179;
- add.s64 %rd310, %rd153, %rd179;
- mov.f32 %f1252, %f72;
- BB1_48:
- add.s32 %r58, %r204, 2;
- mul.wide.u32 %rd180, %r58, 80;
- add.s64 %rd181, %rd1, %rd180;
- ld.global.f32 %f74, [%rd181+8];
- ld.global.f32 %f75, [%rd181+12];
- mul.f32 %f637, %f1245, %f75;
- fma.rn.f32 %f638, %f1246, %f74, %f637;
- ld.global.f32 %f76, [%rd181+16];
- fma.rn.f32 %f77, %f1244, %f76, %f638;
- setp.lt.f32 %p70, %f77, 0f00000000;
- mov.pred %p310, -1;
- mov.f32 %f1266, 0f7F800000;
- @%p70 bra BB1_49;
- bra.uni BB1_50;
- BB1_49:
- mov.f32 %f1267, %f1266;
- bra.uni BB1_52;
- BB1_50:
- add.s32 %r198, %r204, 2;
- mul.wide.u32 %rd299, %r198, 80;
- add.s64 %rd298, %rd1, %rd299;
- add.s64 %rd297, %rd298, 8;
- mul.f32 %f641, %f75, %f75;
- fma.rn.f32 %f642, %f74, %f74, %f641;
- fma.rn.f32 %f643, %f76, %f76, %f642;
- mul.f32 %f644, %f77, %f77;
- sub.f32 %f78, %f643, %f644;
- ld.global.f32 %f79, [%rd297+16];
- setp.gt.f32 %p72, %f78, %f79;
- mov.f32 %f1267, %f1266;
- @%p72 bra BB1_52;
- sub.f32 %f645, %f79, %f78;
- sqrt.rn.f32 %f646, %f645;
- sub.f32 %f1267, %f77, %f646;
- add.f32 %f1266, %f77, %f646;
- mov.pred %p310, 0;
- BB1_52:
- @%p310 bra BB1_55;
- setp.lt.f32 %p74, %f1267, 0f00000000;
- selp.f32 %f84, %f1266, %f1267, %p74;
- setp.geu.f32 %p75, %f84, %f1252;
- @%p75 bra BB1_55;
- add.s32 %r199, %r204, 2;
- cvt.u64.u32 %rd300, %r199;
- mul.lo.s64 %rd182, %rd300, 80;
- add.s64 %rd309, %rd1, %rd182;
- add.s64 %rd310, %rd153, %rd182;
- mov.f32 %f1252, %f84;
- BB1_55:
- add.s32 %r59, %r204, 3;
- mul.wide.u32 %rd183, %r59, 80;
- add.s64 %rd184, %rd1, %rd183;
- ld.global.f32 %f86, [%rd184+8];
- ld.global.f32 %f87, [%rd184+12];
- mul.f32 %f649, %f1245, %f87;
- fma.rn.f32 %f650, %f1246, %f86, %f649;
- ld.global.f32 %f88, [%rd184+16];
- fma.rn.f32 %f89, %f1244, %f88, %f650;
- setp.lt.f32 %p77, %f89, 0f00000000;
- mov.pred %p311, -1;
- mov.f32 %f1269, 0f7F800000;
- @%p77 bra BB1_56;
- bra.uni BB1_57;
- BB1_56:
- mov.f32 %f1270, %f1269;
- bra.uni BB1_59;
- BB1_57:
- add.s32 %r200, %r204, 3;
- mul.wide.u32 %rd303, %r200, 80;
- add.s64 %rd302, %rd1, %rd303;
- add.s64 %rd301, %rd302, 8;
- mul.f32 %f653, %f87, %f87;
- fma.rn.f32 %f654, %f86, %f86, %f653;
- fma.rn.f32 %f655, %f88, %f88, %f654;
- mul.f32 %f656, %f89, %f89;
- sub.f32 %f90, %f655, %f656;
- ld.global.f32 %f91, [%rd301+16];
- setp.gt.f32 %p79, %f90, %f91;
- mov.f32 %f1270, %f1269;
- @%p79 bra BB1_59;
- sub.f32 %f657, %f91, %f90;
- sqrt.rn.f32 %f658, %f657;
- sub.f32 %f1270, %f89, %f658;
- add.f32 %f1269, %f89, %f658;
- mov.pred %p311, 0;
- BB1_59:
- @%p311 bra BB1_62;
- setp.lt.f32 %p81, %f1270, 0f00000000;
- selp.f32 %f96, %f1269, %f1270, %p81;
- setp.geu.f32 %p82, %f96, %f1252;
- @%p82 bra BB1_62;
- add.s32 %r201, %r204, 3;
- cvt.u64.u32 %rd304, %r201;
- mul.lo.s64 %rd185, %rd304, 80;
- add.s64 %rd309, %rd1, %rd185;
- add.s64 %rd310, %rd153, %rd185;
- mov.f32 %f1252, %f96;
- BB1_62:
- cvt.u64.u32 %rd292, %r204;
- cvt.u32.u64 %r60, %rd292;
- add.s32 %r204, %r60, 4;
- setp.lt.u32 %p83, %r204, %r41;
- @%p83 bra BB1_34;
- BB1_63:
- setp.eq.s64 %p84, %rd310, 0;
- mov.f32 %f1412, 0f40000000;
- mov.f32 %f1413, %f1412;
- mov.f32 %f1414, %f1412;
- @%p84 bra BB1_316;
- fma.rn.f32 %f99, %f1246, %f1252, 0f00000000;
- fma.rn.f32 %f100, %f1245, %f1252, 0f00000000;
- fma.rn.f32 %f101, %f1244, %f1252, 0f00000000;
- add.s64 %rd47, %rd309, 8;
- ld.global.f32 %f662, [%rd309+8];
- sub.f32 %f1273, %f99, %f662;
- ld.global.f32 %f663, [%rd309+12];
- sub.f32 %f1274, %f100, %f663;
- ld.global.f32 %f664, [%rd309+16];
- sub.f32 %f1275, %f101, %f664;
- mul.f32 %f665, %f1274, %f1274;
- fma.rn.f32 %f666, %f1273, %f1273, %f665;
- fma.rn.f32 %f105, %f1275, %f1275, %f666;
- setp.leu.f32 %p85, %f105, 0f00000000;
- @%p85 bra BB1_66;
- sqrt.rn.f32 %f667, %f105;
- rcp.rn.f32 %f668, %f667;
- mul.f32 %f1273, %f1273, %f668;
- mul.f32 %f1274, %f1274, %f668;
- mul.f32 %f1275, %f1275, %f668;
- BB1_66:
- mul.f32 %f669, %f1245, %f1274;
- fma.rn.f32 %f670, %f1246, %f1273, %f669;
- fma.rn.f32 %f671, %f1244, %f1275, %f670;
- mov.u16 %rs10, 0;
- setp.leu.f32 %p86, %f671, 0f00000000;
- @%p86 bra BB1_68;
- neg.f32 %f1273, %f1273;
- neg.f32 %f1274, %f1274;
- neg.f32 %f1275, %f1275;
- mov.u16 %rs10, 1;
- BB1_68:
- ld.global.f32 %f118, [%rd47+44];
- setp.gt.f32 %p87, %f118, 0f00000000;
- @%p87 bra BB1_82;
- ld.global.f32 %f672, [%rd47+48];
- setp.gt.f32 %p88, %f672, 0f00000000;
- @%p88 bra BB1_82;
- bra.uni BB1_70;
- BB1_82:
- mul.f32 %f715, %f1245, %f1274;
- fma.rn.f32 %f716, %f1246, %f1273, %f715;
- fma.rn.f32 %f147, %f1244, %f1275, %f716;
- add.f32 %f148, %f147, 0f3F800000;
- cvt.f64.f32 %fd1, %f148;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r14}, %fd1;
- }
- mov.f64 %fd54, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r15}, %fd54;
- }
- bfe.u32 %r64, %r15, 20, 11;
- add.s32 %r65, %r64, -1012;
- mov.u64 %rd190, 4613937818241073152;
- shl.b64 %rd51, %rd190, %r65;
- setp.ne.s64 %p97, %rd51, -9223372036854775808;
- setp.eq.s64 %p98, %rd51, -9223372036854775808;
- abs.f64 %fd2, %fd1;
- // Callseq Start 3
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b64 param0;
- st.param.f64 [param0+0], %fd2;
- .param .b64 retval0;
- call.uni (retval0),
- __internal_accurate_pow,
- (
- param0
- );
- ld.param.f64 %fd71, [retval0+0];
- //{
- }// Callseq End 3
- setp.gt.s32 %p99, %r14, -1;
- setp.lt.s32 %p100, %r14, 0;
- and.pred %p8, %p100, %p98;
- or.pred %p101, %p99, %p97;
- @%p101 bra BB1_84;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r66}, %fd71;
- }
- xor.b32 %r67, %r66, -2147483648;
- {
- .reg .b32 %temp;
- mov.b64 {%r68, %temp}, %fd71;
- }
- mov.b64 %fd71, {%r68, %r67};
- BB1_84:
- setp.eq.f32 %p102, %f148, 0f00000000;
- @%p102 bra BB1_87;
- bra.uni BB1_85;
- BB1_87:
- selp.b32 %r69, %r14, 0, %p98;
- mov.u32 %r70, 0;
- or.b32 %r71, %r69, 2146435072;
- setp.lt.s32 %p106, %r15, 0;
- selp.b32 %r72, %r71, %r69, %p106;
- mov.b64 %fd71, {%r70, %r72};
- bra.uni BB1_88;
- BB1_85:
- @%p99 bra BB1_88;
- mov.f64 %fd69, 0d4008000000000000;
- cvt.rzi.f64.f64 %fd56, %fd69;
- setp.neu.f64 %p104, %fd56, 0d4008000000000000;
- selp.f64 %fd71, 0dFFF8000000000000, %fd71, %p104;
- BB1_88:
- add.f64 %fd72, %fd1, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r73}, %fd72;
- }
- and.b32 %r74, %r73, 2146435072;
- setp.ne.s32 %p107, %r74, 2146435072;
- @%p107 bra BB1_89;
- setp.gtu.f64 %p108, %fd2, 0d7FF0000000000000;
- @%p108 bra BB1_98;
- and.b32 %r75, %r15, 2147483647;
- setp.ne.s32 %p109, %r75, 2146435072;
- @%p109 bra BB1_93;
- mov.f64 %fd68, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%r76, %temp}, %fd68;
- }
- setp.eq.s32 %p110, %r76, 0;
- @%p110 bra BB1_97;
- BB1_93:
- and.b32 %r77, %r14, 2147483647;
- setp.ne.s32 %p111, %r77, 2146435072;
- @%p111 bra BB1_94;
- {
- .reg .b32 %temp;
- mov.b64 {%r78, %temp}, %fd1;
- }
- setp.ne.s32 %p112, %r78, 0;
- mov.f64 %fd72, %fd71;
- @%p112 bra BB1_98;
- shr.s32 %r79, %r15, 31;
- and.b32 %r80, %r79, -2146435072;
- add.s32 %r81, %r80, 2146435072;
- or.b32 %r82, %r81, -2147483648;
- selp.b32 %r83, %r82, %r81, %p8;
- mov.u32 %r84, 0;
- mov.b64 %fd72, {%r84, %r83};
- bra.uni BB1_98;
- BB1_89:
- mov.f64 %fd72, %fd71;
- bra.uni BB1_98;
- BB1_70:
- mov.f32 %f1409, 0f00000000;
- mov.f32 %f1410, %f1409;
- mov.f32 %f1411, %f1409;
- @%p29 bra BB1_315;
- fma.rn.f32 %f119, %f1273, 0f38D1B717, %f99;
- fma.rn.f32 %f120, %f1274, 0f38D1B717, %f100;
- fma.rn.f32 %f121, %f1275, 0f38D1B717, %f101;
- mov.f32 %f1411, 0f00000000;
- mov.u32 %r206, 0;
- mov.f32 %f1410, %f1411;
- mov.f32 %f1409, %f1411;
- BB1_72:
- cvt.u64.u32 %rd48, %r206;
- mul.wide.u32 %rd186, %r206, 80;
- add.s64 %rd187, %rd1, %rd186;
- add.s64 %rd49, %rd187, 40;
- ld.global.f32 %f125, [%rd187+40];
- setp.leu.f32 %p90, %f125, 0f00000000;
- @%p90 bra BB1_81;
- ld.global.f32 %f679, [%rd49+-32];
- sub.f32 %f1284, %f679, %f99;
- ld.global.f32 %f680, [%rd49+-28];
- sub.f32 %f1283, %f680, %f100;
- ld.global.f32 %f681, [%rd49+-24];
- sub.f32 %f1282, %f681, %f101;
- mul.f32 %f682, %f1283, %f1283;
- fma.rn.f32 %f683, %f1284, %f1284, %f682;
- fma.rn.f32 %f129, %f1282, %f1282, %f683;
- setp.leu.f32 %p91, %f129, 0f00000000;
- @%p91 bra BB1_75;
- sqrt.rn.f32 %f684, %f129;
- rcp.rn.f32 %f685, %f684;
- mul.f32 %f1284, %f1284, %f685;
- mul.f32 %f1283, %f1283, %f685;
- mul.f32 %f1282, %f1282, %f685;
- BB1_75:
- mov.u32 %r207, 0;
- BB1_76:
- setp.eq.s32 %p92, %r206, %r207;
- @%p92 bra BB1_79;
- mul.wide.u32 %rd188, %r207, 80;
- add.s64 %rd189, %rd1, %rd188;
- add.s64 %rd50, %rd189, 8;
- ld.global.f32 %f686, [%rd189+8];
- sub.f32 %f136, %f686, %f119;
- ld.global.f32 %f687, [%rd189+12];
- sub.f32 %f137, %f687, %f120;
- ld.global.f32 %f688, [%rd189+16];
- sub.f32 %f138, %f688, %f121;
- mul.f32 %f689, %f1283, %f137;
- fma.rn.f32 %f690, %f1284, %f136, %f689;
- fma.rn.f32 %f139, %f1282, %f138, %f690;
- setp.lt.f32 %p93, %f139, 0f00000000;
- @%p93 bra BB1_79;
- mul.f32 %f692, %f137, %f137;
- fma.rn.f32 %f693, %f136, %f136, %f692;
- fma.rn.f32 %f694, %f138, %f138, %f693;
- mul.f32 %f695, %f139, %f139;
- sub.f32 %f696, %f694, %f695;
- ld.global.f32 %f697, [%rd50+16];
- mov.f32 %f1285, 0f00000000;
- setp.leu.f32 %p94, %f696, %f697;
- @%p94 bra BB1_80;
- BB1_79:
- add.s32 %r207, %r207, 1;
- setp.lt.u32 %p95, %r207, %r41;
- mov.f32 %f1285, 0f3F800000;
- @%p95 bra BB1_76;
- BB1_80:
- ld.global.f32 %f699, [%rd47+20];
- mul.f32 %f700, %f1285, %f699;
- ld.global.f32 %f701, [%rd47+24];
- mul.f32 %f702, %f1285, %f701;
- ld.global.f32 %f703, [%rd47+28];
- mul.f32 %f704, %f1285, %f703;
- mul.f32 %f705, %f1273, %f1284;
- fma.rn.f32 %f706, %f1274, %f1283, %f705;
- fma.rn.f32 %f707, %f1275, %f1282, %f706;
- mov.f32 %f708, 0f00000000;
- max.f32 %f709, %f708, %f707;
- mul.f32 %f710, %f700, %f709;
- mul.f32 %f711, %f702, %f709;
- mul.f32 %f712, %f704, %f709;
- ld.global.f32 %f713, [%rd49+4];
- ld.global.f32 %f714, [%rd49+8];
- fma.rn.f32 %f1409, %f710, %f125, %f1409;
- fma.rn.f32 %f1410, %f711, %f713, %f1410;
- fma.rn.f32 %f1411, %f712, %f714, %f1411;
- BB1_81:
- cvt.u32.u64 %r63, %rd48;
- add.s32 %r206, %r63, 1;
- setp.lt.u32 %p96, %r206, %r41;
- @%p96 bra BB1_72;
- bra.uni BB1_315;
- BB1_94:
- mov.f64 %fd72, %fd71;
- bra.uni BB1_98;
- BB1_97:
- setp.gt.f64 %p113, %fd2, 0d3FF0000000000000;
- selp.b32 %r85, 2146435072, 0, %p113;
- mov.u32 %r86, 0;
- xor.b32 %r87, %r85, 2146435072;
- setp.lt.s32 %p114, %r15, 0;
- selp.b32 %r88, %r87, %r85, %p114;
- setp.eq.f32 %p115, %f148, 0fBF800000;
- selp.b32 %r89, 1072693248, %r88, %p115;
- mov.b64 %fd72, {%r86, %r89};
- BB1_98:
- cvt.rn.f32.f64 %f717, %fd72;
- fma.rn.f32 %f718, %f717, 0f3F666666, 0f3DCCCCCD;
- setp.eq.f32 %p116, %f148, 0f3F800000;
- selp.f32 %f149, 0f3F800000, %f718, %p116;
- add.f32 %f719, %f1273, %f1273;
- mul.f32 %f720, %f719, %f147;
- add.f32 %f721, %f1274, %f1274;
- mul.f32 %f722, %f721, %f147;
- add.f32 %f723, %f1275, %f1275;
- mul.f32 %f724, %f723, %f147;
- sub.f32 %f1289, %f1246, %f720;
- sub.f32 %f1290, %f1245, %f722;
- sub.f32 %f1291, %f1244, %f724;
- mul.f32 %f725, %f1290, %f1290;
- fma.rn.f32 %f726, %f1289, %f1289, %f725;
- fma.rn.f32 %f153, %f1291, %f1291, %f726;
- setp.leu.f32 %p117, %f153, 0f00000000;
- @%p117 bra BB1_100;
- sqrt.rn.f32 %f727, %f153;
- rcp.rn.f32 %f728, %f727;
- mul.f32 %f1289, %f1289, %f728;
- mul.f32 %f1290, %f1290, %f728;
- mul.f32 %f1291, %f1291, %f728;
- BB1_100:
- fma.rn.f32 %f1239, %f1244, %f1252, 0f00000000;
- fma.rn.f32 %f1238, %f1245, %f1252, 0f00000000;
- fma.rn.f32 %f1237, %f1246, %f1252, 0f00000000;
- mul.f32 %f160, %f1273, 0f38D1B717;
- add.f32 %f161, %f1237, %f160;
- mul.f32 %f162, %f1274, 0f38D1B717;
- add.f32 %f163, %f1238, %f162;
- mul.f32 %f164, %f1275, 0f38D1B717;
- add.f32 %f165, %f1239, %f164;
- mov.f32 %f1316, 0f7F800000;
- mov.u64 %rd347, 0;
- mov.u64 %rd332, %rd347;
- @%p29 bra BB1_162;
- and.b32 %r93, %r41, 3;
- mov.f32 %f1316, 0f7F800000;
- mov.u64 %rd347, 0;
- mov.u32 %r210, 0;
- mov.f32 %f1303, 0f00000000;
- setp.eq.s32 %p119, %r93, 0;
- @%p119 bra BB1_102;
- setp.eq.s32 %p120, %r93, 1;
- @%p120 bra BB1_104;
- bra.uni BB1_105;
- BB1_104:
- mov.u64 %rd332, %rd347;
- bra.uni BB1_123;
- BB1_102:
- mov.u64 %rd332, %rd347;
- bra.uni BB1_131;
- BB1_105:
- setp.eq.s32 %p121, %r93, 2;
- mov.u64 %rd332, %rd347;
- @%p121 bra BB1_115;
- ld.global.f32 %f736, [%rd1+8];
- sub.f32 %f166, %f736, %f161;
- ld.global.f32 %f737, [%rd1+12];
- sub.f32 %f167, %f737, %f163;
- ld.global.f32 %f738, [%rd1+16];
- sub.f32 %f168, %f738, %f165;
- mul.f32 %f739, %f1290, %f167;
- fma.rn.f32 %f740, %f1289, %f166, %f739;
- fma.rn.f32 %f169, %f1291, %f168, %f740;
- setp.lt.f32 %p123, %f169, 0f00000000;
- mov.pred %p312, -1;
- mov.f32 %f1292, 0f7F800000;
- @%p123 bra BB1_107;
- bra.uni BB1_108;
- BB1_107:
- mov.f32 %f1293, %f1292;
- bra.uni BB1_110;
- BB1_108:
- mov.f32 %f1292, 0f7F800000;
- mul.f32 %f743, %f167, %f167;
- fma.rn.f32 %f744, %f166, %f166, %f743;
- fma.rn.f32 %f745, %f168, %f168, %f744;
- mul.f32 %f746, %f169, %f169;
- sub.f32 %f170, %f745, %f746;
- ld.global.f32 %f171, [%rd1+24];
- setp.gt.f32 %p125, %f170, %f171;
- mov.f32 %f1293, %f1292;
- @%p125 bra BB1_110;
- sub.f32 %f747, %f171, %f170;
- sqrt.rn.f32 %f748, %f747;
- sub.f32 %f1293, %f169, %f748;
- add.f32 %f1292, %f169, %f748;
- mov.pred %p312, 0;
- BB1_110:
- mov.u64 %rd347, 0;
- mov.f32 %f1316, 0f7F800000;
- mov.u32 %r210, 1;
- @%p312 bra BB1_111;
- bra.uni BB1_112;
- BB1_111:
- mov.u64 %rd332, %rd347;
- bra.uni BB1_115;
- BB1_112:
- mov.u64 %rd347, 0;
- mov.f32 %f1242, 0f7F800000;
- setp.lt.f32 %p127, %f1293, 0f00000000;
- selp.f32 %f1316, %f1292, %f1293, %p127;
- setp.geu.f32 %p128, %f1316, 0f7F800000;
- @%p128 bra BB1_113;
- mov.u64 %rd347, %rd1;
- mov.u64 %rd332, %rd153;
- bra.uni BB1_115;
- BB1_113:
- mov.u64 %rd332, %rd347;
- mov.f32 %f1316, %f1242;
- BB1_115:
- mov.f32 %f1295, 0f7F800000;
- mul.wide.u32 %rd203, %r210, 80;
- add.s64 %rd204, %rd1, %rd203;
- ld.global.f32 %f753, [%rd204+8];
- sub.f32 %f178, %f753, %f161;
- ld.global.f32 %f754, [%rd204+12];
- sub.f32 %f179, %f754, %f163;
- ld.global.f32 %f755, [%rd204+16];
- sub.f32 %f180, %f755, %f165;
- mul.f32 %f756, %f1290, %f179;
- fma.rn.f32 %f757, %f1289, %f178, %f756;
- fma.rn.f32 %f181, %f1291, %f180, %f757;
- setp.lt.f32 %p130, %f181, 0f00000000;
- mov.pred %p313, -1;
- @%p130 bra BB1_116;
- bra.uni BB1_117;
- BB1_116:
- mov.f32 %f1296, %f1295;
- bra.uni BB1_119;
- BB1_117:
- mul.wide.u32 %rd278, %r210, 80;
- add.s64 %rd277, %rd1, %rd278;
- add.s64 %rd276, %rd277, 8;
- mov.f32 %f1295, 0f7F800000;
- mul.f32 %f760, %f179, %f179;
- fma.rn.f32 %f761, %f178, %f178, %f760;
- fma.rn.f32 %f762, %f180, %f180, %f761;
- mul.f32 %f763, %f181, %f181;
- sub.f32 %f182, %f762, %f763;
- ld.global.f32 %f183, [%rd276+16];
- setp.gt.f32 %p132, %f182, %f183;
- mov.f32 %f1296, %f1295;
- @%p132 bra BB1_119;
- sub.f32 %f764, %f183, %f182;
- sqrt.rn.f32 %f765, %f764;
- sub.f32 %f1296, %f181, %f765;
- add.f32 %f1295, %f181, %f765;
- mov.pred %p313, 0;
- BB1_119:
- @%p313 bra BB1_122;
- setp.lt.f32 %p134, %f1296, 0f00000000;
- selp.f32 %f188, %f1295, %f1296, %p134;
- setp.geu.f32 %p135, %f188, %f1316;
- @%p135 bra BB1_122;
- cvt.u64.u32 %rd279, %r210;
- mul.lo.s64 %rd205, %rd279, 80;
- add.s64 %rd347, %rd1, %rd205;
- add.s64 %rd332, %rd153, %rd205;
- mov.f32 %f1316, %f188;
- BB1_122:
- cvt.u64.u32 %rd280, %r210;
- cvt.u32.u64 %r97, %rd280;
- add.s32 %r210, %r97, 1;
- BB1_123:
- mov.f32 %f1299, 0f7F800000;
- mul.wide.u32 %rd206, %r210, 80;
- add.s64 %rd207, %rd1, %rd206;
- ld.global.f32 %f768, [%rd207+8];
- sub.f32 %f191, %f768, %f161;
- ld.global.f32 %f769, [%rd207+12];
- sub.f32 %f192, %f769, %f163;
- ld.global.f32 %f770, [%rd207+16];
- sub.f32 %f193, %f770, %f165;
- mul.f32 %f771, %f1290, %f192;
- fma.rn.f32 %f772, %f1289, %f191, %f771;
- fma.rn.f32 %f194, %f1291, %f193, %f772;
- setp.lt.f32 %p137, %f194, 0f00000000;
- mov.pred %p314, -1;
- @%p137 bra BB1_124;
- bra.uni BB1_125;
- BB1_124:
- mov.f32 %f1300, %f1299;
- bra.uni BB1_127;
- BB1_125:
- mul.wide.u32 %rd283, %r210, 80;
- add.s64 %rd282, %rd1, %rd283;
- add.s64 %rd281, %rd282, 8;
- mov.f32 %f1299, 0f7F800000;
- mul.f32 %f775, %f192, %f192;
- fma.rn.f32 %f776, %f191, %f191, %f775;
- fma.rn.f32 %f777, %f193, %f193, %f776;
- mul.f32 %f778, %f194, %f194;
- sub.f32 %f195, %f777, %f778;
- ld.global.f32 %f196, [%rd281+16];
- setp.gt.f32 %p139, %f195, %f196;
- mov.f32 %f1300, %f1299;
- @%p139 bra BB1_127;
- sub.f32 %f779, %f196, %f195;
- sqrt.rn.f32 %f780, %f779;
- sub.f32 %f1300, %f194, %f780;
- add.f32 %f1299, %f194, %f780;
- mov.pred %p314, 0;
- BB1_127:
- @%p314 bra BB1_130;
- setp.lt.f32 %p141, %f1300, 0f00000000;
- selp.f32 %f201, %f1299, %f1300, %p141;
- setp.geu.f32 %p142, %f201, %f1316;
- @%p142 bra BB1_130;
- cvt.u64.u32 %rd284, %r210;
- mul.lo.s64 %rd208, %rd284, 80;
- add.s64 %rd347, %rd1, %rd208;
- add.s64 %rd332, %rd153, %rd208;
- mov.f32 %f1316, %f201;
- BB1_130:
- cvt.u64.u32 %rd285, %r210;
- cvt.u32.u64 %r98, %rd285;
- add.s32 %r210, %r98, 1;
- mov.f32 %f1303, %f1316;
- BB1_131:
- setp.lt.u32 %p143, %r41, 4;
- @%p143 bra BB1_132;
- bra.uni BB1_133;
- BB1_132:
- mov.f32 %f1316, %f1303;
- bra.uni BB1_162;
- BB1_133:
- cvt.u64.u32 %rd72, %r210;
- mul.wide.u32 %rd209, %r210, 80;
- add.s64 %rd210, %rd1, %rd209;
- add.s64 %rd73, %rd210, 8;
- ld.global.f32 %f783, [%rd210+8];
- sub.f32 %f206, %f783, %f161;
- ld.global.f32 %f784, [%rd210+12];
- sub.f32 %f207, %f784, %f163;
- ld.global.f32 %f785, [%rd210+16];
- sub.f32 %f208, %f785, %f165;
- mul.f32 %f786, %f1290, %f207;
- fma.rn.f32 %f787, %f1289, %f206, %f786;
- fma.rn.f32 %f209, %f1291, %f208, %f787;
- setp.lt.f32 %p145, %f209, 0f00000000;
- mov.pred %p315, -1;
- mov.f32 %f1305, 0f7F800000;
- @%p145 bra BB1_134;
- bra.uni BB1_135;
- BB1_134:
- mov.f32 %f1306, %f1305;
- bra.uni BB1_137;
- BB1_135:
- mul.f32 %f790, %f207, %f207;
- fma.rn.f32 %f791, %f206, %f206, %f790;
- fma.rn.f32 %f792, %f208, %f208, %f791;
- mul.f32 %f793, %f209, %f209;
- sub.f32 %f210, %f792, %f793;
- ld.global.f32 %f211, [%rd73+16];
- setp.gt.f32 %p147, %f210, %f211;
- mov.f32 %f1306, %f1305;
- @%p147 bra BB1_137;
- sub.f32 %f794, %f211, %f210;
- sqrt.rn.f32 %f795, %f794;
- sub.f32 %f1306, %f209, %f795;
- add.f32 %f1305, %f209, %f795;
- mov.pred %p315, 0;
- BB1_137:
- @%p315 bra BB1_140;
- setp.lt.f32 %p149, %f1306, 0f00000000;
- selp.f32 %f216, %f1305, %f1306, %p149;
- setp.geu.f32 %p150, %f216, %f1316;
- @%p150 bra BB1_140;
- mul.lo.s64 %rd211, %rd72, 80;
- add.s64 %rd347, %rd1, %rd211;
- add.s64 %rd332, %rd153, %rd211;
- mov.f32 %f1316, %f216;
- BB1_140:
- add.s32 %r99, %r210, 1;
- cvt.u64.u32 %rd78, %r99;
- mul.wide.u32 %rd212, %r99, 80;
- add.s64 %rd213, %rd1, %rd212;
- add.s64 %rd79, %rd213, 8;
- ld.global.f32 %f798, [%rd213+8];
- sub.f32 %f218, %f798, %f161;
- ld.global.f32 %f799, [%rd213+12];
- sub.f32 %f219, %f799, %f163;
- ld.global.f32 %f800, [%rd213+16];
- sub.f32 %f220, %f800, %f165;
- mul.f32 %f801, %f1290, %f219;
- fma.rn.f32 %f802, %f1289, %f218, %f801;
- fma.rn.f32 %f221, %f1291, %f220, %f802;
- setp.lt.f32 %p152, %f221, 0f00000000;
- mov.pred %p316, -1;
- mov.f32 %f1308, 0f7F800000;
- @%p152 bra BB1_141;
- bra.uni BB1_142;
- BB1_141:
- mov.f32 %f1309, %f1308;
- bra.uni BB1_144;
- BB1_142:
- mul.f32 %f805, %f219, %f219;
- fma.rn.f32 %f806, %f218, %f218, %f805;
- fma.rn.f32 %f807, %f220, %f220, %f806;
- mul.f32 %f808, %f221, %f221;
- sub.f32 %f222, %f807, %f808;
- ld.global.f32 %f223, [%rd79+16];
- setp.gt.f32 %p154, %f222, %f223;
- mov.f32 %f1309, %f1308;
- @%p154 bra BB1_144;
- sub.f32 %f809, %f223, %f222;
- sqrt.rn.f32 %f810, %f809;
- sub.f32 %f1309, %f221, %f810;
- add.f32 %f1308, %f221, %f810;
- mov.pred %p316, 0;
- BB1_144:
- @%p316 bra BB1_147;
- setp.lt.f32 %p156, %f1309, 0f00000000;
- selp.f32 %f228, %f1308, %f1309, %p156;
- setp.geu.f32 %p157, %f228, %f1316;
- @%p157 bra BB1_147;
- mul.lo.s64 %rd214, %rd78, 80;
- add.s64 %rd347, %rd1, %rd214;
- add.s64 %rd332, %rd153, %rd214;
- mov.f32 %f1316, %f228;
- BB1_147:
- add.s32 %r100, %r210, 2;
- cvt.u64.u32 %rd84, %r100;
- mul.wide.u32 %rd215, %r100, 80;
- add.s64 %rd216, %rd1, %rd215;
- add.s64 %rd85, %rd216, 8;
- ld.global.f32 %f813, [%rd216+8];
- sub.f32 %f230, %f813, %f161;
- ld.global.f32 %f814, [%rd216+12];
- sub.f32 %f231, %f814, %f163;
- ld.global.f32 %f815, [%rd216+16];
- sub.f32 %f232, %f815, %f165;
- mul.f32 %f816, %f1290, %f231;
- fma.rn.f32 %f817, %f1289, %f230, %f816;
- fma.rn.f32 %f233, %f1291, %f232, %f817;
- setp.lt.f32 %p159, %f233, 0f00000000;
- mov.pred %p317, -1;
- mov.f32 %f1311, 0f7F800000;
- @%p159 bra BB1_148;
- bra.uni BB1_149;
- BB1_148:
- mov.f32 %f1312, %f1311;
- bra.uni BB1_151;
- BB1_149:
- mul.f32 %f820, %f231, %f231;
- fma.rn.f32 %f821, %f230, %f230, %f820;
- fma.rn.f32 %f822, %f232, %f232, %f821;
- mul.f32 %f823, %f233, %f233;
- sub.f32 %f234, %f822, %f823;
- ld.global.f32 %f235, [%rd85+16];
- setp.gt.f32 %p161, %f234, %f235;
- mov.f32 %f1312, %f1311;
- @%p161 bra BB1_151;
- sub.f32 %f824, %f235, %f234;
- sqrt.rn.f32 %f825, %f824;
- sub.f32 %f1312, %f233, %f825;
- add.f32 %f1311, %f233, %f825;
- mov.pred %p317, 0;
- BB1_151:
- @%p317 bra BB1_154;
- setp.lt.f32 %p163, %f1312, 0f00000000;
- selp.f32 %f240, %f1311, %f1312, %p163;
- setp.geu.f32 %p164, %f240, %f1316;
- @%p164 bra BB1_154;
- mul.lo.s64 %rd217, %rd84, 80;
- add.s64 %rd347, %rd1, %rd217;
- add.s64 %rd332, %rd153, %rd217;
- mov.f32 %f1316, %f240;
- BB1_154:
- add.s32 %r101, %r210, 3;
- cvt.u64.u32 %rd90, %r101;
- mul.wide.u32 %rd218, %r101, 80;
- add.s64 %rd219, %rd1, %rd218;
- add.s64 %rd91, %rd219, 8;
- ld.global.f32 %f828, [%rd219+8];
- sub.f32 %f242, %f828, %f161;
- ld.global.f32 %f829, [%rd219+12];
- sub.f32 %f243, %f829, %f163;
- ld.global.f32 %f830, [%rd219+16];
- sub.f32 %f244, %f830, %f165;
- mul.f32 %f831, %f1290, %f243;
- fma.rn.f32 %f832, %f1289, %f242, %f831;
- fma.rn.f32 %f245, %f1291, %f244, %f832;
- setp.lt.f32 %p166, %f245, 0f00000000;
- mov.pred %p318, -1;
- mov.f32 %f1314, 0f7F800000;
- @%p166 bra BB1_155;
- bra.uni BB1_156;
- BB1_155:
- mov.f32 %f1315, %f1314;
- bra.uni BB1_158;
- BB1_156:
- mul.f32 %f835, %f243, %f243;
- fma.rn.f32 %f836, %f242, %f242, %f835;
- fma.rn.f32 %f837, %f244, %f244, %f836;
- mul.f32 %f838, %f245, %f245;
- sub.f32 %f246, %f837, %f838;
- ld.global.f32 %f247, [%rd91+16];
- setp.gt.f32 %p168, %f246, %f247;
- mov.f32 %f1315, %f1314;
- @%p168 bra BB1_158;
- sub.f32 %f839, %f247, %f246;
- sqrt.rn.f32 %f840, %f839;
- sub.f32 %f1315, %f245, %f840;
- add.f32 %f1314, %f245, %f840;
- mov.pred %p318, 0;
- BB1_158:
- @%p318 bra BB1_161;
- setp.lt.f32 %p170, %f1315, 0f00000000;
- selp.f32 %f252, %f1314, %f1315, %p170;
- setp.geu.f32 %p171, %f252, %f1316;
- @%p171 bra BB1_161;
- mul.lo.s64 %rd220, %rd90, 80;
- add.s64 %rd347, %rd1, %rd220;
- add.s64 %rd332, %rd153, %rd220;
- mov.f32 %f1316, %f252;
- BB1_161:
- cvt.u32.u64 %r102, %rd72;
- add.s32 %r210, %r102, 4;
- setp.lt.u32 %p172, %r210, %r41;
- @%p172 bra BB1_133;
- BB1_162:
- setp.eq.s64 %p173, %rd332, 0;
- mov.f32 %f1346, 0f40000000;
- mov.f32 %f1347, %f1346;
- mov.f32 %f1348, %f1346;
- @%p173 bra BB1_205;
- fma.rn.f32 %f255, %f1289, %f1316, %f161;
- fma.rn.f32 %f256, %f1290, %f1316, %f163;
- fma.rn.f32 %f257, %f1291, %f1316, %f165;
- add.s64 %rd98, %rd347, 8;
- ld.global.f32 %f844, [%rd347+8];
- sub.f32 %f1318, %f255, %f844;
- ld.global.f32 %f845, [%rd347+12];
- sub.f32 %f1319, %f256, %f845;
- ld.global.f32 %f846, [%rd347+16];
- sub.f32 %f1320, %f257, %f846;
- mul.f32 %f847, %f1319, %f1319;
- fma.rn.f32 %f848, %f1318, %f1318, %f847;
- fma.rn.f32 %f261, %f1320, %f1320, %f848;
- setp.leu.f32 %p174, %f261, 0f00000000;
- @%p174 bra BB1_165;
- sqrt.rn.f32 %f849, %f261;
- rcp.rn.f32 %f850, %f849;
- mul.f32 %f1318, %f1318, %f850;
- mul.f32 %f1319, %f1319, %f850;
- mul.f32 %f1320, %f1320, %f850;
- BB1_165:
- mul.f32 %f851, %f1290, %f1319;
- fma.rn.f32 %f852, %f1289, %f1318, %f851;
- fma.rn.f32 %f853, %f1291, %f1320, %f852;
- mov.u16 %rs11, 0;
- setp.leu.f32 %p175, %f853, 0f00000000;
- @%p175 bra BB1_167;
- neg.f32 %f1318, %f1318;
- neg.f32 %f1319, %f1319;
- neg.f32 %f1320, %f1320;
- mov.u16 %rs11, 1;
- BB1_167:
- ld.global.f32 %f274, [%rd98+44];
- setp.gt.f32 %p176, %f274, 0f00000000;
- @%p176 bra BB1_181;
- ld.global.f32 %f854, [%rd98+48];
- setp.gt.f32 %p177, %f854, 0f00000000;
- @%p177 bra BB1_181;
- bra.uni BB1_169;
- BB1_181:
- mul.f32 %f897, %f1290, %f1319;
- fma.rn.f32 %f898, %f1289, %f1318, %f897;
- fma.rn.f32 %f303, %f1291, %f1320, %f898;
- add.f32 %f304, %f303, 0f3F800000;
- cvt.f64.f32 %fd13, %f304;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r27}, %fd13;
- }
- abs.f64 %fd14, %fd13;
- // Callseq Start 4
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b64 param0;
- st.param.f64 [param0+0], %fd14;
- .param .b64 retval0;
- call.uni (retval0),
- __internal_accurate_pow,
- (
- param0
- );
- ld.param.f64 %fd74, [retval0+0];
- //{
- }// Callseq End 4
- setp.gt.s32 %p188, %r27, -1;
- setp.lt.s32 %p189, %r27, 0;
- and.pred %p16, %p189, %p98;
- or.pred %p190, %p188, %p97;
- @%p190 bra BB1_183;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r106}, %fd74;
- }
- xor.b32 %r107, %r106, -2147483648;
- {
- .reg .b32 %temp;
- mov.b64 {%r108, %temp}, %fd74;
- }
- mov.b64 %fd74, {%r108, %r107};
- BB1_183:
- setp.eq.f32 %p191, %f304, 0f00000000;
- @%p191 bra BB1_186;
- bra.uni BB1_184;
- BB1_186:
- selp.b32 %r109, %r27, 0, %p98;
- mov.u32 %r110, 0;
- or.b32 %r111, %r109, 2146435072;
- setp.lt.s32 %p195, %r15, 0;
- selp.b32 %r112, %r111, %r109, %p195;
- mov.b64 %fd74, {%r110, %r112};
- bra.uni BB1_187;
- BB1_184:
- @%p188 bra BB1_187;
- mov.f64 %fd65, 0d4008000000000000;
- cvt.rzi.f64.f64 %fd59, %fd65;
- setp.neu.f64 %p193, %fd59, 0d4008000000000000;
- selp.f64 %fd74, 0dFFF8000000000000, %fd74, %p193;
- BB1_187:
- add.f64 %fd75, %fd13, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r113}, %fd75;
- }
- and.b32 %r114, %r113, 2146435072;
- setp.ne.s32 %p196, %r114, 2146435072;
- @%p196 bra BB1_188;
- setp.gtu.f64 %p197, %fd14, 0d7FF0000000000000;
- @%p197 bra BB1_197;
- and.b32 %r115, %r15, 2147483647;
- setp.ne.s32 %p198, %r115, 2146435072;
- @%p198 bra BB1_192;
- mov.f64 %fd64, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%r116, %temp}, %fd64;
- }
- setp.eq.s32 %p199, %r116, 0;
- @%p199 bra BB1_196;
- BB1_192:
- and.b32 %r117, %r27, 2147483647;
- setp.ne.s32 %p200, %r117, 2146435072;
- @%p200 bra BB1_193;
- {
- .reg .b32 %temp;
- mov.b64 {%r118, %temp}, %fd13;
- }
- setp.ne.s32 %p201, %r118, 0;
- mov.f64 %fd75, %fd74;
- @%p201 bra BB1_197;
- shr.s32 %r119, %r15, 31;
- and.b32 %r120, %r119, -2146435072;
- add.s32 %r121, %r120, 2146435072;
- or.b32 %r122, %r121, -2147483648;
- selp.b32 %r123, %r122, %r121, %p16;
- mov.u32 %r124, 0;
- mov.b64 %fd75, {%r124, %r123};
- bra.uni BB1_197;
- BB1_188:
- mov.f64 %fd75, %fd74;
- bra.uni BB1_197;
- BB1_169:
- mov.f32 %f1343, 0f00000000;
- mov.f32 %f1344, %f1343;
- mov.f32 %f1345, %f1343;
- @%p29 bra BB1_204;
- fma.rn.f32 %f275, %f1318, 0f38D1B717, %f255;
- fma.rn.f32 %f276, %f1319, 0f38D1B717, %f256;
- fma.rn.f32 %f277, %f1320, 0f38D1B717, %f257;
- mov.f32 %f1345, 0f00000000;
- mov.u32 %r212, 0;
- mov.f32 %f1344, %f1345;
- mov.f32 %f1343, %f1345;
- BB1_171:
- cvt.u64.u32 %rd99, %r212;
- mul.wide.u32 %rd221, %r212, 80;
- add.s64 %rd222, %rd1, %rd221;
- add.s64 %rd100, %rd222, 40;
- ld.global.f32 %f281, [%rd222+40];
- setp.leu.f32 %p179, %f281, 0f00000000;
- @%p179 bra BB1_180;
- ld.global.f32 %f861, [%rd100+-32];
- sub.f32 %f1329, %f861, %f255;
- ld.global.f32 %f862, [%rd100+-28];
- sub.f32 %f1328, %f862, %f256;
- ld.global.f32 %f863, [%rd100+-24];
- sub.f32 %f1327, %f863, %f257;
- mul.f32 %f864, %f1328, %f1328;
- fma.rn.f32 %f865, %f1329, %f1329, %f864;
- fma.rn.f32 %f285, %f1327, %f1327, %f865;
- setp.leu.f32 %p180, %f285, 0f00000000;
- @%p180 bra BB1_174;
- sqrt.rn.f32 %f866, %f285;
- rcp.rn.f32 %f867, %f866;
- mul.f32 %f1329, %f1329, %f867;
- mul.f32 %f1328, %f1328, %f867;
- mul.f32 %f1327, %f1327, %f867;
- BB1_174:
- mov.u32 %r213, 0;
- BB1_175:
- cvt.u32.u64 %r105, %rd99;
- setp.eq.s32 %p181, %r105, %r213;
- @%p181 bra BB1_178;
- mul.wide.u32 %rd223, %r213, 80;
- add.s64 %rd224, %rd1, %rd223;
- add.s64 %rd101, %rd224, 8;
- ld.global.f32 %f868, [%rd224+8];
- sub.f32 %f292, %f868, %f275;
- ld.global.f32 %f869, [%rd224+12];
- sub.f32 %f293, %f869, %f276;
- ld.global.f32 %f870, [%rd224+16];
- sub.f32 %f294, %f870, %f277;
- mul.f32 %f871, %f1328, %f293;
- fma.rn.f32 %f872, %f1329, %f292, %f871;
- fma.rn.f32 %f295, %f1327, %f294, %f872;
- setp.lt.f32 %p182, %f295, 0f00000000;
- @%p182 bra BB1_178;
- mul.f32 %f874, %f293, %f293;
- fma.rn.f32 %f875, %f292, %f292, %f874;
- fma.rn.f32 %f876, %f294, %f294, %f875;
- mul.f32 %f877, %f295, %f295;
- sub.f32 %f878, %f876, %f877;
- ld.global.f32 %f879, [%rd101+16];
- mov.f32 %f1330, 0f00000000;
- setp.leu.f32 %p183, %f878, %f879;
- @%p183 bra BB1_179;
- BB1_178:
- add.s32 %r213, %r213, 1;
- setp.lt.u32 %p184, %r213, %r41;
- mov.f32 %f1330, 0f3F800000;
- @%p184 bra BB1_175;
- BB1_179:
- ld.global.f32 %f881, [%rd98+20];
- mul.f32 %f882, %f1330, %f881;
- ld.global.f32 %f883, [%rd98+24];
- mul.f32 %f884, %f1330, %f883;
- ld.global.f32 %f885, [%rd98+28];
- mul.f32 %f886, %f1330, %f885;
- mul.f32 %f887, %f1318, %f1329;
- fma.rn.f32 %f888, %f1319, %f1328, %f887;
- fma.rn.f32 %f889, %f1320, %f1327, %f888;
- mov.f32 %f890, 0f00000000;
- max.f32 %f891, %f890, %f889;
- mul.f32 %f892, %f882, %f891;
- mul.f32 %f893, %f884, %f891;
- mul.f32 %f894, %f886, %f891;
- ld.global.f32 %f895, [%rd100+4];
- ld.global.f32 %f896, [%rd100+8];
- fma.rn.f32 %f1343, %f281, %f892, %f1343;
- fma.rn.f32 %f1344, %f893, %f895, %f1344;
- fma.rn.f32 %f1345, %f894, %f896, %f1345;
- BB1_180:
- add.s32 %r212, %r212, 1;
- setp.lt.u32 %p185, %r212, %r41;
- @%p185 bra BB1_171;
- bra.uni BB1_204;
- BB1_193:
- mov.f64 %fd75, %fd74;
- bra.uni BB1_197;
- BB1_196:
- setp.gt.f64 %p202, %fd14, 0d3FF0000000000000;
- selp.b32 %r125, 2146435072, 0, %p202;
- mov.u32 %r126, 0;
- xor.b32 %r127, %r125, 2146435072;
- setp.lt.s32 %p203, %r15, 0;
- selp.b32 %r128, %r127, %r125, %p203;
- setp.eq.f32 %p204, %f304, 0fBF800000;
- selp.b32 %r129, 1072693248, %r128, %p204;
- mov.b64 %fd75, {%r126, %r129};
- BB1_197:
- cvt.rn.f32.f64 %f899, %fd75;
- fma.rn.f32 %f900, %f899, 0f3F666666, 0f3DCCCCCD;
- setp.eq.f32 %p205, %f304, 0f3F800000;
- selp.f32 %f305, 0f3F800000, %f900, %p205;
- add.f32 %f901, %f1318, %f1318;
- mul.f32 %f902, %f901, %f303;
- add.f32 %f903, %f1319, %f1319;
- mul.f32 %f904, %f903, %f303;
- add.f32 %f905, %f1320, %f1320;
- mul.f32 %f906, %f905, %f303;
- sub.f32 %f1334, %f1289, %f902;
- sub.f32 %f1335, %f1290, %f904;
- sub.f32 %f1336, %f1291, %f906;
- mul.f32 %f907, %f1335, %f1335;
- fma.rn.f32 %f908, %f1334, %f1334, %f907;
- fma.rn.f32 %f309, %f1336, %f1336, %f908;
- setp.leu.f32 %p206, %f309, 0f00000000;
- @%p206 bra BB1_199;
- sqrt.rn.f32 %f909, %f309;
- rcp.rn.f32 %f910, %f909;
- mul.f32 %f1334, %f1334, %f910;
- mul.f32 %f1335, %f1335, %f910;
- mul.f32 %f1336, %f1336, %f910;
- BB1_199:
- mul.f32 %f316, %f1318, 0f38D1B717;
- add.f32 %f914, %f255, %f316;
- mul.f32 %f317, %f1319, 0f38D1B717;
- add.f32 %f915, %f256, %f317;
- mul.f32 %f318, %f1320, 0f38D1B717;
- add.f32 %f916, %f257, %f318;
- mov.u32 %r130, 2;
- // Callseq Start 5
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b32 param0;
- st.param.f32 [param0+0], %f914;
- .param .b32 param1;
- st.param.f32 [param1+0], %f915;
- .param .b32 param2;
- st.param.f32 [param2+0], %f916;
- .param .b32 param3;
- st.param.f32 [param3+0], %f1334;
- .param .b32 param4;
- st.param.f32 [param4+0], %f1335;
- .param .b32 param5;
- st.param.f32 [param5+0], %f1336;
- .param .b64 param6;
- st.param.b64 [param6+0], %rd153;
- .param .b32 param7;
- st.param.b32 [param7+0], %r41;
- .param .b32 param8;
- st.param.b32 [param8+0], %r130;
- .param .align 4 .b8 retval0[12];
- call.uni (retval0),
- _Z5traceRK4Vec3IfES2_PK6SpherejRKi,
- (
- param0,
- param1,
- param2,
- param3,
- param4,
- param5,
- param6,
- param7,
- param8
- );
- ld.param.f32 %f319, [retval0+0];
- ld.param.f32 %f320, [retval0+4];
- ld.param.f32 %f321, [retval0+8];
- //{
- }// Callseq End 5
- mov.f32 %f1340, 0f00000000;
- setp.eq.f32 %p207, %f274, 0f00000000;
- mov.f32 %f1341, %f1340;
- mov.f32 %f1342, %f1340;
- @%p207 bra BB1_203;
- setp.eq.s16 %p208, %rs11, 0;
- selp.f32 %f917, 0f3F68BA2E, 0f3F8CCCCD, %p208;
- mul.f32 %f918, %f917, %f917;
- mul.f32 %f919, %f303, %f303;
- mov.f32 %f920, 0f3F800000;
- sub.f32 %f921, %f920, %f919;
- mul.f32 %f922, %f918, %f921;
- sub.f32 %f923, %f920, %f922;
- mul.f32 %f924, %f303, %f917;
- neg.f32 %f925, %f924;
- sqrt.rn.f32 %f926, %f923;
- sub.f32 %f927, %f925, %f926;
- mul.f32 %f928, %f1318, %f927;
- mul.f32 %f929, %f1319, %f927;
- mul.f32 %f930, %f1320, %f927;
- fma.rn.f32 %f1339, %f1289, %f917, %f928;
- fma.rn.f32 %f1338, %f1290, %f917, %f929;
- fma.rn.f32 %f1337, %f1291, %f917, %f930;
- mul.f32 %f931, %f1338, %f1338;
- fma.rn.f32 %f932, %f1339, %f1339, %f931;
- fma.rn.f32 %f325, %f1337, %f1337, %f932;
- setp.leu.f32 %p209, %f325, 0f00000000;
- @%p209 bra BB1_202;
- sqrt.rn.f32 %f933, %f325;
- rcp.rn.f32 %f934, %f933;
- mul.f32 %f1339, %f1339, %f934;
- mul.f32 %f1338, %f1338, %f934;
- mul.f32 %f1337, %f1337, %f934;
- BB1_202:
- sub.f32 %f935, %f257, %f318;
- sub.f32 %f936, %f256, %f317;
- sub.f32 %f937, %f255, %f316;
- // Callseq Start 6
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b32 param0;
- st.param.f32 [param0+0], %f937;
- .param .b32 param1;
- st.param.f32 [param1+0], %f936;
- .param .b32 param2;
- st.param.f32 [param2+0], %f935;
- .param .b32 param3;
- st.param.f32 [param3+0], %f1339;
- .param .b32 param4;
- st.param.f32 [param4+0], %f1338;
- .param .b32 param5;
- st.param.f32 [param5+0], %f1337;
- .param .b64 param6;
- st.param.b64 [param6+0], %rd153;
- .param .b32 param7;
- st.param.b32 [param7+0], %r41;
- .param .b32 param8;
- st.param.b32 [param8+0], %r130;
- .param .align 4 .b8 retval0[12];
- call.uni (retval0),
- _Z5traceRK4Vec3IfES2_PK6SpherejRKi,
- (
- param0,
- param1,
- param2,
- param3,
- param4,
- param5,
- param6,
- param7,
- param8
- );
- ld.param.f32 %f1340, [retval0+0];
- ld.param.f32 %f1341, [retval0+4];
- ld.param.f32 %f1342, [retval0+8];
- //{
- }// Callseq End 6
- BB1_203:
- mov.f32 %f938, 0f3F800000;
- sub.f32 %f939, %f938, %f305;
- mul.f32 %f940, %f939, %f1340;
- mul.f32 %f941, %f939, %f1341;
- mul.f32 %f942, %f939, %f1342;
- mul.f32 %f943, %f274, %f940;
- mul.f32 %f944, %f274, %f941;
- mul.f32 %f945, %f274, %f942;
- fma.rn.f32 %f946, %f305, %f319, %f943;
- fma.rn.f32 %f947, %f305, %f320, %f944;
- fma.rn.f32 %f948, %f305, %f321, %f945;
- ld.global.f32 %f949, [%rd98+20];
- mul.f32 %f1343, %f949, %f946;
- ld.global.f32 %f950, [%rd98+24];
- mul.f32 %f1344, %f947, %f950;
- ld.global.f32 %f951, [%rd98+28];
- mul.f32 %f1345, %f948, %f951;
- BB1_204:
- ld.global.f32 %f952, [%rd98+32];
- add.f32 %f1346, %f1343, %f952;
- ld.global.f32 %f953, [%rd98+36];
- add.f32 %f1347, %f1344, %f953;
- ld.global.f32 %f954, [%rd98+40];
- add.f32 %f1348, %f1345, %f954;
- BB1_205:
- mov.f32 %f1406, 0f00000000;
- setp.eq.f32 %p210, %f118, 0f00000000;
- mov.f32 %f1407, %f1406;
- mov.f32 %f1408, %f1406;
- @%p210 bra BB1_314;
- setp.eq.s16 %p211, %rs10, 0;
- selp.f32 %f958, 0f3F68BA2E, 0f3F8CCCCD, %p211;
- mul.f32 %f959, %f958, %f958;
- mul.f32 %f960, %f147, %f147;
- mov.f32 %f961, 0f3F800000;
- sub.f32 %f962, %f961, %f960;
- mul.f32 %f963, %f959, %f962;
- sub.f32 %f964, %f961, %f963;
- mul.f32 %f965, %f147, %f958;
- neg.f32 %f966, %f965;
- sqrt.rn.f32 %f967, %f964;
- sub.f32 %f968, %f966, %f967;
- mul.f32 %f969, %f1273, %f968;
- mul.f32 %f970, %f1274, %f968;
- mul.f32 %f971, %f1275, %f968;
- fma.rn.f32 %f1351, %f1246, %f958, %f969;
- fma.rn.f32 %f1350, %f1245, %f958, %f970;
- fma.rn.f32 %f1349, %f1244, %f958, %f971;
- mul.f32 %f972, %f1350, %f1350;
- fma.rn.f32 %f973, %f1351, %f1351, %f972;
- fma.rn.f32 %f353, %f1349, %f1349, %f973;
- setp.leu.f32 %p212, %f353, 0f00000000;
- @%p212 bra BB1_208;
- sqrt.rn.f32 %f974, %f353;
- rcp.rn.f32 %f975, %f974;
- mul.f32 %f1351, %f1351, %f975;
- mul.f32 %f1350, %f1350, %f975;
- mul.f32 %f1349, %f1349, %f975;
- BB1_208:
- fma.rn.f32 %f1234, %f1244, %f1252, 0f00000000;
- fma.rn.f32 %f1233, %f1245, %f1252, 0f00000000;
- fma.rn.f32 %f1232, %f1246, %f1252, 0f00000000;
- mul.f32 %f1231, %f1275, 0f38D1B717;
- mul.f32 %f1230, %f1274, 0f38D1B717;
- mul.f32 %f1229, %f1273, 0f38D1B717;
- sub.f32 %f360, %f1232, %f1229;
- sub.f32 %f361, %f1233, %f1230;
- sub.f32 %f362, %f1234, %f1231;
- mov.f32 %f1357, 0f7F800000;
- mov.u64 %rd353, 0;
- mov.u64 %rd354, %rd353;
- @%p29 bra BB1_270;
- and.b32 %r135, %r41, 3;
- mov.f32 %f1359, 0f7F800000;
- mov.u64 %rd353, 0;
- mov.u32 %r216, 0;
- mov.f32 %f1363, 0f00000000;
- setp.eq.s32 %p214, %r135, 0;
- @%p214 bra BB1_210;
- setp.eq.s32 %p215, %r135, 1;
- @%p215 bra BB1_212;
- bra.uni BB1_213;
- BB1_212:
- mov.u64 %rd354, %rd353;
- mov.f32 %f1357, %f1359;
- bra.uni BB1_231;
- BB1_210:
- mov.u64 %rd354, %rd353;
- mov.f32 %f1357, %f1359;
- bra.uni BB1_239;
- BB1_213:
- setp.eq.s32 %p216, %r135, 2;
- @%p216 bra BB1_214;
- bra.uni BB1_215;
- BB1_214:
- mov.u64 %rd354, %rd353;
- mov.f32 %f1357, %f1359;
- bra.uni BB1_223;
- BB1_215:
- ld.global.f32 %f983, [%rd1+8];
- sub.f32 %f363, %f983, %f360;
- ld.global.f32 %f984, [%rd1+12];
- sub.f32 %f364, %f984, %f361;
- ld.global.f32 %f985, [%rd1+16];
- sub.f32 %f365, %f985, %f362;
- mul.f32 %f986, %f1350, %f364;
- fma.rn.f32 %f987, %f1351, %f363, %f986;
- fma.rn.f32 %f366, %f1349, %f365, %f987;
- setp.lt.f32 %p218, %f366, 0f00000000;
- mov.pred %p319, -1;
- mov.f32 %f982, 0f7F800000;
- @%p218 bra BB1_216;
- bra.uni BB1_217;
- BB1_216:
- mov.f32 %f1352, %f982;
- mov.f32 %f1353, %f982;
- bra.uni BB1_219;
- BB1_217:
- mul.f32 %f990, %f364, %f364;
- fma.rn.f32 %f991, %f363, %f363, %f990;
- fma.rn.f32 %f992, %f365, %f365, %f991;
- mul.f32 %f993, %f366, %f366;
- sub.f32 %f367, %f992, %f993;
- ld.global.f32 %f368, [%rd1+24];
- setp.gt.f32 %p220, %f367, %f368;
- mov.f32 %f1352, %f982;
- mov.f32 %f1353, %f982;
- @%p220 bra BB1_219;
- sub.f32 %f994, %f368, %f367;
- sqrt.rn.f32 %f995, %f994;
- sub.f32 %f1353, %f366, %f995;
- add.f32 %f1352, %f366, %f995;
- mov.pred %p319, 0;
- BB1_219:
- mov.u32 %r216, 1;
- @%p319 bra BB1_220;
- setp.lt.f32 %p222, %f1353, 0f00000000;
- selp.f32 %f1357, %f1352, %f1353, %p222;
- setp.geu.f32 %p223, %f1357, 0f7F800000;
- @%p223 bra BB1_220;
- mov.u64 %rd353, %rd1;
- mov.u64 %rd354, %rd153;
- bra.uni BB1_223;
- BB1_220:
- mov.u64 %rd354, %rd353;
- mov.f32 %f1357, %f982;
- BB1_223:
- cvt.u64.u32 %rd104, %r216;
- mul.wide.u32 %rd237, %r216, 80;
- add.s64 %rd238, %rd1, %rd237;
- add.s64 %rd105, %rd238, 8;
- ld.global.f32 %f1000, [%rd238+8];
- sub.f32 %f375, %f1000, %f360;
- ld.global.f32 %f1001, [%rd238+12];
- sub.f32 %f376, %f1001, %f361;
- ld.global.f32 %f1002, [%rd238+16];
- sub.f32 %f377, %f1002, %f362;
- mul.f32 %f1003, %f1350, %f376;
- fma.rn.f32 %f1004, %f1351, %f375, %f1003;
- fma.rn.f32 %f378, %f1349, %f377, %f1004;
- setp.lt.f32 %p225, %f378, 0f00000000;
- mov.pred %p320, -1;
- @%p225 bra BB1_224;
- bra.uni BB1_225;
- BB1_224:
- mov.f32 %f1355, %f1359;
- mov.f32 %f1356, %f1359;
- bra.uni BB1_227;
- BB1_225:
- mul.f32 %f1007, %f376, %f376;
- fma.rn.f32 %f1008, %f375, %f375, %f1007;
- fma.rn.f32 %f1009, %f377, %f377, %f1008;
- mul.f32 %f1010, %f378, %f378;
- sub.f32 %f379, %f1009, %f1010;
- ld.global.f32 %f380, [%rd105+16];
- setp.gt.f32 %p227, %f379, %f380;
- mov.f32 %f1355, %f1359;
- mov.f32 %f1356, %f1359;
- @%p227 bra BB1_227;
- sub.f32 %f1011, %f380, %f379;
- sqrt.rn.f32 %f1012, %f1011;
- sub.f32 %f1356, %f378, %f1012;
- add.f32 %f1355, %f378, %f1012;
- mov.pred %p320, 0;
- BB1_227:
- @%p320 bra BB1_230;
- setp.lt.f32 %p229, %f1356, 0f00000000;
- selp.f32 %f385, %f1355, %f1356, %p229;
- setp.geu.f32 %p230, %f385, %f1357;
- @%p230 bra BB1_230;
- mul.lo.s64 %rd239, %rd104, 80;
- add.s64 %rd353, %rd1, %rd239;
- add.s64 %rd354, %rd153, %rd239;
- mov.f32 %f1357, %f385;
- BB1_230:
- cvt.u32.u64 %r139, %rd104;
- add.s32 %r216, %r139, 1;
- BB1_231:
- cvt.u64.u32 %rd112, %r216;
- mul.wide.u32 %rd240, %r216, 80;
- add.s64 %rd241, %rd1, %rd240;
- add.s64 %rd113, %rd241, 8;
- ld.global.f32 %f1015, [%rd241+8];
- sub.f32 %f388, %f1015, %f360;
- ld.global.f32 %f1016, [%rd241+12];
- sub.f32 %f389, %f1016, %f361;
- ld.global.f32 %f1017, [%rd241+16];
- sub.f32 %f390, %f1017, %f362;
- mul.f32 %f1018, %f1350, %f389;
- fma.rn.f32 %f1019, %f1351, %f388, %f1018;
- fma.rn.f32 %f391, %f1349, %f390, %f1019;
- setp.lt.f32 %p232, %f391, 0f00000000;
- mov.pred %p321, -1;
- @%p232 bra BB1_232;
- bra.uni BB1_233;
- BB1_232:
- mov.f32 %f1360, %f1359;
- bra.uni BB1_235;
- BB1_233:
- mul.f32 %f1022, %f389, %f389;
- fma.rn.f32 %f1023, %f388, %f388, %f1022;
- fma.rn.f32 %f1024, %f390, %f390, %f1023;
- mul.f32 %f1025, %f391, %f391;
- sub.f32 %f392, %f1024, %f1025;
- ld.global.f32 %f393, [%rd113+16];
- setp.gt.f32 %p234, %f392, %f393;
- mov.f32 %f1360, %f1359;
- @%p234 bra BB1_235;
- sub.f32 %f1026, %f393, %f392;
- sqrt.rn.f32 %f1027, %f1026;
- sub.f32 %f1360, %f391, %f1027;
- add.f32 %f1359, %f391, %f1027;
- mov.pred %p321, 0;
- BB1_235:
- @%p321 bra BB1_238;
- setp.lt.f32 %p236, %f1360, 0f00000000;
- selp.f32 %f398, %f1359, %f1360, %p236;
- setp.geu.f32 %p237, %f398, %f1357;
- @%p237 bra BB1_238;
- mul.lo.s64 %rd242, %rd112, 80;
- add.s64 %rd353, %rd1, %rd242;
- add.s64 %rd354, %rd153, %rd242;
- mov.f32 %f1357, %f398;
- BB1_238:
- cvt.u32.u64 %r140, %rd112;
- add.s32 %r216, %r140, 1;
- mov.f32 %f1363, %f1357;
- BB1_239:
- setp.lt.u32 %p238, %r41, 4;
- @%p238 bra BB1_240;
- bra.uni BB1_241;
- BB1_240:
- mov.f32 %f1357, %f1363;
- bra.uni BB1_270;
- BB1_241:
- cvt.u64.u32 %rd122, %r216;
- mul.wide.u32 %rd243, %r216, 80;
- add.s64 %rd244, %rd1, %rd243;
- add.s64 %rd123, %rd244, 8;
- ld.global.f32 %f1030, [%rd244+8];
- sub.f32 %f403, %f1030, %f360;
- ld.global.f32 %f1031, [%rd244+12];
- sub.f32 %f404, %f1031, %f361;
- ld.global.f32 %f1032, [%rd244+16];
- sub.f32 %f405, %f1032, %f362;
- mul.f32 %f1033, %f1350, %f404;
- fma.rn.f32 %f1034, %f1351, %f403, %f1033;
- fma.rn.f32 %f406, %f1349, %f405, %f1034;
- setp.lt.f32 %p240, %f406, 0f00000000;
- mov.pred %p322, -1;
- mov.f32 %f1365, 0f7F800000;
- @%p240 bra BB1_242;
- bra.uni BB1_243;
- BB1_242:
- mov.f32 %f1366, %f1365;
- bra.uni BB1_245;
- BB1_243:
- mul.f32 %f1037, %f404, %f404;
- fma.rn.f32 %f1038, %f403, %f403, %f1037;
- fma.rn.f32 %f1039, %f405, %f405, %f1038;
- mul.f32 %f1040, %f406, %f406;
- sub.f32 %f407, %f1039, %f1040;
- ld.global.f32 %f408, [%rd123+16];
- setp.gt.f32 %p242, %f407, %f408;
- mov.f32 %f1366, %f1365;
- @%p242 bra BB1_245;
- sub.f32 %f1041, %f408, %f407;
- sqrt.rn.f32 %f1042, %f1041;
- sub.f32 %f1366, %f406, %f1042;
- add.f32 %f1365, %f406, %f1042;
- mov.pred %p322, 0;
- BB1_245:
- @%p322 bra BB1_248;
- setp.lt.f32 %p244, %f1366, 0f00000000;
- selp.f32 %f413, %f1365, %f1366, %p244;
- setp.geu.f32 %p245, %f413, %f1357;
- @%p245 bra BB1_248;
- mul.lo.s64 %rd245, %rd122, 80;
- add.s64 %rd353, %rd1, %rd245;
- add.s64 %rd354, %rd153, %rd245;
- mov.f32 %f1357, %f413;
- BB1_248:
- add.s32 %r141, %r216, 1;
- cvt.u64.u32 %rd128, %r141;
- mul.wide.u32 %rd246, %r141, 80;
- add.s64 %rd247, %rd1, %rd246;
- add.s64 %rd129, %rd247, 8;
- ld.global.f32 %f1045, [%rd247+8];
- sub.f32 %f415, %f1045, %f360;
- ld.global.f32 %f1046, [%rd247+12];
- sub.f32 %f416, %f1046, %f361;
- ld.global.f32 %f1047, [%rd247+16];
- sub.f32 %f417, %f1047, %f362;
- mul.f32 %f1048, %f1350, %f416;
- fma.rn.f32 %f1049, %f1351, %f415, %f1048;
- fma.rn.f32 %f418, %f1349, %f417, %f1049;
- setp.lt.f32 %p247, %f418, 0f00000000;
- mov.pred %p323, -1;
- mov.f32 %f1368, 0f7F800000;
- @%p247 bra BB1_249;
- bra.uni BB1_250;
- BB1_249:
- mov.f32 %f1369, %f1368;
- bra.uni BB1_252;
- BB1_250:
- mul.f32 %f1052, %f416, %f416;
- fma.rn.f32 %f1053, %f415, %f415, %f1052;
- fma.rn.f32 %f1054, %f417, %f417, %f1053;
- mul.f32 %f1055, %f418, %f418;
- sub.f32 %f419, %f1054, %f1055;
- ld.global.f32 %f420, [%rd129+16];
- setp.gt.f32 %p249, %f419, %f420;
- mov.f32 %f1369, %f1368;
- @%p249 bra BB1_252;
- sub.f32 %f1056, %f420, %f419;
- sqrt.rn.f32 %f1057, %f1056;
- sub.f32 %f1369, %f418, %f1057;
- add.f32 %f1368, %f418, %f1057;
- mov.pred %p323, 0;
- BB1_252:
- @%p323 bra BB1_255;
- setp.lt.f32 %p251, %f1369, 0f00000000;
- selp.f32 %f425, %f1368, %f1369, %p251;
- setp.geu.f32 %p252, %f425, %f1357;
- @%p252 bra BB1_255;
- mul.lo.s64 %rd248, %rd128, 80;
- add.s64 %rd353, %rd1, %rd248;
- add.s64 %rd354, %rd153, %rd248;
- mov.f32 %f1357, %f425;
- BB1_255:
- add.s32 %r142, %r216, 2;
- cvt.u64.u32 %rd134, %r142;
- mul.wide.u32 %rd249, %r142, 80;
- add.s64 %rd250, %rd1, %rd249;
- add.s64 %rd135, %rd250, 8;
- ld.global.f32 %f1060, [%rd250+8];
- sub.f32 %f427, %f1060, %f360;
- ld.global.f32 %f1061, [%rd250+12];
- sub.f32 %f428, %f1061, %f361;
- ld.global.f32 %f1062, [%rd250+16];
- sub.f32 %f429, %f1062, %f362;
- mul.f32 %f1063, %f1350, %f428;
- fma.rn.f32 %f1064, %f1351, %f427, %f1063;
- fma.rn.f32 %f430, %f1349, %f429, %f1064;
- setp.lt.f32 %p254, %f430, 0f00000000;
- mov.pred %p324, -1;
- mov.f32 %f1371, 0f7F800000;
- @%p254 bra BB1_256;
- bra.uni BB1_257;
- BB1_256:
- mov.f32 %f1372, %f1371;
- bra.uni BB1_259;
- BB1_257:
- mul.f32 %f1067, %f428, %f428;
- fma.rn.f32 %f1068, %f427, %f427, %f1067;
- fma.rn.f32 %f1069, %f429, %f429, %f1068;
- mul.f32 %f1070, %f430, %f430;
- sub.f32 %f431, %f1069, %f1070;
- ld.global.f32 %f432, [%rd135+16];
- setp.gt.f32 %p256, %f431, %f432;
- mov.f32 %f1372, %f1371;
- @%p256 bra BB1_259;
- sub.f32 %f1071, %f432, %f431;
- sqrt.rn.f32 %f1072, %f1071;
- sub.f32 %f1372, %f430, %f1072;
- add.f32 %f1371, %f430, %f1072;
- mov.pred %p324, 0;
- BB1_259:
- @%p324 bra BB1_262;
- setp.lt.f32 %p258, %f1372, 0f00000000;
- selp.f32 %f437, %f1371, %f1372, %p258;
- setp.geu.f32 %p259, %f437, %f1357;
- @%p259 bra BB1_262;
- mul.lo.s64 %rd251, %rd134, 80;
- add.s64 %rd353, %rd1, %rd251;
- add.s64 %rd354, %rd153, %rd251;
- mov.f32 %f1357, %f437;
- BB1_262:
- add.s32 %r143, %r216, 3;
- cvt.u64.u32 %rd140, %r143;
- mul.wide.u32 %rd252, %r143, 80;
- add.s64 %rd253, %rd1, %rd252;
- add.s64 %rd141, %rd253, 8;
- ld.global.f32 %f1075, [%rd253+8];
- sub.f32 %f439, %f1075, %f360;
- ld.global.f32 %f1076, [%rd253+12];
- sub.f32 %f440, %f1076, %f361;
- ld.global.f32 %f1077, [%rd253+16];
- sub.f32 %f441, %f1077, %f362;
- mul.f32 %f1078, %f1350, %f440;
- fma.rn.f32 %f1079, %f1351, %f439, %f1078;
- fma.rn.f32 %f442, %f1349, %f441, %f1079;
- setp.lt.f32 %p261, %f442, 0f00000000;
- mov.pred %p325, -1;
- mov.f32 %f1374, 0f7F800000;
- @%p261 bra BB1_263;
- bra.uni BB1_264;
- BB1_263:
- mov.f32 %f1375, %f1374;
- bra.uni BB1_266;
- BB1_264:
- mul.f32 %f1082, %f440, %f440;
- fma.rn.f32 %f1083, %f439, %f439, %f1082;
- fma.rn.f32 %f1084, %f441, %f441, %f1083;
- mul.f32 %f1085, %f442, %f442;
- sub.f32 %f443, %f1084, %f1085;
- ld.global.f32 %f444, [%rd141+16];
- setp.gt.f32 %p263, %f443, %f444;
- mov.f32 %f1375, %f1374;
- @%p263 bra BB1_266;
- sub.f32 %f1086, %f444, %f443;
- sqrt.rn.f32 %f1087, %f1086;
- sub.f32 %f1375, %f442, %f1087;
- add.f32 %f1374, %f442, %f1087;
- mov.pred %p325, 0;
- BB1_266:
- @%p325 bra BB1_269;
- setp.lt.f32 %p265, %f1375, 0f00000000;
- selp.f32 %f449, %f1374, %f1375, %p265;
- setp.geu.f32 %p266, %f449, %f1357;
- @%p266 bra BB1_269;
- mul.lo.s64 %rd254, %rd140, 80;
- add.s64 %rd353, %rd1, %rd254;
- add.s64 %rd354, %rd153, %rd254;
- mov.f32 %f1357, %f449;
- BB1_269:
- cvt.u32.u64 %r144, %rd122;
- add.s32 %r216, %r144, 4;
- setp.lt.u32 %p267, %r216, %r41;
- @%p267 bra BB1_241;
- BB1_270:
- setp.eq.s64 %p268, %rd354, 0;
- mov.f32 %f1406, 0f40000000;
- mov.f32 %f1407, %f1406;
- mov.f32 %f1408, %f1406;
- @%p268 bra BB1_314;
- fma.rn.f32 %f452, %f1351, %f1357, %f360;
- fma.rn.f32 %f453, %f1350, %f1357, %f361;
- fma.rn.f32 %f454, %f1349, %f1357, %f362;
- add.s64 %rd148, %rd353, 8;
- ld.global.f32 %f1091, [%rd353+8];
- sub.f32 %f1378, %f452, %f1091;
- ld.global.f32 %f1092, [%rd353+12];
- sub.f32 %f1379, %f453, %f1092;
- ld.global.f32 %f1093, [%rd353+16];
- sub.f32 %f1380, %f454, %f1093;
- mul.f32 %f1094, %f1379, %f1379;
- fma.rn.f32 %f1095, %f1378, %f1378, %f1094;
- fma.rn.f32 %f458, %f1380, %f1380, %f1095;
- setp.leu.f32 %p269, %f458, 0f00000000;
- @%p269 bra BB1_273;
- sqrt.rn.f32 %f1096, %f458;
- rcp.rn.f32 %f1097, %f1096;
- mul.f32 %f1378, %f1378, %f1097;
- mul.f32 %f1379, %f1379, %f1097;
- mul.f32 %f1380, %f1380, %f1097;
- BB1_273:
- mul.f32 %f1098, %f1350, %f1379;
- fma.rn.f32 %f1099, %f1351, %f1378, %f1098;
- fma.rn.f32 %f1100, %f1349, %f1380, %f1099;
- mov.u16 %rs12, 0;
- setp.leu.f32 %p270, %f1100, 0f00000000;
- @%p270 bra BB1_275;
- neg.f32 %f1378, %f1378;
- neg.f32 %f1379, %f1379;
- neg.f32 %f1380, %f1380;
- mov.u16 %rs12, 1;
- BB1_275:
- ld.global.f32 %f471, [%rd148+44];
- setp.gt.f32 %p271, %f471, 0f00000000;
- @%p271 bra BB1_290;
- ld.global.f32 %f1101, [%rd148+48];
- setp.gt.f32 %p272, %f1101, 0f00000000;
- @%p272 bra BB1_290;
- bra.uni BB1_277;
- BB1_290:
- mul.f32 %f1144, %f1350, %f1379;
- fma.rn.f32 %f1145, %f1351, %f1378, %f1144;
- fma.rn.f32 %f500, %f1349, %f1380, %f1145;
- add.f32 %f501, %f500, 0f3F800000;
- cvt.f64.f32 %fd25, %f501;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r39}, %fd25;
- }
- abs.f64 %fd26, %fd25;
- // Callseq Start 7
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b64 param0;
- st.param.f64 [param0+0], %fd26;
- .param .b64 retval0;
- call.uni (retval0),
- __internal_accurate_pow,
- (
- param0
- );
- ld.param.f64 %fd77, [retval0+0];
- //{
- }// Callseq End 7
- setp.gt.s32 %p283, %r39, -1;
- setp.lt.s32 %p284, %r39, 0;
- and.pred %p24, %p284, %p98;
- or.pred %p285, %p283, %p97;
- @%p285 bra BB1_292;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r148}, %fd77;
- }
- xor.b32 %r149, %r148, -2147483648;
- {
- .reg .b32 %temp;
- mov.b64 {%r150, %temp}, %fd77;
- }
- mov.b64 %fd77, {%r150, %r149};
- BB1_292:
- setp.eq.f32 %p286, %f501, 0f00000000;
- @%p286 bra BB1_295;
- bra.uni BB1_293;
- BB1_295:
- selp.b32 %r151, %r39, 0, %p98;
- mov.u32 %r152, 0;
- or.b32 %r153, %r151, 2146435072;
- setp.lt.s32 %p290, %r15, 0;
- selp.b32 %r154, %r153, %r151, %p290;
- mov.b64 %fd77, {%r152, %r154};
- bra.uni BB1_296;
- BB1_293:
- @%p283 bra BB1_296;
- mov.f64 %fd67, 0d4008000000000000;
- cvt.rzi.f64.f64 %fd62, %fd67;
- setp.neu.f64 %p288, %fd62, 0d4008000000000000;
- selp.f64 %fd77, 0dFFF8000000000000, %fd77, %p288;
- BB1_296:
- add.f64 %fd78, %fd25, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r155}, %fd78;
- }
- and.b32 %r156, %r155, 2146435072;
- setp.ne.s32 %p291, %r156, 2146435072;
- @%p291 bra BB1_297;
- setp.gtu.f64 %p292, %fd26, 0d7FF0000000000000;
- @%p292 bra BB1_306;
- and.b32 %r157, %r15, 2147483647;
- setp.ne.s32 %p293, %r157, 2146435072;
- @%p293 bra BB1_301;
- mov.f64 %fd66, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%r158, %temp}, %fd66;
- }
- setp.eq.s32 %p294, %r158, 0;
- @%p294 bra BB1_305;
- BB1_301:
- and.b32 %r159, %r39, 2147483647;
- setp.ne.s32 %p295, %r159, 2146435072;
- @%p295 bra BB1_302;
- {
- .reg .b32 %temp;
- mov.b64 {%r160, %temp}, %fd25;
- }
- setp.ne.s32 %p296, %r160, 0;
- mov.f64 %fd78, %fd77;
- @%p296 bra BB1_306;
- shr.s32 %r161, %r15, 31;
- and.b32 %r162, %r161, -2146435072;
- add.s32 %r163, %r162, 2146435072;
- or.b32 %r164, %r163, -2147483648;
- selp.b32 %r165, %r164, %r163, %p24;
- mov.u32 %r166, 0;
- mov.b64 %fd78, {%r166, %r165};
- bra.uni BB1_306;
- BB1_297:
- mov.f64 %fd78, %fd77;
- bra.uni BB1_306;
- BB1_277:
- mov.f32 %f1403, 0f00000000;
- mov.f32 %f1404, %f1403;
- mov.f32 %f1405, %f1403;
- @%p29 bra BB1_313;
- fma.rn.f32 %f472, %f1378, 0f38D1B717, %f452;
- fma.rn.f32 %f473, %f1379, 0f38D1B717, %f453;
- fma.rn.f32 %f474, %f1380, 0f38D1B717, %f454;
- mov.f32 %f1405, 0f00000000;
- mov.u32 %r218, 0;
- mov.f32 %f1404, %f1405;
- mov.f32 %f1403, %f1405;
- BB1_279:
- cvt.u64.u32 %rd149, %r218;
- mul.wide.u32 %rd255, %r218, 80;
- add.s64 %rd256, %rd1, %rd255;
- add.s64 %rd150, %rd256, 40;
- ld.global.f32 %f478, [%rd256+40];
- setp.leu.f32 %p274, %f478, 0f00000000;
- @%p274 bra BB1_289;
- ld.global.f32 %f1108, [%rd150+-32];
- sub.f32 %f1389, %f1108, %f452;
- ld.global.f32 %f1109, [%rd150+-28];
- sub.f32 %f1388, %f1109, %f453;
- ld.global.f32 %f1110, [%rd150+-24];
- sub.f32 %f1387, %f1110, %f454;
- mul.f32 %f1111, %f1388, %f1388;
- fma.rn.f32 %f1112, %f1389, %f1389, %f1111;
- fma.rn.f32 %f482, %f1387, %f1387, %f1112;
- setp.leu.f32 %p275, %f482, 0f00000000;
- @%p275 bra BB1_282;
- sqrt.rn.f32 %f1113, %f482;
- rcp.rn.f32 %f1114, %f1113;
- mul.f32 %f1389, %f1389, %f1114;
- mul.f32 %f1388, %f1388, %f1114;
- mul.f32 %f1387, %f1387, %f1114;
- BB1_282:
- mov.u32 %r219, 0;
- BB1_283:
- cvt.u32.u64 %r147, %rd149;
- setp.eq.s32 %p276, %r147, %r219;
- @%p276 bra BB1_286;
- mul.wide.u32 %rd257, %r219, 80;
- add.s64 %rd258, %rd1, %rd257;
- add.s64 %rd151, %rd258, 8;
- ld.global.f32 %f1115, [%rd258+8];
- sub.f32 %f489, %f1115, %f472;
- ld.global.f32 %f1116, [%rd258+12];
- sub.f32 %f490, %f1116, %f473;
- ld.global.f32 %f1117, [%rd258+16];
- sub.f32 %f491, %f1117, %f474;
- mul.f32 %f1118, %f1388, %f490;
- fma.rn.f32 %f1119, %f1389, %f489, %f1118;
- fma.rn.f32 %f492, %f1387, %f491, %f1119;
- setp.lt.f32 %p277, %f492, 0f00000000;
- @%p277 bra BB1_286;
- mul.f32 %f1121, %f490, %f490;
- fma.rn.f32 %f1122, %f489, %f489, %f1121;
- fma.rn.f32 %f1123, %f491, %f491, %f1122;
- mul.f32 %f1124, %f492, %f492;
- sub.f32 %f1125, %f1123, %f1124;
- ld.global.f32 %f1126, [%rd151+16];
- mov.f32 %f1390, 0f00000000;
- setp.leu.f32 %p278, %f1125, %f1126;
- @%p278 bra BB1_288;
- BB1_286:
- add.s32 %r219, %r219, 1;
- setp.lt.u32 %p279, %r219, %r41;
- @%p279 bra BB1_283;
- mov.f32 %f1390, %f961;
- BB1_288:
- ld.global.f32 %f1128, [%rd148+20];
- mul.f32 %f1129, %f1390, %f1128;
- ld.global.f32 %f1130, [%rd148+24];
- mul.f32 %f1131, %f1390, %f1130;
- ld.global.f32 %f1132, [%rd148+28];
- mul.f32 %f1133, %f1390, %f1132;
- mul.f32 %f1134, %f1378, %f1389;
- fma.rn.f32 %f1135, %f1379, %f1388, %f1134;
- fma.rn.f32 %f1136, %f1380, %f1387, %f1135;
- mov.f32 %f1137, 0f00000000;
- max.f32 %f1138, %f1137, %f1136;
- mul.f32 %f1139, %f1129, %f1138;
- mul.f32 %f1140, %f1131, %f1138;
- mul.f32 %f1141, %f1133, %f1138;
- ld.global.f32 %f1142, [%rd150+4];
- ld.global.f32 %f1143, [%rd150+8];
- fma.rn.f32 %f1403, %f478, %f1139, %f1403;
- fma.rn.f32 %f1404, %f1140, %f1142, %f1404;
- fma.rn.f32 %f1405, %f1141, %f1143, %f1405;
- BB1_289:
- add.s32 %r218, %r218, 1;
- setp.lt.u32 %p280, %r218, %r41;
- @%p280 bra BB1_279;
- bra.uni BB1_313;
- BB1_302:
- mov.f64 %fd78, %fd77;
- bra.uni BB1_306;
- BB1_305:
- setp.gt.f64 %p297, %fd26, 0d3FF0000000000000;
- selp.b32 %r167, 2146435072, 0, %p297;
- mov.u32 %r168, 0;
- xor.b32 %r169, %r167, 2146435072;
- setp.lt.s32 %p298, %r15, 0;
- selp.b32 %r170, %r169, %r167, %p298;
- setp.eq.f32 %p299, %f501, 0fBF800000;
- selp.b32 %r171, 1072693248, %r170, %p299;
- mov.b64 %fd78, {%r168, %r171};
- BB1_306:
- cvt.rn.f32.f64 %f1146, %fd78;
- fma.rn.f32 %f1147, %f1146, 0f3F666666, 0f3DCCCCCD;
- setp.eq.f32 %p300, %f501, 0f3F800000;
- selp.f32 %f502, 0f3F800000, %f1147, %p300;
- add.f32 %f1148, %f1378, %f1378;
- mul.f32 %f1149, %f1148, %f500;
- add.f32 %f1150, %f1379, %f1379;
- mul.f32 %f1151, %f1150, %f500;
- add.f32 %f1152, %f1380, %f1380;
- mul.f32 %f1153, %f1152, %f500;
- sub.f32 %f1394, %f1351, %f1149;
- sub.f32 %f1395, %f1350, %f1151;
- sub.f32 %f1396, %f1349, %f1153;
- mul.f32 %f1154, %f1395, %f1395;
- fma.rn.f32 %f1155, %f1394, %f1394, %f1154;
- fma.rn.f32 %f506, %f1396, %f1396, %f1155;
- setp.leu.f32 %p301, %f506, 0f00000000;
- @%p301 bra BB1_308;
- sqrt.rn.f32 %f1156, %f506;
- rcp.rn.f32 %f1157, %f1156;
- mul.f32 %f1394, %f1394, %f1157;
- mul.f32 %f1395, %f1395, %f1157;
- mul.f32 %f1396, %f1396, %f1157;
- BB1_308:
- mul.f32 %f513, %f1378, 0f38D1B717;
- add.f32 %f1161, %f452, %f513;
- mul.f32 %f514, %f1379, 0f38D1B717;
- add.f32 %f1162, %f453, %f514;
- mul.f32 %f515, %f1380, 0f38D1B717;
- add.f32 %f1163, %f454, %f515;
- mov.u32 %r172, 2;
- // Callseq Start 8
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b32 param0;
- st.param.f32 [param0+0], %f1161;
- .param .b32 param1;
- st.param.f32 [param1+0], %f1162;
- .param .b32 param2;
- st.param.f32 [param2+0], %f1163;
- .param .b32 param3;
- st.param.f32 [param3+0], %f1394;
- .param .b32 param4;
- st.param.f32 [param4+0], %f1395;
- .param .b32 param5;
- st.param.f32 [param5+0], %f1396;
- .param .b64 param6;
- st.param.b64 [param6+0], %rd153;
- .param .b32 param7;
- st.param.b32 [param7+0], %r41;
- .param .b32 param8;
- st.param.b32 [param8+0], %r172;
- .param .align 4 .b8 retval0[12];
- call.uni (retval0),
- _Z5traceRK4Vec3IfES2_PK6SpherejRKi,
- (
- param0,
- param1,
- param2,
- param3,
- param4,
- param5,
- param6,
- param7,
- param8
- );
- ld.param.f32 %f516, [retval0+0];
- ld.param.f32 %f517, [retval0+4];
- ld.param.f32 %f518, [retval0+8];
- //{
- }// Callseq End 8
- mov.f32 %f1400, 0f00000000;
- setp.eq.f32 %p302, %f471, 0f00000000;
- mov.f32 %f1401, %f1400;
- mov.f32 %f1402, %f1400;
- @%p302 bra BB1_312;
- setp.eq.s16 %p303, %rs12, 0;
- selp.f32 %f1164, 0f3F68BA2E, 0f3F8CCCCD, %p303;
- mul.f32 %f1165, %f1164, %f1164;
- mul.f32 %f1166, %f500, %f500;
- mov.f32 %f1167, 0f3F800000;
- sub.f32 %f1168, %f1167, %f1166;
- mul.f32 %f1169, %f1165, %f1168;
- sub.f32 %f1170, %f1167, %f1169;
- mul.f32 %f1171, %f500, %f1164;
- neg.f32 %f1172, %f1171;
- sqrt.rn.f32 %f1173, %f1170;
- sub.f32 %f1174, %f1172, %f1173;
- mul.f32 %f1175, %f1378, %f1174;
- mul.f32 %f1176, %f1379, %f1174;
- mul.f32 %f1177, %f1380, %f1174;
- fma.rn.f32 %f1399, %f1351, %f1164, %f1175;
- fma.rn.f32 %f1398, %f1350, %f1164, %f1176;
- fma.rn.f32 %f1397, %f1349, %f1164, %f1177;
- mul.f32 %f1178, %f1398, %f1398;
- fma.rn.f32 %f1179, %f1399, %f1399, %f1178;
- fma.rn.f32 %f522, %f1397, %f1397, %f1179;
- setp.leu.f32 %p304, %f522, 0f00000000;
- @%p304 bra BB1_311;
- sqrt.rn.f32 %f1180, %f522;
- rcp.rn.f32 %f1181, %f1180;
- mul.f32 %f1399, %f1399, %f1181;
- mul.f32 %f1398, %f1398, %f1181;
- mul.f32 %f1397, %f1397, %f1181;
- BB1_311:
- sub.f32 %f1182, %f454, %f515;
- sub.f32 %f1183, %f453, %f514;
- sub.f32 %f1184, %f452, %f513;
- // Callseq Start 9
- {
- .reg .b32 temp_param_reg;
- // <end>}
- .param .b32 param0;
- st.param.f32 [param0+0], %f1184;
- .param .b32 param1;
- st.param.f32 [param1+0], %f1183;
- .param .b32 param2;
- st.param.f32 [param2+0], %f1182;
- .param .b32 param3;
- st.param.f32 [param3+0], %f1399;
- .param .b32 param4;
- st.param.f32 [param4+0], %f1398;
- .param .b32 param5;
- st.param.f32 [param5+0], %f1397;
- .param .b64 param6;
- st.param.b64 [param6+0], %rd153;
- .param .b32 param7;
- st.param.b32 [param7+0], %r41;
- .param .b32 param8;
- st.param.b32 [param8+0], %r172;
- .param .align 4 .b8 retval0[12];
- call.uni (retval0),
- _Z5traceRK4Vec3IfES2_PK6SpherejRKi,
- (
- param0,
- param1,
- param2,
- param3,
- param4,
- param5,
- param6,
- param7,
- param8
- );
- ld.param.f32 %f1400, [retval0+0];
- ld.param.f32 %f1401, [retval0+4];
- ld.param.f32 %f1402, [retval0+8];
- //{
- }// Callseq End 9
- BB1_312:
- mov.f32 %f1185, 0f3F800000;
- sub.f32 %f1186, %f1185, %f502;
- mul.f32 %f1187, %f1186, %f1400;
- mul.f32 %f1188, %f1186, %f1401;
- mul.f32 %f1189, %f1186, %f1402;
- mul.f32 %f1190, %f471, %f1187;
- mul.f32 %f1191, %f471, %f1188;
- mul.f32 %f1192, %f471, %f1189;
- fma.rn.f32 %f1193, %f502, %f516, %f1190;
- fma.rn.f32 %f1194, %f502, %f517, %f1191;
- fma.rn.f32 %f1195, %f502, %f518, %f1192;
- ld.global.f32 %f1196, [%rd148+20];
- mul.f32 %f1403, %f1196, %f1193;
- ld.global.f32 %f1197, [%rd148+24];
- mul.f32 %f1404, %f1194, %f1197;
- ld.global.f32 %f1198, [%rd148+28];
- mul.f32 %f1405, %f1195, %f1198;
- BB1_313:
- ld.global.f32 %f1199, [%rd148+32];
- add.f32 %f1406, %f1403, %f1199;
- ld.global.f32 %f1200, [%rd148+36];
- add.f32 %f1407, %f1404, %f1200;
- ld.global.f32 %f1201, [%rd148+40];
- add.f32 %f1408, %f1405, %f1201;
- BB1_314:
- mov.f32 %f1202, 0f3F800000;
- sub.f32 %f1203, %f1202, %f149;
- mul.f32 %f1204, %f1203, %f1406;
- mul.f32 %f1205, %f1203, %f1407;
- mul.f32 %f1206, %f1203, %f1408;
- mul.f32 %f1207, %f1204, %f118;
- mul.f32 %f1208, %f1205, %f118;
- mul.f32 %f1209, %f1206, %f118;
- fma.rn.f32 %f1210, %f149, %f1346, %f1207;
- fma.rn.f32 %f1211, %f149, %f1347, %f1208;
- fma.rn.f32 %f1212, %f149, %f1348, %f1209;
- ld.global.f32 %f1213, [%rd47+20];
- mul.f32 %f1409, %f1213, %f1210;
- ld.global.f32 %f1214, [%rd47+24];
- mul.f32 %f1410, %f1211, %f1214;
- ld.global.f32 %f1215, [%rd47+28];
- mul.f32 %f1411, %f1212, %f1215;
- BB1_315:
- ld.global.f32 %f1216, [%rd47+32];
- add.f32 %f1412, %f1409, %f1216;
- ld.global.f32 %f1217, [%rd47+36];
- add.f32 %f1413, %f1410, %f1217;
- ld.global.f32 %f1218, [%rd47+40];
- add.f32 %f1414, %f1411, %f1218;
- BB1_316:
- ld.param.u64 %rd267, [raytrace_kernel_param_2];
- ld.param.u32 %r191, [raytrace_kernel_param_0];
- mov.u32 %r190, %tid.y;
- mov.u32 %r189, %ctaid.y;
- mov.u32 %r188, %ntid.y;
- mad.lo.s32 %r187, %r188, %r189, %r190;
- mov.u32 %r186, %tid.x;
- mov.u32 %r185, %ctaid.x;
- mov.u32 %r184, %ntid.x;
- mad.lo.s32 %r183, %r184, %r185, %r186;
- mad.lo.s32 %r182, %r187, %r191, %r183;
- cvta.to.global.u64 %rd259, %rd267;
- mul.wide.u32 %rd260, %r182, 12;
- add.s64 %rd261, %rd259, %rd260;
- st.global.f32 [%rd261], %f1412;
- st.global.f32 [%rd261+4], %f1413;
- st.global.f32 [%rd261+8], %f1414;
- BB1_317:
- ret;
- }
- .func (.param .b64 func_retval0) __internal_accurate_pow(
- .param .b64 __internal_accurate_pow_param_0
- )
- {
- .reg .pred %p<9>;
- .reg .f32 %f<3>;
- .reg .b32 %r<53>;
- .reg .f64 %fd<138>;
- ld.param.f64 %fd12, [__internal_accurate_pow_param_0];
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r50}, %fd12;
- }
- {
- .reg .b32 %temp;
- mov.b64 {%r49, %temp}, %fd12;
- }
- shr.u32 %r51, %r50, 20;
- setp.ne.s32 %p1, %r51, 0;
- @%p1 bra BB2_2;
- mul.f64 %fd13, %fd12, 0d4350000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r50}, %fd13;
- }
- {
- .reg .b32 %temp;
- mov.b64 {%r49, %temp}, %fd13;
- }
- shr.u32 %r16, %r50, 20;
- add.s32 %r51, %r16, -54;
- BB2_2:
- add.s32 %r52, %r51, -1023;
- and.b32 %r17, %r50, -2146435073;
- or.b32 %r18, %r17, 1072693248;
- mov.b64 %fd135, {%r49, %r18};
- setp.lt.u32 %p2, %r18, 1073127583;
- @%p2 bra BB2_4;
- {
- .reg .b32 %temp;
- mov.b64 {%r19, %temp}, %fd135;
- }
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r20}, %fd135;
- }
- add.s32 %r21, %r20, -1048576;
- mov.b64 %fd135, {%r19, %r21};
- add.s32 %r52, %r51, -1022;
- BB2_4:
- add.f64 %fd14, %fd135, 0d3FF0000000000000;
- rcp.approx.ftz.f64 %fd15, %fd14;
- neg.f64 %fd16, %fd14;
- mov.f64 %fd17, 0d3FF0000000000000;
- fma.rn.f64 %fd18, %fd16, %fd15, %fd17;
- fma.rn.f64 %fd19, %fd18, %fd18, %fd18;
- fma.rn.f64 %fd20, %fd19, %fd15, %fd15;
- add.f64 %fd21, %fd135, 0dBFF0000000000000;
- mul.f64 %fd22, %fd21, %fd20;
- fma.rn.f64 %fd23, %fd21, %fd20, %fd22;
- mul.f64 %fd24, %fd23, %fd23;
- mov.f64 %fd25, 0d3ED0F5D241AD3B5A;
- mov.f64 %fd26, 0d3EB0F5FF7D2CAFE2;
- fma.rn.f64 %fd27, %fd26, %fd24, %fd25;
- mov.f64 %fd28, 0d3EF3B20A75488A3F;
- fma.rn.f64 %fd29, %fd27, %fd24, %fd28;
- mov.f64 %fd30, 0d3F1745CDE4FAECD5;
- fma.rn.f64 %fd31, %fd29, %fd24, %fd30;
- mov.f64 %fd32, 0d3F3C71C7258A578B;
- fma.rn.f64 %fd33, %fd31, %fd24, %fd32;
- mov.f64 %fd34, 0d3F6249249242B910;
- fma.rn.f64 %fd35, %fd33, %fd24, %fd34;
- mov.f64 %fd36, 0d3F89999999999DFB;
- fma.rn.f64 %fd37, %fd35, %fd24, %fd36;
- sub.f64 %fd38, %fd21, %fd23;
- add.f64 %fd39, %fd38, %fd38;
- neg.f64 %fd40, %fd23;
- fma.rn.f64 %fd41, %fd40, %fd21, %fd39;
- mul.f64 %fd42, %fd20, %fd41;
- fma.rn.f64 %fd43, %fd24, %fd37, 0d3FB5555555555555;
- mov.f64 %fd44, 0d3FB5555555555555;
- sub.f64 %fd45, %fd44, %fd43;
- fma.rn.f64 %fd46, %fd24, %fd37, %fd45;
- add.f64 %fd47, %fd46, 0d0000000000000000;
- add.f64 %fd48, %fd47, 0dBC46A4CB00B9E7B0;
- add.f64 %fd49, %fd43, %fd48;
- sub.f64 %fd50, %fd43, %fd49;
- add.f64 %fd51, %fd48, %fd50;
- mul.rn.f64 %fd52, %fd23, %fd23;
- neg.f64 %fd53, %fd52;
- fma.rn.f64 %fd54, %fd23, %fd23, %fd53;
- {
- .reg .b32 %temp;
- mov.b64 {%r22, %temp}, %fd42;
- }
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r23}, %fd42;
- }
- add.s32 %r24, %r23, 1048576;
- mov.b64 %fd55, {%r22, %r24};
- fma.rn.f64 %fd56, %fd23, %fd55, %fd54;
- mul.rn.f64 %fd57, %fd52, %fd23;
- neg.f64 %fd58, %fd57;
- fma.rn.f64 %fd59, %fd52, %fd23, %fd58;
- fma.rn.f64 %fd60, %fd52, %fd42, %fd59;
- fma.rn.f64 %fd61, %fd56, %fd23, %fd60;
- mul.rn.f64 %fd62, %fd49, %fd57;
- neg.f64 %fd63, %fd62;
- fma.rn.f64 %fd64, %fd49, %fd57, %fd63;
- fma.rn.f64 %fd65, %fd49, %fd61, %fd64;
- fma.rn.f64 %fd66, %fd51, %fd57, %fd65;
- add.f64 %fd67, %fd62, %fd66;
- sub.f64 %fd68, %fd62, %fd67;
- add.f64 %fd69, %fd66, %fd68;
- add.f64 %fd70, %fd23, %fd67;
- sub.f64 %fd71, %fd23, %fd70;
- add.f64 %fd72, %fd67, %fd71;
- add.f64 %fd73, %fd69, %fd72;
- add.f64 %fd74, %fd42, %fd73;
- add.f64 %fd75, %fd70, %fd74;
- sub.f64 %fd76, %fd70, %fd75;
- add.f64 %fd77, %fd74, %fd76;
- xor.b32 %r25, %r52, -2147483648;
- mov.u32 %r26, -2147483648;
- mov.u32 %r27, 1127219200;
- mov.b64 %fd78, {%r25, %r27};
- mov.b64 %fd79, {%r26, %r27};
- sub.f64 %fd80, %fd78, %fd79;
- mov.f64 %fd81, 0d3FE62E42FEFA39EF;
- fma.rn.f64 %fd82, %fd80, %fd81, %fd75;
- neg.f64 %fd83, %fd80;
- fma.rn.f64 %fd84, %fd83, %fd81, %fd82;
- sub.f64 %fd85, %fd84, %fd75;
- sub.f64 %fd86, %fd77, %fd85;
- mov.f64 %fd87, 0d3C7ABC9E3B39803F;
- fma.rn.f64 %fd88, %fd80, %fd87, %fd86;
- add.f64 %fd89, %fd82, %fd88;
- sub.f64 %fd90, %fd82, %fd89;
- add.f64 %fd91, %fd88, %fd90;
- mov.f64 %fd92, 0d4008000000000000;
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r28}, %fd92;
- }
- add.s32 %r29, %r28, %r28;
- setp.gt.u32 %p3, %r29, -33554433;
- and.b32 %r30, %r28, -15728641;
- selp.b32 %r31, %r30, %r28, %p3;
- {
- .reg .b32 %temp;
- mov.b64 {%r32, %temp}, %fd92;
- }
- mov.b64 %fd93, {%r32, %r31};
- mul.rn.f64 %fd94, %fd89, %fd93;
- neg.f64 %fd95, %fd94;
- fma.rn.f64 %fd96, %fd89, %fd93, %fd95;
- fma.rn.f64 %fd97, %fd91, %fd93, %fd96;
- add.f64 %fd4, %fd94, %fd97;
- sub.f64 %fd98, %fd94, %fd4;
- add.f64 %fd5, %fd97, %fd98;
- mov.f64 %fd99, 0d4338000000000000;
- mov.f64 %fd100, 0d3FF71547652B82FE;
- fma.rn.f64 %fd101, %fd4, %fd100, %fd99;
- {
- .reg .b32 %temp;
- mov.b64 {%r13, %temp}, %fd101;
- }
- mov.f64 %fd102, 0dC338000000000000;
- add.rn.f64 %fd103, %fd101, %fd102;
- mov.f64 %fd104, 0dBFE62E42FEFA39EF;
- fma.rn.f64 %fd105, %fd103, %fd104, %fd4;
- mov.f64 %fd106, 0dBC7ABC9E3B39803F;
- fma.rn.f64 %fd107, %fd103, %fd106, %fd105;
- mov.f64 %fd108, 0d3E928AF3FCA213EA;
- mov.f64 %fd109, 0d3E5ADE1569CE2BDF;
- fma.rn.f64 %fd110, %fd109, %fd107, %fd108;
- mov.f64 %fd111, 0d3EC71DEE62401315;
- fma.rn.f64 %fd112, %fd110, %fd107, %fd111;
- mov.f64 %fd113, 0d3EFA01997C89EB71;
- fma.rn.f64 %fd114, %fd112, %fd107, %fd113;
- mov.f64 %fd115, 0d3F2A01A014761F65;
- fma.rn.f64 %fd116, %fd114, %fd107, %fd115;
- mov.f64 %fd117, 0d3F56C16C1852B7AF;
- fma.rn.f64 %fd118, %fd116, %fd107, %fd117;
- mov.f64 %fd119, 0d3F81111111122322;
- fma.rn.f64 %fd120, %fd118, %fd107, %fd119;
- mov.f64 %fd121, 0d3FA55555555502A1;
- fma.rn.f64 %fd122, %fd120, %fd107, %fd121;
- mov.f64 %fd123, 0d3FC5555555555511;
- fma.rn.f64 %fd124, %fd122, %fd107, %fd123;
- mov.f64 %fd125, 0d3FE000000000000B;
- fma.rn.f64 %fd126, %fd124, %fd107, %fd125;
- fma.rn.f64 %fd127, %fd126, %fd107, %fd17;
- fma.rn.f64 %fd128, %fd127, %fd107, %fd17;
- {
- .reg .b32 %temp;
- mov.b64 {%r14, %temp}, %fd128;
- }
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r15}, %fd128;
- }
- shl.b32 %r33, %r13, 20;
- add.s32 %r34, %r15, %r33;
- mov.b64 %fd136, {%r14, %r34};
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r35}, %fd4;
- }
- mov.b32 %f2, %r35;
- abs.f32 %f1, %f2;
- setp.lt.f32 %p4, %f1, 0f4086232B;
- @%p4 bra BB2_7;
- setp.lt.f64 %p5, %fd4, 0d0000000000000000;
- add.f64 %fd129, %fd4, 0d7FF0000000000000;
- selp.f64 %fd136, 0d0000000000000000, %fd129, %p5;
- setp.geu.f32 %p6, %f1, 0f40874800;
- @%p6 bra BB2_7;
- mov.f64 %fd134, 0d4338000000000000;
- mov.f64 %fd133, 0d3FF71547652B82FE;
- fma.rn.f64 %fd132, %fd4, %fd133, %fd134;
- {
- .reg .b32 %temp;
- mov.b64 {%r48, %temp}, %fd132;
- }
- shr.u32 %r36, %r48, 31;
- add.s32 %r37, %r48, %r36;
- shr.s32 %r38, %r37, 1;
- shl.b32 %r39, %r38, 20;
- add.s32 %r40, %r39, %r15;
- mov.b64 %fd130, {%r14, %r40};
- sub.s32 %r41, %r48, %r38;
- shl.b32 %r42, %r41, 20;
- add.s32 %r43, %r42, 1072693248;
- mov.u32 %r44, 0;
- mov.b64 %fd131, {%r44, %r43};
- mul.f64 %fd136, %fd130, %fd131;
- BB2_7:
- {
- .reg .b32 %temp;
- mov.b64 {%temp, %r45}, %fd136;
- }
- and.b32 %r46, %r45, 2147483647;
- setp.ne.s32 %p7, %r46, 2146435072;
- @%p7 bra BB2_9;
- {
- .reg .b32 %temp;
- mov.b64 {%r47, %temp}, %fd136;
- }
- setp.eq.s32 %p8, %r47, 0;
- @%p8 bra BB2_10;
- BB2_9:
- fma.rn.f64 %fd136, %fd136, %fd5, %fd136;
- BB2_10:
- st.param.f64 [func_retval0+0], %fd136;
- ret;
- }
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement