Advertisement
Guest User

Untitled

a guest
Dec 9th, 2019
149
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1.     .file   "mat_vec.c"
  2.     .text
  3.     .p2align 4
  4.     .globl  mat_vec
  5.     .type   mat_vec, @function
  6. mat_vec:
  7. .LFB22:
  8.     .cfi_startproc
  9.     testl   %ecx, %ecx
  10.     jle .L1
  11.     leal    -1(%rcx), %eax
  12.     movslq  %ecx, %r9
  13.     movq    %rdi, %r8
  14.     movq    %rax, %rcx
  15.     leaq    8(%rsi,%rax,8), %r10
  16.     salq    $3, %r9
  17.     shrl    $3, %ecx
  18.     movl    %ecx, %eax
  19.     salq    $6, %rax
  20.     leaq    64(%rdx,%rax), %rdi
  21.     .p2align 4,,10
  22.     .p2align 3
  23. .L3:
  24.     movq    %r8, %rcx
  25.     movq    %rdx, %rax
  26.     .p2align 4,,10
  27.     .p2align 3
  28. .L4:
  29.     movsd   (%rcx), %xmm0
  30.     mulsd   (%rsi), %xmm0
  31.     addq    $64, %rax
  32.     addq    $64, %rcx
  33.     addsd   -64(%rax), %xmm0
  34.     movsd   %xmm0, -64(%rax)
  35.     movsd   -56(%rcx), %xmm0
  36.     mulsd   (%rsi), %xmm0
  37.     addsd   -56(%rax), %xmm0
  38.     movsd   %xmm0, -56(%rax)
  39.     movsd   -48(%rcx), %xmm0
  40.     mulsd   (%rsi), %xmm0
  41.     addsd   -48(%rax), %xmm0
  42.     movsd   %xmm0, -48(%rax)
  43.     movsd   -40(%rcx), %xmm0
  44.     mulsd   (%rsi), %xmm0
  45.     addsd   -40(%rax), %xmm0
  46.     movsd   %xmm0, -40(%rax)
  47.     movsd   -32(%rcx), %xmm0
  48.     mulsd   (%rsi), %xmm0
  49.     addsd   -32(%rax), %xmm0
  50.     movsd   %xmm0, -32(%rax)
  51.     movsd   -24(%rcx), %xmm0
  52.     mulsd   (%rsi), %xmm0
  53.     addsd   -24(%rax), %xmm0
  54.     movsd   %xmm0, -24(%rax)
  55.     movsd   -16(%rcx), %xmm0
  56.     mulsd   (%rsi), %xmm0
  57.     addsd   -16(%rax), %xmm0
  58.     movsd   %xmm0, -16(%rax)
  59.     movsd   -8(%rcx), %xmm0
  60.     mulsd   (%rsi), %xmm0
  61.     addsd   -8(%rax), %xmm0
  62.     movsd   %xmm0, -8(%rax)
  63.     cmpq    %rax, %rdi
  64.     jne .L4
  65.     addq    $8, %rsi
  66.     addq    %r9, %r8
  67.     cmpq    %rsi, %r10
  68.     jne .L3
  69. .L1:
  70.     ret
  71.     .cfi_endproc
  72. .LFE22:
  73.     .size   mat_vec, .-mat_vec
  74.     .ident  "GCC: (Debian 9.2.1-21) 9.2.1 20191130"
  75.     .section    .note.GNU-stack,"",@progbits
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement