Guest User

linux perf sum clang vs gcc

a guest
Apr 3rd, 2017
213
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. #gcc
  2. $ gcc --version
  3. gcc (Ubuntu 5.4.0-6ubuntu1~16.04.4) 5.4.0 20160609
  4. $ gcc -O3 -o sum sum.c
  5. $ time ./sum 5000
  6. ./sum 5000  1.17s user 0.00s system 99% cpu 1.171 total
  7. $ sudo perf stat ./sum 5000
  8.  
  9.  Performance counter stats for './sum 5000':
  10.  
  11.        1168.298144      task-clock (msec)         #    1.000 CPUs utilized          
  12.                 29      context-switches          #    0.025 K/sec                  
  13.                  0      cpu-migrations            #    0.000 K/sec                  
  14.                 55      page-faults               #    0.047 K/sec                  
  15.      5,023,172,901      cycles                    #    4.300 GHz                    
  16.     18,773,198,728      instructions              #    3.74  insn per cycle        
  17.      1,256,435,755      branches                  # 1075.441 M/sec                  
  18.          1,011,161      branch-misses             #    0.08% of all branches        
  19.  
  20.        1.168475610 seconds time elapsed
  21.  
  22. #clang
  23. $ clang --version
  24. clang version 3.8.0-2ubuntu4 (tags/RELEASE_380/final)
  25. $ clang -O3 -o sum sum.c
  26. $ time ./sum 5000
  27. ./sum 5000  4.65s user 0.00s system 99% cpu 4.656 total
  28. $ sudo perf stat ./sum 5000
  29.  
  30.  Performance counter stats for './sum 5000':
  31.  
  32.        4656.012983      task-clock (msec)         #    1.000 CPUs utilized          
  33.                 16      context-switches          #    0.003 K/sec                  
  34.                  0      cpu-migrations            #    0.000 K/sec                  
  35.                 52      page-faults               #    0.011 K/sec                  
  36.     20,019,074,780      cycles                    #    4.300 GHz                    
  37.     53,775,258,783      instructions              #    2.69  insn per cycle        
  38.      1,255,158,509      branches                  #  269.578 M/sec                  
  39.          1,027,384      branch-misses             #    0.08% of all branches        
  40.  
  41.        4.655998791 seconds time elapsed
RAW Paste Data