Advertisement
Guest User

Untitled

a guest
May 25th, 2025
23
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Bash 11.30 KB | None | 0 0
  1. Hello, running the test workload from the repo to access rocminfo from the pod yields:
  2.  
  3. kubecetl exec -it -n amd alexnet-tf-gpu-pod -- bash  
  4. tf-docker ~ >  rocminfo  
  5. ROCk module is loaded
  6. =====================    
  7. HSA System Attributes    
  8. =====================    
  9. Runtime Version:         1.15
  10. Runtime Ext Version:     1.7
  11. System Timestamp Freq.:  1000.000000MHz
  12. Sig. Max Wait Duration:  18446744073709551615 (0xFFFFFFFFFFFFFFFF) (timestamp count)
  13. Machine Model:           LARGE                              
  14. System Endianness:       LITTLE                            
  15. Mwaitx:                  DISABLED
  16. XNACK enabled:           NO
  17. DMAbuf Support:          YES
  18. VMM Support:             YES
  19.  
  20. ==========              
  21. HSA Agents              
  22. ==========              
  23. *******                  
  24. Agent 1                  
  25. *******                  
  26.   Name:                    AMD Ryzen 9 PRO 7945 12-Core Processor
  27.   Uuid:                    CPU-XX                            
  28.   Marketing Name:          AMD Ryzen 9 PRO 7945 12-Core Processor
  29.   Vendor Name:             CPU                                
  30.   Feature:                 None specified                    
  31.   Profile:                 FULL_PROFILE                      
  32.   Float Round Mode:        NEAR                              
  33.   Max Queue Number:        0(0x0)                            
  34.   Queue Min Size:          0(0x0)                            
  35.   Queue Max Size:          0(0x0)                            
  36.   Queue Type:              MULTI                              
  37.   Node:                    0                                  
  38.   Device Type:             CPU                                
  39.   Cache Info:              
  40.     L1:                      32768(0x8000) KB                  
  41.   Chip ID:                 0(0x0)                            
  42.   ASIC Revision:           0(0x0)                            
  43.   Cacheline Size:          64(0x40)                          
  44.   Max Clock Freq. (MHz):   5482                              
  45.   BDFID:                   0                                  
  46.   Internal Node ID:        0                                  
  47.   Compute Unit:            24                                
  48.   SIMDs per CU:            0                                  
  49.   Shader Engines:          0                                  
  50.   Shader Arrs. per Eng.:   0                                  
  51.   WatchPts on Addr. Ranges:1                                  
  52.   Memory Properties:      
  53.   Features:                None
  54.   Pool Info:              
  55.     Pool 1                  
  56.       Segment:                 GLOBAL; FLAGS: FINE GRAINED        
  57.       Size:                    130950660(0x7ce2604) KB            
  58.       Allocatable:             TRUE                              
  59.       Alloc Granule:           4KB                                
  60.       Alloc Recommended Granule:4KB                                
  61.       Alloc Alignment:         4KB                                
  62.       Accessible by all:       TRUE                              
  63.     Pool 2                  
  64.       Segment:                 GLOBAL; FLAGS: EXTENDED FINE GRAINED
  65.       Size:                    130950660(0x7ce2604) KB            
  66.       Allocatable:             TRUE                              
  67.       Alloc Granule:           4KB                                
  68.       Alloc Recommended Granule:4KB                                
  69.       Alloc Alignment:         4KB                                
  70.       Accessible by all:       TRUE                              
  71.     Pool 3                  
  72.       Segment:                 GLOBAL; FLAGS: KERNARG, FINE GRAINED
  73.       Size:                    130950660(0x7ce2604) KB            
  74.       Allocatable:             TRUE                              
  75.       Alloc Granule:           4KB                                
  76.       Alloc Recommended Granule:4KB                                
  77.       Alloc Alignment:         4KB                                
  78.       Accessible by all:       TRUE                              
  79.     Pool 4                  
  80.       Segment:                 GLOBAL; FLAGS: COARSE GRAINED      
  81.       Size:                    130950660(0x7ce2604) KB            
  82.       Allocatable:             TRUE                              
  83.       Alloc Granule:           4KB                                
  84.       Alloc Recommended Granule:4KB                                
  85.       Alloc Alignment:         4KB                                
  86.       Accessible by all:       TRUE                              
  87.   ISA Info:                
  88. *******                  
  89. Agent 2                  
  90. *******                  
  91.   Name:                    gfx1036                            
  92.   Uuid:                    GPU-XX                            
  93.   Marketing Name:          AMD Radeon Graphics                
  94.   Vendor Name:             AMD                                
  95.   Feature:                 KERNEL_DISPATCH                    
  96.   Profile:                 BASE_PROFILE                      
  97.   Float Round Mode:        NEAR                              
  98.   Max Queue Number:        128(0x80)                          
  99.   Queue Min Size:          64(0x40)                          
  100.   Queue Max Size:          131072(0x20000)                    
  101.   Queue Type:              MULTI                              
  102.   Node:                    1                                  
  103.   Device Type:             GPU                                
  104.   Cache Info:              
  105.     L1:                      16(0x10) KB                        
  106.     L2:                      256(0x100) KB                      
  107.   Chip ID:                 5710(0x164e)                      
  108.   ASIC Revision:           1(0x1)                            
  109.   Cacheline Size:          128(0x80)                          
  110.   Max Clock Freq. (MHz):   2200                              
  111.   BDFID:                   4352                              
  112.   Internal Node ID:        1                                  
  113.   Compute Unit:            2                                  
  114.   SIMDs per CU:            2                                  
  115.   Shader Engines:          1                                  
  116.   Shader Arrs. per Eng.:   1                                  
  117.   WatchPts on Addr. Ranges:4                                  
  118.   Coherent Host Access:    FALSE                              
  119.   Memory Properties:       APU
  120.   Features:                KERNEL_DISPATCH
  121.   Fast F16 Operation:      TRUE                              
  122.   Wavefront Size:          32(0x20)                          
  123.   Workgroup Max Size:      1024(0x400)                        
  124.   Workgroup Max Size per Dimension:
  125.     x                        1024(0x400)                        
  126.     y                        1024(0x400)                        
  127.     z                        1024(0x400)                        
  128.   Max Waves Per CU:        32(0x20)                          
  129.   Max Work-item Per CU:    1024(0x400)                        
  130.   Grid Max Size:           4294967295(0xffffffff)            
  131.   Grid Max Size per Dimension:
  132.     x                        4294967295(0xffffffff)            
  133.     y                        4294967295(0xffffffff)            
  134.     z                        4294967295(0xffffffff)            
  135.   Max fbarriers/Workgrp:   32                                
  136.   Packet Processor uCode:: 22                                
  137.   SDMA engine uCode::      9                                  
  138.   IOMMU Support::          None                              
  139.   Pool Info:              
  140.     Pool 1                  
  141.       Segment:                 GLOBAL; FLAGS: COARSE GRAINED      
  142.       Size:                    65475328(0x3e71300) KB            
  143.       Allocatable:             TRUE                              
  144.       Alloc Granule:           4KB                                
  145.       Alloc Recommended Granule:2048KB                            
  146.       Alloc Alignment:         4KB                                
  147.       Accessible by all:       FALSE                              
  148.     Pool 2                  
  149.       Segment:                 GLOBAL; FLAGS: EXTENDED FINE GRAINED
  150.       Size:                    65475328(0x3e71300) KB            
  151.       Allocatable:             TRUE                              
  152.       Alloc Granule:           4KB                                
  153.       Alloc Recommended Granule:2048KB                            
  154.       Alloc Alignment:         4KB                                
  155.       Accessible by all:       FALSE                              
  156.     Pool 3                  
  157.       Segment:                 GROUP                              
  158.       Size:                    64(0x40) KB                        
  159.       Allocatable:             FALSE                              
  160.       Alloc Granule:           0KB                                
  161.       Alloc Recommended Granule:0KB                                
  162.       Alloc Alignment:         0KB                                
  163.       Accessible by all:       FALSE                              
  164.   ISA Info:                
  165.     ISA 1                    
  166.       Name:                    amdgcn-amd-amdhsa--gfx1036        
  167.       Machine Models:          HSA_MACHINE_MODEL_LARGE            
  168.       Profiles:                HSA_PROFILE_BASE                  
  169.       Default Rounding Mode:   NEAR                              
  170.       Default Rounding Mode:   NEAR                              
  171.       Fast f16:                TRUE                              
  172.       Workgroup Max Size:      1024(0x400)                        
  173.       Workgroup Max Size per Dimension:
  174.         x                        1024(0x400)                        
  175.         y                        1024(0x400)                        
  176.         z                        1024(0x400)                        
  177.       Grid Max Size:           4294967295(0xffffffff)            
  178.       Grid Max Size per Dimension:
  179.         x                        4294967295(0xffffffff)            
  180.         y                        4294967295(0xffffffff)            
  181.         z                        4294967295(0xffffffff)            
  182.       FBarrier Max Size:       32                                
  183.     ISA 2                    
  184.       Name:                    amdgcn-amd-amdhsa--gfx10-3-generic
  185.       Machine Models:          HSA_MACHINE_MODEL_LARGE            
  186.       Profiles:                HSA_PROFILE_BASE                  
  187.       Default Rounding Mode:   NEAR                              
  188.       Default Rounding Mode:   NEAR                              
  189.       Fast f16:                TRUE                              
  190.       Workgroup Max Size:      1024(0x400)                        
  191.       Workgroup Max Size per Dimension:
  192.         x                        1024(0x400)                        
  193.         y                        1024(0x400)                        
  194.         z                        1024(0x400)                        
  195.       Grid Max Size:           4294967295(0xffffffff)            
  196.       Grid Max Size per Dimension:
  197.         x                        4294967295(0xffffffff)            
  198.         y                        4294967295(0xffffffff)            
  199.         z                        4294967295(0xffffffff)            
  200.       FBarrier Max Size:       32                                
  201. *** Done ***  
  202.  
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement