Advertisement
Guest User

Untitled

a guest
Nov 6th, 2014
138
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Scala 2.74 KB | None | 0 0
  1.     val dataset = sc.newAPIHadoopFile[Text, Text, TeraInputFormat](inputFile)  
  2.     printf("Input size: %d\n", dataset.count())                                                                          
  3.                                                                                
  4.     val output = dataset.mapPartitions( iter => {                                                                        
  5.       val ERROR = new Text("error")                                            
  6.       val CHECKSUM = new Text("checksum")                                                                                
  7.       val compare = new Comparator()                                            
  8.       var res = List.newBuilder[(Text, Text)]                                                                            
  9.                                                                                                                          
  10.       if (iter.isEmpty) {                                                      
  11.         res.+=((new Text(inputFile + ":empty"), new Text("")))                                                          
  12.         res.result().iterator                                                                                            
  13.       }                                                                        
  14.       iter.sliding(2).foreach{ case Seq(prev, curr) => {                        
  15.         if (compare.compare(prev._1, curr._1) < 0) {                                                                    
  16.           res.+=((ERROR,                                                        
  17.             new Text("misorder in " + inputFile +                              
  18.               " between " + prev.toString +                                    
  19.               " and " + curr.toString)))                                                                                
  20.         } else {                                                                                                        
  21.           res.+=((new Text("SUCCESS"),                                          
  22.             new Text("order in " + inputFile +                                  
  23.               " between " + prev.toString +                                    
  24.               " and " + curr.toString)))                                                                                
  25.         }                                                                                                                
  26.       }}                                                                                                                
  27.       res.result().iterator                                                                                              
  28.     })
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement