daily pastebin goal
56%
SHARE
TWEET

cssStyleList.py (xml.minidom)

gabalese Apr 16th, 2012 76 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. #! /usr/bin/env python
  2. import os, glob
  3. from xml.dom import minidom
  4.  
  5. path = "OEBPS/Text" # your mileage may vary
  6. list = []
  7. new_list = []
  8.  
  9. def cssList():
  10.  
  11.         for infile in glob.glob(os.path.join(path, '*html')):
  12.                 html = minidom.parse(infile)
  13.                
  14.                 for node in html.getElementsByTagName('p'):
  15.                         list.append(node.getAttribute('class'))
  16.                         list.append(node.getAttribute('style'))
  17.                        
  18.                 for node in html.getElementsByTagName('div'):
  19.                         list.append(node.getAttribute('class'))
  20.                         list.append(node.getAttribute('style'))
  21.                        
  22.                 for node in html.getElementsByTagName('span'):
  23.                         list.append(node.getAttribute('class'))
  24.                         list.append(node.getAttribute('style'))
  25.                        
  26.                 for node in html.getElementsByTagName('i'):
  27.                         list.append(node.getAttribute('class'))
  28.                         list.append(node.getAttribute('style'))
  29.                        
  30.                 for node in html.getElementsByTagName('em'):
  31.                         list.append(node.getAttribute('class'))
  32.                         list.append(node.getAttribute('style'))
  33.                        
  34.                 for node in html.getElementsByTagName('strong'):
  35.                         list.append(node.getAttribute('class'))
  36.                         list.append(node.getAttribute('style'))
  37.                        
  38.                 for node in html.getElementsByTagName('b'):
  39.                         list.append(node.getAttribute('class'))
  40.                         list.append(node.getAttribute('style'))
  41.                        
  42.                 # add tags as required...
  43.                
  44.                 for i in list:
  45.                         if i not in new_list:
  46.                                 if i is not None:
  47.                                         if i:
  48.                                                 new_list.append(i)
  49.         return new_list
  50.        
  51. if __name__ == "__main__":
  52.         for item in (cssList()):
  53.                 print item
RAW Paste Data
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the Cookies Policy. OK, I Understand
 
Top