SHARE
TWEET

cssStyleList.py (xml.minidom)

gabalese Apr 16th, 2012 74 Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
  1. #! /usr/bin/env python
  2. import os, glob
  3. from xml.dom import minidom
  4.  
  5. path = "OEBPS/Text" # your mileage may vary
  6. list = []
  7. new_list = []
  8.  
  9. def cssList():
  10.  
  11.         for infile in glob.glob(os.path.join(path, '*html')):
  12.                 html = minidom.parse(infile)
  13.                
  14.                 for node in html.getElementsByTagName('p'):
  15.                         list.append(node.getAttribute('class'))
  16.                         list.append(node.getAttribute('style'))
  17.                        
  18.                 for node in html.getElementsByTagName('div'):
  19.                         list.append(node.getAttribute('class'))
  20.                         list.append(node.getAttribute('style'))
  21.                        
  22.                 for node in html.getElementsByTagName('span'):
  23.                         list.append(node.getAttribute('class'))
  24.                         list.append(node.getAttribute('style'))
  25.                        
  26.                 for node in html.getElementsByTagName('i'):
  27.                         list.append(node.getAttribute('class'))
  28.                         list.append(node.getAttribute('style'))
  29.                        
  30.                 for node in html.getElementsByTagName('em'):
  31.                         list.append(node.getAttribute('class'))
  32.                         list.append(node.getAttribute('style'))
  33.                        
  34.                 for node in html.getElementsByTagName('strong'):
  35.                         list.append(node.getAttribute('class'))
  36.                         list.append(node.getAttribute('style'))
  37.                        
  38.                 for node in html.getElementsByTagName('b'):
  39.                         list.append(node.getAttribute('class'))
  40.                         list.append(node.getAttribute('style'))
  41.                        
  42.                 # add tags as required...
  43.                
  44.                 for i in list:
  45.                         if i not in new_list:
  46.                                 if i is not None:
  47.                                         if i:
  48.                                                 new_list.append(i)
  49.         return new_list
  50.        
  51. if __name__ == "__main__":
  52.         for item in (cssList()):
  53.                 print item
RAW Paste Data
Top