import java.io.File;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Arrays;
import java.util.Collections;
import java.util.List;

import LBJ2.parse.Parser;

/**
 * Reads documents, given a directory
 */
public class DocumentReader implements Parser {

    private final List files;
    private int currentFileId;

    public DocumentReader(String directory) {
        File d = new File(directory);

        if (!d.exists()) {
            System.err.println(directory + " does not exist!");
            System.exit(-1);
        }

        if (!d.isDirectory()) {
            System.err.println(directory + " is not a directory!");
            System.exit(-1);
        }

        files = new ArrayList();
        for (File f : d.listFiles()) {
            if (f.isDirectory()) {
                files.addAll(Arrays.asList(f.listFiles()));
            }
        }

        Collections.shuffle(files);
        currentFileId = 0;
    }

    public void close() {
    }

    /**
    * Notice that this relies on the files having the label in their paths, as in
    *        data/spam/train/[label]/[filename].txt
    */
    public Object next() {
        if (currentFileId < files.size()) {
            File file = files.get(currentFileId++);
            String[] split = file.getPath().split(File.separator);
            String label = split[split.length - 2];
            try {
                return new Document(file, label);
            } catch (IOException e) {
                e.printStackTrace();
                System.exit(-1);
                return null;
            }
        } else {
            return null;
        }
    }

    public void reset() {
        currentFileId = 0;
    }
}