Advertisement
Not a member of Pastebin yet?
Sign Up,
it unlocks many cool features!
- import pandas as pd
- import numpy as np
- lista = pd.read_csv('sequencias.txt', delimiter=' ', usecols= range(1, 15), dtype={'col':np.float}).values
- lista = lista[0:200000]#Aqui pode ser configurada uma amostra de dados num range de linhas, como por exempo de 0 a 200000
- #caso queira usar todas as linhas, comente o codigo com um #
- #lista = [[0, 3, 6, 9, 12], [2, 2, 4, 6, 8], [10, 20, 30], [21, 22, 23, 24, 25, 26, 27]] #lista usada para testes
- duplicados = []
- sequencia = input("Digite a sequencia minima:\n")
- sequencia = int(sequencia)
- if sequencia > 1:
- for index, item in enumerate(lista):
- if len(item) >= sequencia:
- for i in range(0, len(item) - 1):
- quantSequencia = 0
- intervalo = 1
- #pend = False #codigo comentado era usado para fazer um intervalo variável para identificar sequencias diferentes como 3, 6, 9 ou 10, 20, 30
- continuar = True
- for i2 in range(0, sequencia - 1):
- if (item[i2] + intervalo == item[i2 + 1]):
- quantSequencia += 1
- #if pend:
- #quantSequencia += 1
- #pend = False
- if quantSequencia == sequencia - 1:
- duplicados.append(lista[index].tolist())
- continuar = False
- break
- #else:
- #intervalo = item[i2 + 1] - item[i2]
- #pend = True
- if continuar == False:
- break
- resultado = [x for x in lista if x.tolist() not in duplicados]
- #excreve o resultado no arquivo resultado.txt que ficara localizado na mesma pasta de execução
- with open('resultado.txt', 'w') as f:
- for item in resultado:
- f.write("%s\n" % item)
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement