Pastebin
API
tools
faq
paste
Login
Sign up
Please fix the following errors:
New Paste
Syntax Highlighting
""" ========================================================================================= TREINADOR DE REDE NEURAL (CNN) - OCR ========================================================================================= ARQUIVO DE ATIVIDADE: PREENCHA AS LACUNAS (TODO) ----------------------------------------------------------------------------------------- Este script já possui: 1. O carregamento das imagens da pasta 'dataset_limpo'. 2. O pré-processamento (normalização, redimensionamento). 3. A geração automática de relatórios e gráficos no final. SUA MISSÃO: Você é o arquiteto do cérebro da IA. Você deve projetar as camadas (criar_modelo_cnn) e iniciar o treinamento (.fit). Siga os comentários marcados com 'TODO'. ========================================================================================= """ import os import cv2 import numpy as np import matplotlib.pyplot as plt import seaborn as sns from sklearn.model_selection import train_test_split from sklearn.metrics import confusion_matrix from tensorflow.keras.utils import to_categorical from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout from tensorflow.keras.preprocessing.image import ImageDataGenerator from tensorflow.keras.callbacks import EarlyStopping, ReduceLROnPlateau # --- CONFIGURAÇÕES GLOBAIS --- PASTA_DATASET = "dataset_limpo" PASTA_RELATORIO = "relatorio_final" TAMANHO_IMAGEM = (128, 128) NUM_CLASSES = 12 # A-F e 0-5 CLASSES_NOMES = ['A', 'B', 'C', 'D', 'E', 'F', '0', '1', '2', '3', '4', '5'] os.makedirs(PASTA_RELATORIO, exist_ok=True) # ============================================================================== # 1. PREPARAÇÃO DOS DADOS (JÁ IMPLEMENTADO - NÃO MEXER) # ============================================================================== def processar_imagem(caminho_imagem): img = cv2.imread(caminho_imagem, cv2.IMREAD_GRAYSCALE) if img is None: return None img = cv2.resize(img, TAMANHO_IMAGEM, interpolation=cv2.INTER_AREA) img = img / 255.0 # Normalização img = 1.0 - img # Inversão return img def carregar_dados(): print("\n--- 1. CARREGANDO IMAGENS ---") X_data = [] Y_data = [] mapa_rotulos = {name: i for i, name in enumerate(CLASSES_NOMES)} for rotulo_nome, rotulo_idx in mapa_rotulos.items(): pasta_caractere = os.path.join(PASTA_DATASET, rotulo_nome) if not os.path.isdir(pasta_caractere): continue arquivos = [f for f in os.listdir(pasta_caractere) if f.lower().endswith(('png', 'jpg', 'jpeg'))] print(f"-> Lendo classe '{rotulo_nome}': {len(arquivos)} imagens.") for nome_arquivo in arquivos: caminho = os.path.join(pasta_caractere, nome_arquivo) matriz = processar_imagem(caminho) if matriz is not None: X_data.append(matriz) Y_data.append(rotulo_idx) X_data = np.array(X_data) Y_data = np.array(Y_data) X_data = np.expand_dims(X_data, axis=-1) # Adiciona canal de cor (1) Y_data_one_hot = to_categorical(Y_data, num_classes=NUM_CLASSES) return train_test_split(X_data, Y_data_one_hot, test_size=0.2, random_state=42) # ============================================================================== # 2. ARQUITETURA DA REDE (SUA MISSÃO: COMPLETAR O CÓDIGO) # ============================================================================== def criar_modelo_cnn(): # Inicializa um modelo sequencial (uma pilha de camadas) model = Sequential() print("--- 2. CONSTRUINDO O CÉREBRO DA IA ---") # --- TODO 1: DEFINA AS CAMADAS (O CÉREBRO) --- # Uma CNN funciona como um funil: Começa vendo detalhes (bordas) e termina vendo conceitos (letras). # PASSO A: Camada de Entrada (A Visão) # Adicione uma camada Conv2D. # ATENÇÃO: Só a primeira camada precisa do argumento 'input_shape'. # Nossas imagens são (128, 128, 1). # Exemplo: model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(128, 128, 1))) # model.add(...) # <--- Descomente e preencha ou copie o exemplo acima # PASSO B: Camada de Resumo (Pooling) # Adicione um MaxPooling2D para reduzir o tamanho da imagem pela metade. # Isso torna o processamento mais rápido. # model.add(MaxPooling2D((2, 2))) # PASSO C: Mais camadas de processamento (Repetição) # Adicione mais um bloco Conv2D + MaxPooling2D. # DICA: Aumente o número de filtros (ex: de 32 para 64) para a IA ver detalhes mais complexos. # model.add(...) # Conv2D com 64 filtros # model.add(...) # MaxPooling2D # PASSO D: A Tradução (Flatten) # As camadas Conv2D são 3D (altura, largura, filtros). # As camadas de decisão (Dense) são 1D (lista de números). # Precisamos "achatar" a imagem. Pesquise sobre a camada 'Flatten'. # model.add(...) # PASSO E: O Raciocínio (Dense) # Adicione uma camada Dense com 128 neurônios e ativação 'relu'. # Adicione um Dropout(0.5) para evitar que a IA "decore" a prova. # model.add(...) # model.add(...) # PASSO F: A Resposta Final (Saída) # A última camada DEVE ter o mesmo número de neurônios que as classes (12). # A ativação DEVE ser 'softmax' (para dar a % de probabilidade de cada letra). # USE A VARIÁVEL 'NUM_CLASSES' AQUI, NÃO DIGITE '12' DIRETAMENTE. # model.add(...) # --- TODO 2: COMPILE O MODELO (AS REGRAS DO JOGO) --- # Precisamos dizer como a IA deve aprender. # Pesquise: "keras compile categorical crossentropy adam" # Preencha os parâmetros abaixo: # optimizer= ? (Sugestão: 'adam') # loss= ? (Sugestão: 'categorical_crossentropy' -> pois temos várias categorias) # metrics= ? (Sugestão: ['accuracy']) # model.compile(optimizer=..., loss=..., metrics=...) return model # ============================================================================== # 3. RELATÓRIOS E GRÁFICOS (JÁ IMPLEMENTADO) # ============================================================================== def salvar_graficos_historico(history): acc = history.history['accuracy'] val_acc = history.history['val_accuracy'] loss = history.history['loss'] val_loss = history.history['val_loss'] epochs_range = range(len(acc)) plt.figure(figsize=(14, 5)) plt.subplot(1, 2, 1) plt.plot(epochs_range, acc, label='Treino (Estudo)') plt.plot(epochs_range, val_acc, label='Validação (Prova)') plt.legend(loc='lower right') plt.title('Acurácia') plt.grid(True) plt.subplot(1, 2, 2) plt.plot(epochs_range, loss, label='Treino') plt.plot(epochs_range, val_loss, label='Validação') plt.legend(loc='upper right') plt.title('Loss (Erro)') plt.grid(True) caminho = os.path.join(PASTA_RELATORIO, "grafico_evolucao.png") plt.savefig(caminho) print(f"[Relatório] Gráfico salvo em: {caminho}") def salvar_matriz_confusao(model, X_test, Y_test): Y_pred_probs = model.predict(X_test) Y_pred = np.argmax(Y_pred_probs, axis=1) Y_true = np.argmax(Y_test, axis=1) cm = confusion_matrix(Y_true, Y_pred) plt.figure(figsize=(10, 8)) sns.heatmap(cm, annot=True, fmt='d', cmap='Blues', xticklabels=CLASSES_NOMES, yticklabels=CLASSES_NOMES) plt.xlabel('IA Previu') plt.ylabel('Real') plt.title('Matriz de Confusão') caminho = os.path.join(PASTA_RELATORIO, "matriz_confusao.png") plt.savefig(caminho) print(f"[Relatório] Matriz salva em: {caminho}") def salvar_previsoes_visuais(model, X_test, Y_test): indices = np.random.choice(len(X_test), 15, replace=False) plt.figure(figsize=(15, 8)) plt.suptitle("Teste Visual (Verde=Acerto, Vermelho=Erro)", fontsize=16) for i, idx in enumerate(indices): img = X_test[idx] label_real = CLASSES_NOMES[np.argmax(Y_test[idx])] pred_probs = model.predict(np.expand_dims(img, axis=0), verbose=0) pred_label = CLASSES_NOMES[np.argmax(pred_probs)] conf = np.max(pred_probs) * 100 cor = 'green' if label_real == pred_label else 'red' plt.subplot(3, 5, i + 1) plt.imshow(img.squeeze(), cmap='gray') plt.axis('off') plt.title(f"Real: {label_real}\nIA: {pred_label} ({conf:.1f}%)", color=cor, fontsize=10, fontweight='bold') plt.tight_layout() caminho = os.path.join(PASTA_RELATORIO, "exemplos_visuais.png") plt.savefig(caminho) print(f"[Relatório] Exemplos salvos em: {caminho}") def salvar_resumo_texto(score_loss, score_acc): caminho = os.path.join(PASTA_RELATORIO, "resumo_metricas.txt") with open(caminho, "w") as f: f.write(f"Acurácia Final: {score_acc*100:.2f}%\nPerda Final: {score_loss:.4f}\n") print(f"[Relatório] Resumo salvo em: {caminho}") # ============================================================================== # 4. EXECUÇÃO PRINCIPAL # ============================================================================== if __name__ == "__main__": # 1. Carregar Dados X_train, X_test, Y_train, Y_test = carregar_dados() print(f"\n[Status] Dataset carregado. Treino: {X_train.shape}, Teste: {X_test.shape}") # 2. Criar Modelo modelo = criar_modelo_cnn() # Validação pedagógica (Checagem de erro) if not hasattr(modelo, 'optimizer') or modelo.optimizer is None: print("\n[ERRO FATAL] O modelo não foi compilado!") print("Vá até a função 'criar_modelo_cnn' e complete o TODO 2 (model.compile).") exit() try: modelo.summary() except ValueError: print("\n[ERRO FATAL] O modelo não tem camadas!") print("Vá até a função 'criar_modelo_cnn' e complete o TODO 1 (model.add).") exit() # 3. Data Augmentation print("\n--- 3. CONFIGURANDO DATA AUGMENTATION ---") datagen = ImageDataGenerator( rotation_range=15, width_shift_range=0.1, height_shift_range=0.1, zoom_range=0.15, shear_range=0.1, fill_mode='nearest' ) callbacks = [ EarlyStopping(patience=5, monitor='val_loss', restore_best_weights=True), ReduceLROnPlateau(patience=3, factor=0.5, monitor='val_loss') ] # --- TODO 3: INICIAR O TREINAMENTO (DAR PLAY) --- print("\n--- 4. INICIANDO TREINAMENTO ---") # Aqui conectamos tudo: imagens (datagen), respostas (Y_train) e regras (callbacks). # Preencha os argumentos da função .fit(): # historico = modelo.fit( # datagen.flow(X_train, Y_train, batch_size=32), # Onde estão as imagens de treino? # epochs= ?, # Quantas vezes a IA vai ler o dataset? (Tente 40) # validation_data=(?, ?), # Onde estão os dados de prova? (X_test, Y_test) # callbacks=callbacks # Regras de parada # ) # historico = modelo.fit(...) # --- 5. SALVAMENTO E RELATÓRIO --- if 'historico' in locals(): print("\n--- 5. GERANDO RELATÓRIO FINAL ---") caminho_modelo = os.path.join(PASTA_RELATORIO, 'modelo_ocr_v1.h5') modelo.save(caminho_modelo) print(f"[Sucesso] Modelo salvo em: {caminho_modelo}") loss, acc = modelo.evaluate(X_test, Y_test, verbose=0) salvar_resumo_texto(loss, acc) salvar_graficos_historico(historico) salvar_matriz_confusao(modelo, X_test, Y_test) salvar_previsoes_visuais(modelo, X_test, Y_test) print(f"\n[FIM] Tudo pronto! Verifique a pasta '{PASTA_RELATORIO}'") else: print("\n[ERRO] A variável 'historico' não existe.") print("Você esqueceu de implementar o 'modelo.fit' no TODO 3?")
Optional Paste Settings
Category:
None
Cryptocurrency
Cybersecurity
Fixit
Food
Gaming
Haiku
Help
History
Housing
Jokes
Legal
Money
Movies
Music
Pets
Photo
Science
Software
Source Code
Spirit
Sports
Travel
TV
Writing
Tags:
Syntax Highlighting:
None
Bash
C
C#
C++
CSS
HTML
JSON
Java
JavaScript
Lua
Markdown (PRO members only)
Objective C
PHP
Perl
Python
Ruby
Swift
4CS
6502 ACME Cross Assembler
6502 Kick Assembler
6502 TASM/64TASS
ABAP
AIMMS
ALGOL 68
APT Sources
ARM
ASM (NASM)
ASP
ActionScript
ActionScript 3
Ada
Apache Log
AppleScript
Arduino
Asymptote
AutoIt
Autohotkey
Avisynth
Awk
BASCOM AVR
BNF
BOO
Bash
Basic4GL
Batch
BibTeX
Blitz Basic
Blitz3D
BlitzMax
BrainFuck
C
C (WinAPI)
C Intermediate Language
C for Macs
C#
C++
C++ (WinAPI)
C++ (with Qt extensions)
C: Loadrunner
CAD DCL
CAD Lisp
CFDG
CMake
COBOL
CSS
Ceylon
ChaiScript
Chapel
Clojure
Clone C
Clone C++
CoffeeScript
ColdFusion
Cuesheet
D
DCL
DCPU-16
DCS
DIV
DOT
Dart
Delphi
Delphi Prism (Oxygene)
Diff
E
ECMAScript
EPC
Easytrieve
Eiffel
Email
Erlang
Euphoria
F#
FO Language
Falcon
Filemaker
Formula One
Fortran
FreeBasic
FreeSWITCH
GAMBAS
GDB
GDScript
Game Maker
Genero
Genie
GetText
Go
Godot GLSL
Groovy
GwBasic
HQ9 Plus
HTML
HTML 5
Haskell
Haxe
HicEst
IDL
INI file
INTERCAL
IO
ISPF Panel Definition
Icon
Inno Script
J
JCL
JSON
Java
Java 5
JavaScript
Julia
KSP (Kontakt Script)
KiXtart
Kotlin
LDIF
LLVM
LOL Code
LScript
Latex
Liberty BASIC
Linden Scripting
Lisp
Loco Basic
Logtalk
Lotus Formulas
Lotus Script
Lua
M68000 Assembler
MIX Assembler
MK-61/52
MPASM
MXML
MagikSF
Make
MapBasic
Markdown (PRO members only)
MatLab
Mercury
MetaPost
Modula 2
Modula 3
Motorola 68000 HiSoft Dev
MySQL
Nagios
NetRexx
Nginx
Nim
NullSoft Installer
OCaml
OCaml Brief
Oberon 2
Objeck Programming Langua
Objective C
Octave
Open Object Rexx
OpenBSD PACKET FILTER
OpenGL Shading
Openoffice BASIC
Oracle 11
Oracle 8
Oz
PARI/GP
PCRE
PHP
PHP Brief
PL/I
PL/SQL
POV-Ray
ParaSail
Pascal
Pawn
Per
Perl
Perl 6
Phix
Pic 16
Pike
Pixel Bender
PostScript
PostgreSQL
PowerBuilder
PowerShell
ProFTPd
Progress
Prolog
Properties
ProvideX
Puppet
PureBasic
PyCon
Python
Python for S60
QBasic
QML
R
RBScript
REBOL
REG
RPM Spec
Racket
Rails
Rexx
Robots
Roff Manpage
Ruby
Ruby Gnuplot
Rust
SAS
SCL
SPARK
SPARQL
SQF
SQL
SSH Config
Scala
Scheme
Scilab
SdlBasic
Smalltalk
Smarty
StandardML
StoneScript
SuperCollider
Swift
SystemVerilog
T-SQL
TCL
TeXgraph
Tera Term
TypeScript
TypoScript
UPC
Unicon
UnrealScript
Urbi
VB.NET
VBScript
VHDL
VIM
Vala
Vedit
VeriLog
Visual Pro Log
VisualBasic
VisualFoxPro
WHOIS
WhiteSpace
Winbatch
XBasic
XML
XPP
Xojo
Xorg Config
YAML
YARA
Z80 Assembler
ZXBasic
autoconf
jQuery
mIRC
newLISP
q/kdb+
thinBasic
Paste Expiration:
Never
Burn after read
10 Minutes
1 Hour
1 Day
1 Week
2 Weeks
1 Month
6 Months
1 Year
Paste Exposure:
Public
Unlisted
Private
Folder:
(members only)
Password
NEW
Enabled
Disabled
Burn after read
NEW
Paste Name / Title:
Create New Paste
Hello
Guest
Sign Up
or
Login
Sign in with Facebook
Sign in with Twitter
Sign in with Google
You are currently not logged in, this means you can not edit or delete anything you paste.
Sign Up
or
Login
Public Pastes
Untitled
Python | 1 hour ago | 0.13 KB
Decentralized Moneys
1 hour ago | 0.42 KB
120 million in 5 years
3 hours ago | 0.12 KB
December smells like money
3 hours ago | 0.07 KB
Crypto Liquidity Pools
3 hours ago | 0.47 KB
Trustless Finance
3 hours ago | 0.51 KB
The Lunar Kitsune - Yohana Tsukiko
4 hours ago | 21.38 KB
Crypto profits are insane
4 hours ago | 0.12 KB
We use cookies for various purposes including analytics. By continuing to use Pastebin, you agree to our use of cookies as described in the
Cookies Policy
.
OK, I Understand
Not a member of Pastebin yet?
Sign Up
, it unlocks many cool features!