Skip to content

diaslui/enem-extractor

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

53 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Enem Extractor

en PyPI version Downloads PyPI - Python Version License Issues

English version

⭐ Star this project to support!

Enem Extractor é uma ferramenta CLI que extrai/corrige questões de provas do ENEM e as converte em JSON mantendo assets (imagens, gráficos, etc.)

🏓 Veja uma prova extraida pelo Enem Extractor no mundo real aqui

🗝️ Provas Extraídas

Neste repositório você pode encontrar todas as provas do Enem em JSON extraídas pelo Enem Extractor. Clique aqui para ver.

🎯 Aplicações

  • Machine Learning: Treine modelos de IA com questões do ENEM.

  • Web Apps: Crie aplicativos web para estudantes com questões do ENEM.

  • Banco de Questões: Crie ou Alimente bancos de questões com questões do ENEM.

🚀 Rodando

Para rodar esse projeto você precisa ter o Python (3.6+) e o pip instalados. Você pode baixar o Python aqui.

1. Instale o Enem Extractor

Para rodar o Enem Extractor via pip, execute o seguinte comando no terminal:

pip install enem

2. Extraia uma prova

Após a instalação, você pode extrair questões de uma prova em formato PDF. Supondo que você tenha um arquivo de prova do ENEM chamado prova.pdf no mesmo diretório, basta rodar:

python -m enem prova.pdf

O script irá analisar a prova e extrair as questões, gerando uma pasta com um arquivo de saída em JSON com os dados extraídos e outros assets da prova. Veja mais detalhes da saída do comando aqui.

3. Parâmetros adicionais

Você pode fornecer parâmetros adicionais para personalizar o processo de extração:

  • -f ou --file: Caminho para o arquivo PDF da prova. (obrigatório)
  • -g ou --key: Caminho para o arquivo PDF do gabarito. (opcional)
  • -o ou --output: Caminho onde a pasta dos arquivos extraídos será criada. (opcional)
  • -m ou --minimal: Extração mínima, sem detalhamento de fontes de texto e espaçamento. (opcional)

Exemplo de uso com parâmetros:

python -m enem -f prova.pdf -g gabarito.pdf -o C:\documents

Este comando irá extrair as questões da prova prova.pdf, corrigir com o gabarito gabarito.pdf e salvar a pasta dos resultados em C:\documents.

Saída

Aprenda sobre as saídas que da extração clicando aqui.

demo_enem

🔧 Como Contribuir

  1. Faça um fork deste repositório.
  2. Crie uma venv (python -m venv venv) e ative-a (source venv/bin/activate ou venv/script/activate).
  3. Instale as dependências (pip install -r requirements.txt).
  4. Faça as alterações desejadas, instale o pacote localmente (pip install -e .) e teste.
  5. Faça o commit das suas alterações (git commit -am 'Adiciona nova funcionalidade').
  6. Crie uma branch para a sua modificação (git checkout -b feature/nova-funcionalidade).
  7. Faça suas alterações e commit (git commit -am 'Adiciona nova funcionalidade').
  8. Envie para o repositório original (git push origin feature/nova-funcionalidade).
  9. Crie um novo Pull Request.

📜 Licença

Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para mais detalhes.

📚 Links Úteis


📢 Issues

Caso você tenha alguma dúvida, queira sugerir melhorias ou encontre problemas, fique à vontade para abrir um issue.

🌀 Subdependências

Created with ❤️ by Pedro L. Dias

About

Um CLI que extrai questões de provas do ENEM em JSON.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Sponsor this project

Packages

 
 
 

Contributors

Languages