Vietnamese License Plate Recognition Pipeline

Mô tả dự án

Hệ thống nhận diện biển số xe máy/ô tô Việt Nam từ ảnh hoặc video, được xây dựng với pipeline xử lý tiên tiến:

Pipeline xử lý

Tăng cường ảnh (Enhancement): Sử dụng PReNet để khử mưa và tăng chất lượng ảnh
Phát hiện biển số (Detection): Sử dụng YOLOv11 fine-tuned cho biển số Việt Nam
Nhận diện ký tự (OCR): Sử dụng PaddleOCR để đọc ký tự trên biển số
Lưu trữ dữ liệu: Kết quả được lưu vào SQL Server với khả năng tránh trùng lặp
Giao diện web: Upload ảnh/video và xem kết quả trực tiếp

Tính năng chính

Xử lý cả ảnh và video
Tăng cường chất lượng ảnh trong điều kiện mưa
Phát hiện chính xác biển số Việt Nam
OCR với độ chính xác cao
Giao diện web thân thiện
Tìm kiếm biển số đã nhận diện
Tránh lưu trùng lặp dữ liệu

Cấu trúc dự án

ViTraLP/
├── Backend Servers (FastAPI)
│   ├── main_test.py                    # Server chính với ROI processing
│   ├── main_full_image.py              # Server xử lý toàn bộ ảnh
│   ├── main_half_bottom.py             # Server xử lý nửa dưới ảnh
│   └── requirements.txt                 # Thư viện Python cần thiết
│
├── Core Modules
│   ├── enhancement_prenet_crop.py      # Module tăng cường ảnh PReNet
│   ├── yolo_detect.py                  # Module phát hiện biển số YOLO
│   ├── ocr_infer.py                    # Module OCR PaddleOCR
│   ├── license_plate_validator.py      # Validator biển số Việt Nam
│   ├── networks.py                      # Kiến trúc mạng PReNet
│   └── utils.py                         # Tiện ích hỗ trợ
│
├── Frontend (React)
│   └── UI/my-app/
│       ├── src/App.js                   # Giao diện chính
│       ├── package.json                 # Dependencies React
│       └── README.md                    # Hướng dẫn frontend
│
├── Outputs
│   ├── outputs/enhanced/                # Ảnh đã tăng cường
│   ├── outputs/crops/                   # Ảnh crop biển số
│   ├── output_yolo_crop_test/           # Ảnh crop test
│   └── uploaded_images/                 # Ảnh upload tạm thời
│
├── Models & Weights
│   ├── yolo_finetuned_weights/          # YOLO weights fine-tuned
│   ├── original_weights_paddle/         # PaddleOCR weights
│   └── original_weights_paddle.zip      # PaddleOCR weights (zipped)
│
├── Notebooks & Testing
│   ├── test_pipeline.ipynb              # Test pipeline
│   └── Inference_prenet.ipynb           # Test PReNet
│
└── Documentation & Config
    ├── Readme.md                        # File này
    ├── environment.yml                   # Conda environment
    ├── .gitignore                       # Git ignore rules
    ├── structure                        # Cấu trúc dự án gốc
    └── config/                          # Thư mục cấu hình

Hướng dẫn cài đặt & chạy

Yêu cầu hệ thống

Python: 3.10.16
Node.js: 16+ (cho frontend)
SQL Server: Để lưu trữ dữ liệu
RAM: Tối thiểu 16GB
GPU: Khuyến nghị có GPU để tăng tốc độ xử lý

Cài đặt Backend

1. Tạo môi trường Python

# Tạo conda environment (khuyến nghị)
conda env create -f environment.yml

# Hoặc tạo môi trường mới
conda create -n vitralp python=3.10.16
conda activate vitralp

2. Cài đặt dependencies

pip install -r requirements.txt

3. Tải pretrained weights

Tải các file weights từ Google Drive:

yolo11_medium_rainy_200_best.pth → Đặt trong yolo_finetuned_weights/
original_weights_paddle.pth → Đặt trong original_weights_paddle/
finetuning.zip → Giải nén cho PReNet

4. Cấu hình SQL Server

Chỉnh sửa thông tin kết nối trong các file server:

def get_db_connection():
    conn = pyodbc.connect(
        "DRIVER={ODBC Driver 17 for SQL Server};"
        "SERVER=YOUR_SERVER_NAME;"      # Thay đổi
        "DATABASE=YOUR_DATABASE_NAME;"   # Thay đổi
        "UID=YOUR_USERNAME;"             # Thay đổi
        "PWD=YOUR_PASSWORD;"             # Thay đổi
    )
    return conn

5. Tạo bảng SQL Server

CREATE TABLE DETECTED_NUMBER (
    ID INT IDENTITY(1,1) PRIMARY KEY,
    Recognized_Text NVARCHAR(50) NOT NULL,
    Enhanced_File_Path NVARCHAR(500) NOT NULL,
    Created_At DATETIME DEFAULT GETDATE()
);

6. Chạy server

Có 3 lựa chọn server tùy theo nhu cầu:

Server chính (ROI processing):

python main_test.py

Server xử lý toàn ảnh:

python main_full_image.py

Server xử lý nửa dưới:

python main_half_bottom.py

Server chạy tại: http://localhost:8001
API docs: http://localhost:8001/docs

Cài đặt Frontend

1. Cài đặt dependencies

cd UI/my-app
npm install

2. Chạy development server

npm start

Giao diện web: http://localhost:3000

🔌 API Endpoints

`POST /process`

Xử lý upload ảnh/video

Request:

Method: POST
Content-Type: multipart/form-data
Body: File ảnh (.jpg, .jpeg, .png, .bmp) hoặc video (.mp4, .avi, .mov, .mkv)

Response:

{
  "processing_time_seconds": 2.45,
  "enhanced_files": [
    "enhanced/51A-9763_0.png",
    "enhanced/30A-12345_1.png"
  ],
  "ocr_results": [
    {
      "enhanced_file": "enhanced/51A-9763_0.png",
      "text": "51A-9763",
      "frame": 0
    }
  ],
  "existed_results": [
    {
      "text": "30A-12345",
      "enhanced_file": "enhanced/30A-12345_1.png"
    }
  ],
  "invalid_results": [
    {
      "text": "INVALID-123",
      "message": "Biển số xe không hợp lệ"
    }
  ]
}

`GET /search?q=TEXT`

Tìm kiếm biển số đã nhận diện

Response:

[
  {
    "recognized_text": "51A-9763",
    "enhanced_file_path": "outputs/enhanced/51A-9763_0.png"
  }
]

`GET /enhanced/{filename}`

Tải ảnh đã tăng cường

`GET /outputs/enhanced/{filename}`

Tải ảnh từ thư mục outputs

Giao diện web

Tính năng chính:

Upload: Hỗ trợ drag & drop ảnh/video
Preview: Xem trước ảnh trước khi xử lý
Results: Hiển thị kết quả OCR và ảnh enhanced
Download: Tải từng ảnh kết quả
Search: Tìm kiếm biển số đã nhận diện
History: Xem lịch sử xử lý

Cách sử dụng:

Truy cập http://localhost:3000
Upload ảnh hoặc video
Chờ xử lý (có progress bar)
Xem kết quả OCR và ảnh enhanced
Tải ảnh hoặc tìm kiếm biển số

Cấu hình nâng cao

Chọn server phù hợp:

1. `main_test.py` (Khuyến nghị)

Xử lý ROI với tỷ lệ cố định
Tối ưu cho biển số ở vị trí cụ thể
Nhanh nhất trong 3 server

2. `main_full_image.py`

Xử lý toàn bộ ảnh/video
Phù hợp khi biển số có thể ở bất kỳ đâu
Chậm hơn nhưng chính xác hơn

3. `main_half_bottom.py`

Xử lý nửa dưới của ảnh/video
Phù hợp cho camera an ninh
Cân bằng giữa tốc độ và độ chính xác

Thay đổi model paths

Trong các file server:

model_path = "path/to/your/yolo/weights.pt"

Tùy chỉnh ROI (chỉ cho main_test.py)

ROI_RATIO = (0.32, 0.63, 0.432, 0.336)  # (x1, y1, x2, y2)

Thay đổi port

if __name__ == "__main__":
    import uvicorn
    uvicorn.run(app, host="0.0.0.0", port=8001)

Troubleshooting

Lỗi thường gặp:

1. "Module not found"

pip install -r requirements.txt

2. "CUDA out of memory"

Giảm batch size trong code
Sử dụng CPU thay vì GPU
Đóng các ứng dụng khác

3. "SQL Server connection failed"

Kiểm tra thông tin kết nối
Đảm bảo SQL Server đang chạy
Cài đặt ODBC Driver 17

4. "Model weights not found"

Tải weights từ Google Drive
Kiểm tra đường dẫn trong code

Logs và Debug:

# Chạy với debug mode
python main_test.py --debug

# Xem logs chi tiết
tail -f logs/app.log

Đóng góp

Cách đóng góp:

Fork repository
Tạo feature branch
Commit changes
Push to branch
Tạo Pull Request

Guidelines:

Tuân thủ PEP 8 cho Python
Comment code rõ ràng
Test trước khi commit
Update documentation

License

Dự án này được phát hành dưới MIT License.

Liên hệ

Email: tonybdg2061@gmail.com
GitHub: tomruise162
LinkedIn: https://www.linkedin.com/in/giabao16/

Acknowledgments

PReNet authors cho mô hình tăng cường ảnh
YOLOv11 team cho mô hình detection
PaddleOCR team cho OCR engine
FastAPI team cho web framework

Cập nhật lần cuối: Tháng 7, 2025

Name		Name	Last commit message	Last commit date
Latest commit History 31 Commits
UI/my-app		UI/my-app
__pycache__		__pycache__
.gitignore		.gitignore
2.0.0		2.0.0
Inference_prenet.ipynb		Inference_prenet.ipynb
Readme.md		Readme.md
enhancement_prenet_crop.py		enhancement_prenet_crop.py
environment.yml		environment.yml
license_plate_validator.py		license_plate_validator.py
main_full_image.py		main_full_image.py
main_half_bottom.py		main_half_bottom.py
main_test.py		main_test.py
networks.py		networks.py
ocr_infer.py		ocr_infer.py
requirements.txt		requirements.txt
script.sql		script.sql
structure		structure
test_pipeline.ipynb		test_pipeline.ipynb
utils.py		utils.py
yolo_detect.py		yolo_detect.py

Folders and files

Latest commit

History

Repository files navigation

Vietnamese License Plate Recognition Pipeline

Mô tả dự án

Pipeline xử lý

Tính năng chính

Cấu trúc dự án

Hướng dẫn cài đặt & chạy

Yêu cầu hệ thống

Cài đặt Backend

1. Tạo môi trường Python

2. Cài đặt dependencies

3. Tải pretrained weights

4. Cấu hình SQL Server

5. Tạo bảng SQL Server

6. Chạy server

Cài đặt Frontend

1. Cài đặt dependencies

2. Chạy development server

🔌 API Endpoints

POST /process

GET /search?q=TEXT

GET /enhanced/{filename}

GET /outputs/enhanced/{filename}

Giao diện web

Tính năng chính:

Cách sử dụng:

Cấu hình nâng cao

Chọn server phù hợp:

1. main_test.py (Khuyến nghị)

2. main_full_image.py

3. main_half_bottom.py

Thay đổi model paths

Tùy chỉnh ROI (chỉ cho main_test.py)

Thay đổi port

Troubleshooting

Lỗi thường gặp:

1. "Module not found"

2. "CUDA out of memory"

3. "SQL Server connection failed"

4. "Model weights not found"

Logs và Debug:

Đóng góp

Cách đóng góp:

Guidelines:

License

Liên hệ

Acknowledgments

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

`POST /process`

`GET /search?q=TEXT`

`GET /enhanced/{filename}`

`GET /outputs/enhanced/{filename}`

1. `main_test.py` (Khuyến nghị)

2. `main_full_image.py`

3. `main_half_bottom.py`

Packages