Medical Image Caption Generation using Generative Transformers

A full-stack AI-powered system for automated brain tumor prediction and caption generation from MRI scans. This project integrates Vision Transformers (ViT), Knowledge-Aware Networks (KAN), Grad-CAM, and a modern Flask + React interface to make deep learning results interpretable and interactive.

📸 Visual Preview

🚀 Features

🧠 Tumor prediction from MRI using ViT + KAN
📝 Automatic generation of domain-specific medical captions
🔍 Visual explainability via Grad-CAM
🖼️ Real-time web interface (React + Tailwind CSS)
🔗 Fully integrated backend using Flask and PyTorch

🛠️ Tech Stack

Layer	Tools
Model	PyTorch, Vision Transformer (ViT), KAN
Explainability	Grad-CAM
Backend	Flask, Torchvision, Pillow, Joblib
Frontend	React, TypeScript, Tailwind CSS, Dropzone
Storage	LocalStorage (frontend), `.pth`, `.pkl`

📂 Project Structure

Medical-Image-Captioning/
├── frontend/           # React app for UI
├── backend/            # Flask app with model + API
├── outputs/            # Screenshots (used in README)
├── model.pth           # Trained model
├── label_encoder.pkl   # Class mapping
├── app2.py             # Flask API script
├── README.md

🧪 To Use

npm install
npm run dev
python app2.py

👥 Project Team & Acknowledgments

Mentor
Dr. Kamakshi Rautela

📬 Contact

For questions, collaborations, or feedback, feel free to connect:

📧 Email: ishaanntyagi@gmail.com
🔗 LinkedIn: https://www.linkedin.com/in/ishaan-narayan-620560256/
📁 GitHub: https://github.com/ishaanntyagi

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
Local_model_Testing		Local_model_Testing
outputs		outputs
project_FrontEnd/project		project_FrontEnd/project
Minor2-Final.ipynb		Minor2-Final.ipynb
Minor2-Final.pdf		Minor2-Final.pdf
README.md		README.md
project.zip		project.zip

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Medical Image Caption Generation using Generative Transformers

📸 Visual Preview

🚀 Features

🛠️ Tech Stack

📂 Project Structure

🧪 To Use

👥 Project Team & Acknowledgments

Mentor
Dr. Kamakshi Rautela

📬 Contact

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Medical Image Caption Generation using Generative Transformers

📸 Visual Preview

🚀 Features

🛠️ Tech Stack

📂 Project Structure

🧪 To Use

👥 Project Team & Acknowledgments

Mentor Dr. Kamakshi Rautela

📬 Contact

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Mentor
Dr. Kamakshi Rautela

Packages