100 days CUDA challenge

Learning CUDA and contributing code every day

Resources

Day	Description
Day 1	Basic Vector Addition in CUDA
Day 2	Implemented Matrix Addition in CUDA
Day 3	Implemented Matrix Multiplication in CUDA
Day 4	RELU implementaion in CUDA
Day 5	Leaky RELU implementaion in CUDA
Day 6	Softmax implementaion in CUDA
Day 7	Dot Product implementation in CUDA
Day 8	Reduce Sum implementation in CUDA
Day 9	Layer Normalization implementation in CUDA
Day 10	Matrix Transpose implementation in CUDA
Day 11	1d convolution implementation in CUDA
Day 12	2d convolution implementation in CUDA
Day 13	Optimised Reduce Sum with Sequential Addressing in CUDA
Day 14	Tiled matrix multiplication in CUDA
Day 15	Array Reversal in CUDA
Day 16	Optimised Reduce Sum implementation in CUDA
Day 17	Simple Attention implementation in CUDA
Day 18	Layer Norm implementation using shared memory in CUDA
Day 19	Matrix Transpose implementation using shared memory in CUDA
Day 20	Flash attention forward pass implementation in CUDA
Day 21	Binary cross entropy loss implementation in CUDA
Day 22	Binary cross entropy loss with softmax implementation in CUDA
Day 23	Naive Bayes implementation in CUDA
Day 24	BFS implementation in CUDA
Day 25	Mini-batch Stochastic Gradient Descent implementation in CUDA
Day 26	Batch Normalization implementation in CUDA

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
day_01		day_01
day_02		day_02
day_03		day_03
day_04		day_04
day_05		day_05
day_06		day_06
day_07		day_07
day_08		day_08
day_09		day_09
day_10		day_10
day_11		day_11
day_12		day_12
day_13		day_13
day_14		day_14
day_15		day_15
day_16		day_16
day_17		day_17
day_18		day_18
day_19		day_19
day_20		day_20
day_21		day_21
day_22		day_22
day_23		day_23
day_24		day_24
day_25		day_25
day_26		day_26
README.md		README.md