Sistem za prepoznavo rakavih nodulov na pljučah z uporabo konvolucijskih nevronskih mrež nad podatki augmentiranimi z generativno nasprotniško mrežo

Avtorji: Rene Rajzman, Matej Habjanič, Liam Mesarec, Kristina Čović

Povzetek

V članku predstavljamo sistem za samodejno prepoznavanje rakavih nodulov na pljučnih CT slikah, pri čemer smo razširili razpoložljive učne podatke z uporabo pogojnega VQ-GAN. Za učenje smo združili dve javno dostopni zbirki (LungCT-Diagnosis in IQ-OTH/NCCD), skupno 5 199 realnih rezin, ter jih nadgradili s 1 379 sintetičnimi slikami, kar predstavlja približno 27 % dodatnih podatkov. Predobdelava slik je vključevala normalizacijo, lokalno prilagodljivo izenačevanje kontrasta (CLAHE), gama-korekcijo, geometrijske augmentacije in prilagoditev velikosti na 224 × 224 pikslov. Pogojni VQ-GAN je dosegel FID 465,8 za rakave ter 422,0 za nerakave primere. Pri klasifikaciji smo uporabili MobileNetV2 in EfficientNetV2B0 s prednaloženimi utežmi iz ImageNet ter enostavno CNN arhitekturo na realnih in VQ-GAN dopolnjenih podatkih. Najboljši rezultat je EfficientNetV2B0 na kombinirani množici, ki je na testnem naboru (1 099 slik) dosegel točnost 82.17 %, AUC ≥ 0,86 in dobro razlikovanje obeh razredov. Rezultati kažejo, da vključitev GAN-slik ne zniža natančnosti modela, kar odpira možnosti nadaljnjega raziskovanja z daljšim učenjem VQ-GAN, izboljšanjem FID metrike in samonadzorovanim predtreningom na neoznačenih medicinskih podatkih.

1 Uvod

Med rakavimi bolniki največ življenj vzame plučni rak, saj je pogosto odkrit prepozno, ko so možnosti zdravljenja zelo omejene. Glede na celično sestavo pljučni rak delimo na drobnocelični (angl. small cell lung cancer - SCLC) in nedrobnocelični pljučni rak (angl. non-small cell lung cancer - NSCLC) [1]. Najbolj zanesljiv in pogost način za zgodnje odkrivanje bolezni je nizkodozno računalniško tomografiranje (CT) [2, 3], ki omogoča zaznavo abnormalnosti v pljučih posameznika. Ustvarjene CT slike pregleda radiolog in po potrebi izvede nadaljne raziskave na pacientu, da ugotovi prisotnost rakavih celic [3]. V omenjenem procesu obstaja veliko prostora za človeške napake, zato se je z razvojem nevronskih mrež začelo razvijati sisteme, ki s pomočjo umetne inteligence prepoznajo abnormalnosti na CT slikah [4]. Problem nevronskih mrež je, da potrebujejo veliko število označenih učnih podatkov, kar pa je pri medicinskih slikah pogosto težava. Z namenom odpravljanja te težave se je v zadnjih letih na področju pljučnega raka začelo eksperimentirati z uporabo generativnih nasprotniških mrež (GAN) [5, 6]. GAN omogočajo učenje globokih reprezentacij brez potrebe po obsežno označenih učnih podatkih. To dosežejo na podlagi povratnega širjenja napake (backpropagation) in tekmovalnim procesom med dvema agentoma [7].

ključne besede: računalniško podprta diagnostika (CAD), konvolucijska nevronska mreža (CNN), globoko učenje, obdelava medicinskih slik, generativna nasprotniška mreža (GAN)
keywords: Computer-aided diagnosis (CAD), Convolutional neural network (CNN), Deep learning, Medical image processing, Generative adversarial network (GAN)

2 Sorodna dela

Diagnoza pljučnega raka s pomočjo globokega učenja ali CNN temelji na klasificiranju škodljivosti pljučnih nodulov [8]. Za to potrebujemo zelo veliko množico učnih podatkov. Najpogosteje uporabljene v najboljših modelih v letih 2021 do 2024 so LC25000, LIDC-IDRI in LungCT-Diagnosis [4]. Veliko je tudi manjših množic kot so QIN LUNG CT in LUNA2016 [9, 10]. Ker so učne množice majhne s samo nekaj tisoč slikami pljučnih nodulov, so podatki pogosto augmentirani s slikovnimi transformacijami [11]. Novejša metoda augmentacije je GAN, ki namesto geometrijskega transformiranja tvori nove slike s tekmovanjem med dvema nevronskima mrežama kjer ena mreža generira podatke, druga pa poskuša ugibati če so ti podatki prišli iz originalne učne množice ali so bili generirani [11, 12]. StyleGAN generira nove slike na podlagi značilk učnih podatkov, kar bi lahko bilo uporabljeno za učenje značilk pljučnih nodulov [13]. CycleGAN lahko generira slike, ki so bile zajete v različnih domenah, kot je pretvorba MRI v CT [14]. Za preverjanje realističnosti slike se uporablja Fretchet Inception Distance [13, 14]. Problem majhnih množic učnih podatkov se lahko rešuje z uporabo predhodno naučene nevronske mreže, ki lahko dosegajo natančnost nad 0.95, vendar zahtevajo dobro optimizacijo z uporabo metod prenosa znanja [15]. Rezultati ene izmed študij kažejo, da je VGG-16 dosegel natančnost 0.981, MobileNet 0.945, ResNet50 0.925 in InceptionV3 0.92 [16]. Večjo natančnost so zasledili pri modelih CNN GD z 0.9786 [17] in 0.9945 s CNN [18]. Zelo visoko natančnost ima tudi LDNNET z natančnostjo 0.988396 [19]. U-Net modeli so popularni za medicinske slike vendar imajo manjšo natančnost med 0.8 do 0.9 [20].

3 Metodologija

V poskus sta bili vključeni dve zbirki; LungCT-Diagnosis iz TCIA vsebuje 3 971 CT slik v DICOM obliki, medtem ko zbirka IQ-OTH/NCCD obsega 1 228 rezin, razvrščenih v kategorije normal, benign in malignant. Zbirki smo poenotili v tri klasifikacije (normalno, benigno, maligno) in razdelili slike v razmerju 70 % za učenje, 15 % za validacijo in 15 % za testiranje. Pri predobdelavi slik smo najprej pretvorili surove RGB-PNG v plavajoče številske vrednosti tipa float32 deljene s 255, nato slike prepeljali v LAB-barvni prostor ter uporabili lokalno prilagodljivo izenačevanje kontrasta (CLAHE) z omejitvijo kontrasta (clipLimit=3.0) in mrežo 8×8 ploščic. Po tem smo izvedli gama-korekcijo (γ = 0,8), sledile pa so geometrijske razširitve, kot so naključna rotacija do ± 15 °, horizontalno zrcaljenje ter zmerno povečanje, premik in striženje. Na koncu smo vse slike prilagodili dimenzijam 224 × 224 slikovnih točk.

Uporabili smo pogojni VQ-GAN, da bi zaradi omejene razpoložljivosti velikih medicinskih zbirk povečali variabilnost podatkov. Kodirnik in dekodirnik modela imata po 256 kanalov, latentno predstavitev pa smo organizirali na mrežo dimenzij 16×16. Optimizacijo izvajamo z algoritmom Adam, pri čemer smo začetno hitrost učenja nastavili na 1 × 10⁻⁴. Po oceni kakovosti generiranih slik z metrikami FID smo izračunali vrednosti 465,8 za rakave in 422,0 za nerakave primere. Z modelom smo ustvarili približno 1 400 novih rezin, kar predstavlja približno 27 % dodatnih podatkov, ki smo jih vključili v učni del. Uporabili smo več klasifikacijskih modelov: MobileNetV3Large, ResNet50 in EfficientNetV2B0, vse s prednaloženimi utežmi iz zbirke ImageNet, ter dve različici enostavne konvolucijske nevronske mreže – eno na izvornih podatkih in drugo na podatkih, razširjenih z VQ-GAN. MobileNetV3Large, ResNet50 in EfficientNetV2B0 uporabljata kategorično funkcijo izgube (categorical cross-entropy), medtem ko ostali modeli uporabljajo binarno oziroma navzkrižno entropijo (cross-entropy). Modeli zgrajeni s MobileNetV3Large, ResNet50 in EfficientNetV2B0 so bili tudi povezani v hibrid za skupno klasifikacijo. Razlaga napovedi temelji na Grad-CAM toplotnih kartah. Za lažjo uporabo in treniranje modelov smo naredili smo še grafični vmesnik ki omogoča izbiro podatkovne mape, nastavitev epoh in velikosti batcha ter klasifikacijo s shranjenimi modeli.

4 Rezultati

Samostojen model EfficientNetV2B0, treniran na kombinaciji 5 199 realnih in 1 379 sintetičnih slik, je na testnem naboru 1 099 slik dosegel skupno točnost 87.27 %. Točnost 82% je dosegel tudi z VQGAN podatki Za rakava pljuča smo izmerili točnost 0.,90 priklic 0.0849 (F1 = 0,1552), medtem ko je za nerakava pljuča natančnost znašala 0,82, priklic pa 0,9977 (F1 = 0,9003). Samostojna MobileNetV3Large in ResNet50 sta dosegla točnost le 28.57%, hibrid, ki pa je povezal vse te modele pa je dosegel točnost kar 89.55%.

Matrika zmede za VQGAN	Krivulje AUC za VQGAN

Matrika zmede za EfficientNetV2B0	Krivulje AUC za EfficientNetV2B0

Matrika zmede za Hibrid	Krivulje AUC za Hibrid

Spodnja tabela vključuje primerjave nekaterih študij z našimi modeli; BinaryCNN, MobileNetV2, EfficientNetV2B0 in EfficientNetV2B0 z VQGAN podatki.

Študija / arhitektura	točnost
Klangbunrueang et al. – VGG-16 [16]	0.981
Klangbunrueang et al. – MobileNetV2[16]	0.945
Chen et al. – LDNNET[19]	0.9884
Thanoon et al. – CNN-GD[17]	0.9786
Al-Yasri et al. – AlexNet[21]	0.935
Binary CNN	0.32
MobileNetV3Large	0.28
ResNet50	0.28
EfficientNetV2B0	0.87
EfficientNetV2B0 + VQ-GAN	0.82
Hibrid	0.89

5 Zaključek

Pogojni VQ-GAN se je izkazal za učinkovito orodje za povečanje raznolikosti učnih podatkov, saj uvedba sintetiziranih rezin ni zmanjšala točnosti na testnem naboru. To nakazuje njegov potencialni doprinos k reševanju omejitev majhnih medicinskih zbirk. V prihodnjih študijah bi bilo smiselno VQ-GAN trenirati dalj časa ter optimizirati metrike FID pod našo visoko vrednostjo 400, kar bi lahko izboljšalo realizem generiranih slik. Lahko bi uvedli samonadzorovano predtreniranje na neoznačenih TCIA zbirkah z metodami, kot sta MoCo v3 ali BYOL, da bi zmanjšali odvisnost od ročno označenih podatkov in pridobili robustnejše predstavitve.

Viri

[1] “Lung cancer.” Accessed: Mar. 12, 2025. [Online]. Available: https://www.who.int/news-room/fact-sheets/detail/lung-cancer
[2] A. Dr et al., “Reduced lung-cancer mortality with low-dose computed tomographic screening,” The New England journal of medicine, vol. 365, no. 5, Aug. 2011, doi: 10.1056/NEJMoa1102873.
[3] R. Nooreldeen and H. Bach, “Current and Future Development in Lung Cancer Diagnosis,” International Journal of Molecular Sciences, vol. 22, no. 16, Art. no. 16, Jan. 2021, doi: 10.3390/ijms22168661.
[4] S. L. Tan, G. Selvachandran, R. Paramesran, and W. Ding, “Lung Cancer Detection Systems Applied to Medical Images: A State-of-the-Art Survey,” Arch Computat Methods Eng, vol. 32, no. 1, pp. 343–380, Jan. 2025, doi: 10.1007/s11831-024-10141-3.
[5] N. Ghaffar Nia, E. Kaplanoglu, and A. Nasab, “Evaluation of artificial intelligence techniques in disease diagnosis and prediction,” Discov Artif Intell, vol. 3, no. 1, p. 5, Jan. 2023, doi: 10.1007/s44163-023-00049-5.
[6] Q. Jin, H. Cui, C. Sun, Z. Meng, and R. Su, “Free-form tumor synthesis in computed tomography images via richer generative adversarial network,” Knowledge-Based Systems, vol. 218, p. 106753, Apr. 2021, doi: 10.1016/j.knosys.2021.106753.
[7] A. Creswell, T. White, V. Dumoulin, K. Arulkumaran, B. Sengupta, and A. A. Bharath, “Generative Adversarial Networks: An Overview,” IEEE Signal Processing Magazine, vol. 35, no. 1, pp. 53–65, Jan. 2018, doi: 10.1109/MSP.2017.2765202.
[8] Z. Gandhi et al., “Artificial Intelligence and Lung Cancer: Impact on Improving Patient Outcomes,” Cancers, vol. 15, no. 21, p. 5236, Oct. 2023, doi: 10.3390/cancers15215236.
[9] “QIN-LUNG-CT,” The Cancer Imaging Archive (TCIA). Accessed: Mar. 12, 2025. [Online]. Available: https://www.cancerimagingarchive.net/collection/qin-lung-ct/
[10] “LUNA16 - Grand Challenge,” grand-challenge.org. Accessed: Mar. 12, 2025. [Online]. Available: https://luna16.grand-challenge.org/
[11] I. D. Apostolopoulos, N. D. Papathanasiou, and G. S. Panayiotakis, “Classification of lung nodule malignancy in computed tomography imaging utilising generative adversarial networks and semi-supervised transfer learning,” Biocybernetics and Biomedical Engineering, vol. 41, no. 4, pp. 1243–1257, Oct. 2021, doi: 10.1016/j.bbe.2021.08.006.
[12] I. J. Goodfellow et al., “Generative Adversarial Networks,” arXiv.org. Accessed: Mar. 12, 2025. [Online]. Available: https://arxiv.org/abs/1406.2661v1
[13] T. Karras, S. Laine, and T. Aila, “A Style-Based Generator Architecture for Generative Adversarial Networks,” Mar. 29, 2019, arXiv: arXiv:1812.04948. doi: 10.48550/arXiv.1812.04948.
[14] A. Duval, L. Fillioux, and S. Saubert, “Deep Learning for Medical Imaging - Final Project Report Using CycleGANs to translate MRI to CT scans of the brain”. [15] N. Kumar, M. Sharma, V. P. Singh, C. Madan, and S. Mehandia, “An empirical study of handcrafted and dense feature extraction techniques for lung and colon cancer classification from histopathological images,” Biomedical Signal Processing and Control, vol. 75, p. 103596, May 2022, doi: 10.1016/j.bspc.2022.103596.
[16] R. Klangbunrueang, P. Pookduang, W. Chansanam, and T. Lunrasri, “AI-Powered Lung Cancer Detection: Assessing VGG16 and CNN Architectures for CT Scan Image Classification,” Informatics, vol. 12, no. 1, Art. no. 1, Mar. 2025, doi: 10.3390/informatics12010018.
[17] M. A. Thanoon, M. A. Zulkifley, M. A. A. Mohd Zainuri, and S. R. Abdani, “A Review of Deep Learning Techniques for Lung Cancer Screening and Diagnosis Based on CT Images,” Diagnostics, vol. 13, no. 16, p. 2617, Aug. 2023, doi: 10.3390/diagnostics13162617.
[18] S. Abunajm, N. Elsayed, Z. ElSayed, and M. Ozer, “Deep Learning Approach for Early Stage Lung Cancer Detection,” Feb. 15, 2023, arXiv: arXiv:2302.02456. doi: 10.48550/arXiv.2302.02456.
[19] Y. Chen, Y. Wang, F. Hu, L. Feng, T. Zhou, and C. Zheng, “LDNNET: Towards Robust Classification of Lung Nodule and Cancer Using Lung Dense Neural Network,” IEEE Access, vol. 9, pp. 50301–50320, 2021, doi: 10.1109/ACCESS.2021.3068896.
[20] I. Marinakis, K. Karampidis, and G. Papadourakis, “Pulmonary Nodule Detection, Segmentation and Classification Using Deep Learning: A Comprehensive Literature Review,” BioMedInformatics, vol. 4, no. 3, Art. no. 3, Sep. 2024, doi: 10.3390/biomedinformatics4030111.
[21] H. F. Al-Yasri, M. S. Al-Husieny, F. Y. Mohsen, E. A. Khalil, in Z. S. Hassan, “Diagnosis of Lung Cancer Based on CT Scans Using CNN,” International Journal of Advanced Computer Science and Applications (IJACSA), vol. 11, no. 11, pp. 467–473, 2020, doi: 10.14569/IJACSA.2020.0111159. \

Načrt rešitve

skupina: 1
sodelavci: Matej Habjanič, Kristina Čović, Rene Rajzman, Liam Mesarec
repozitorij: https://github.com/PainOfExistance/HouseAI
programski jezik: Python
opravila
1. razvojna iteracija
  - pregled podatkovnih zbirk in izbor katere bomo uporabili
  - vzpostavitev okolja za programiranje
  - priprava podatkov za uporabo s knjižnico Tensorflow
2. razvojna iteracija
  - testiranje GAN s CT slikami
  - implementacija CNN
  - učenje podpornih osnovnih metod strojnega učenja
3. razvojna iteracija
  - testiranje z drugimi CNN pred-trenirani modeli
  - optimizacija
  - gradnja hibridov iz nabora različnih klasifikacijskih metod
4. razvojna iteracija
  - uporabniški vmesnik za aplikacijo
  - primerjava rezultatov z drugimi modeli
  - pisanje članka
UML diagram rešitve:

1. šprint

Liam Mesarec, Kristina Čović: V sklopu opravila "pregled podatkovnih zbirk in izbor katere bomo uporabili" sva šla čez podatkovne množice ki jih lahko uporabimo za strojno učenje, o njih sma napisala informacije o tem kaj zajemajo, kako so anotirani, v katerem formatu so slike, katere modifikacije so bile vnaprej narejene nad slikami, koliko podatkov je v množici in nad koliko pacientov so bili izvedeni in viri podatkov. Razvila sva načrt katere učne podatke bi lahko kombinirali in katere tipe rakov bi lahko upoštevali.

Matej Habjanič: V sklopu prvega sprinta je bila moja naloga pripraviti delovno okolje za našo delo. Zaradi uporabe programskega jezika Python, smo vspostavili venv okolje ter tudi izbrali knjižnice, ki jih bomo uporabljali. Te so sledeče:
- tensorflow: grajenje nevronskih mrež
- numpy: za hitre operacija in interoperabilnost s tensorflow
- matplotlib: vizualizacija podatkov
- seaborn: vizualizacija matrike zmede
- sklearn: predobdelava in kategoriziranje podatkov
Po izdelavi preliminarnega dela sem tudi omogočil vizualizacijo natančnosti, izgibe in matreke zmede, kot tudi spreminjanje le teh skozi čas.

Rene Rajzman: V sklopu prvega sprinta sem razvil in treniral dva modela za klasifikacijo medicinskih slik. Prvi model je bila osnovna konvolucijska nevronska mreža za binarno klasifikacijo, ki je dosegla 32 % natančnost. Drugi model je temeljil na prenosnem učenju z MobileNetV2 in je dosegel 63 % natančnost. Oba modela sem shranil za nadaljnjo uporabo.

2. šprint

Liam Mesarec, Kristina Čović: V sklopu drugega šprinta sva se posvetila testiranju generativnih nasprotniških mrež (GAN) na CT slikah. Glavni cilj je bil razširiti obseg učnih podatkov za klasifikacijo pljučnih nodulov tako, da sva generirala nove slike s pomočjo dveh pristopov:

DCGAN (skripta gan.py)
- V tej implementaciji sva uporabila Deep Convolutional GAN, ki s preprosto arhitekturo generatorja in diskriminatorja generira 64×64 slike iz naključnega šuma.
- Nova sintetična množica slik nato služi kot augmentacija pri učenju konvolucijske mreže za klasifikacijo.
VQGAN (skripta vqgan.py)
- Drugi pristop temelji na Vector-Quantized GAN, kjer sliko najprej zakodirava v diskretno latentno predstavitev, nato dekodirava nazaj v izhodno dimenzijo.
- S tem pristopom sva želela preveriti, ali lahko diskretizacija latentnega prostora izboljša kakovost generiranih CT slik.

Po zaključku učenja sva pri vsaki metodi shranila vzorčne slike, ki so se generirale po posameznih epohah učenja. Spodaj so primeri generiranih slik iz gan.py in vqgan.py:

Primer DCGAN	Primer VQGAN

Matej Habjanič: Izdelal sem napreden model za klasifikacijo raka na CT posnetkih z uporabo globokega učenja. Dodal sem predobdelavo slik, ki temelji na medicinskem znanju in potrebah (CLAHE, gamma korekcija). Uporabil sem moderno arhitekturo EfficientNetV2 z optimiziranim učenjem in ročno nastavljenimi utežmi za neuravnotežene razrede. V model sem vključil podrobno evalvacijo (ROC krivulje, Grad-CAM) za boljšo interpretabilnost.

Rene Rajzman: V sklopu tega šprinta sem začel z implementacijo ansambelske metode boosting z bootstrap vzorčenjem. Osnovni klasifikator je pristop, ki ga je razvil kolega Habjanič. Naletel sem na manjše težave zato še o rezultatih ne moram poročati

3. šprint

Matej Habjanič: Zaradi kolokvijev količina dela v tem tednu zmanjšana, so pa bili narejeni popravki kode in izboljšana berljivost kot tudi izboljšano evaluviranje modela s kreacijo pomočniških funkcij za posamezne metrike. Izboljšan tudi način kreiranja modelov za ansambelske metode katere bo kasneje Rene uredil in implementiral ter smiselno povezal in zapakiral.

Rene Rajzman: Zaradi kolokvijev in drugih obveznosti ta teden nisem opravil veliko dela. Raziskoval sem kako bi lahko odpravil težave slabih rezultatov Boosting ansambela ampak do implementacije rešitve še ni prišlo. Delo bom nadoknadil v naslednjem šprintu

Liam Mesarec, Kristina Čović: Nadaljevali sva razvoj generativnih modelov DCGAN in VQGAN za segmentacijo in razvrščanje CT-slik pljuč. Cilj je bil:

Dodati več metrik za oceno kakovosti generiranih slik.
Prilagoditi model, da generira slike po posameznih razredih.
Preizkusiti kombinacije podatkovnih zbirk in različne hiperparametre.

Priprava podatkov Kombinirala sva 2 dataseta : The IQ-OTH/NCCD lung cancer dataset + prej uporabljeni dataset.

Dodala sva Normal in Benign slike iz novega dataseta v train/normal originalnega, da dobimo več raznovrstnih “zdravih” primerov

Implementacija GAN po razredih

Za vsak razred (normal, adenocarcinoma, …) se izvede ločen trening GAN-a.

Primeri generiranih slik

Primer normal:	Primer squamous cell carcinoma:

Primer large cell carcinoma:	Primer adenocarcinoma

4. Šprint

Rene Rajzman: V tem šprintu sem razvil in preizkusil dva pristopa za izboljšanje klasifikacije, boosting ansambel in hibridni model. Ponovno sem se lotil razvoja boosting ansambelskega pristopa na osnovi izjemno uspešnega EfficentNet modela z namenom dodatnega izboljšanja klasifikacije.Modeli so bili trenirani, shranjeni in povezani v ansambel. Kljub višji kompleksnosti in specializaciji posameznih modelov na napake predhodnikov se je rezultat napram samostojnemu modelu žal poslabšal. Implementiran hibridni pristop združuje napovedi treh modelov (EfficientNet, ResNet50 in MobileNetV3). Po implementaciji pristopa učenja ResNet50 in MobileNetV3 (katerih učenje je izvedel kolega Habjanič, saj je moj računalnik naletel na določene težave) sem vse tri obstoječe modele povezal v hibrid čigar testiranje na žalost ni pokazalo izboljšave napram EfficentNet modela.

Matej Habjanič: V tem šprintu sem dodal EfficientNet del ansambla s pomočjo LayerNormalization in Squeeze-and-Excitation block. To smo testirali na novem datasetu (https://www.kaggle.com/datasets/hamdallak/the-iqothnccd-lung-cancer-dataset) , kjer imamo 3 klasifikacijske razrede, normalno, benigno in pa maligno. Dobili smo sledeče AOC krivulje in matrike zmede:

Matrika zmede na osnovnem EfficientNet	Matrika zmede na izboljšanem EfficientNet	Matrika zmede na izboljšanem in parametriziranem EfficientNet

AUC krivulja na osnovnem EfficientNet	AUC krivulja na izboljšanem EfficientNet	AUC krivulja na izboljšanem in parametriziranem EfficientNet

Dodal sem tudi osnovni GUI kateri bo povezan s sistemom učenja.

Liam Mesarec, Kristina Čović: Najprej sva združila obstoječo zbirko DICOM CT-rezin z LungCT-Diagnosis (https://www.cancerimagingarchive.net/collection/lungct-diagnosis/) podatki iz TCIA in vse DICOM datoteke pretvorila v PNG format za enostavnejšo obdelavo v CNN.

Na izvirnih slikah je CNN dosegla valAcc ≈ 99 %. Nato sva z VQ-GAN (40 epoh; FID = 465,8 za “cancerous” in 422,0 za “non_cancerous”) sintetizirala dodatne CT-rezine obeh razredov ter jih vključila v učno množico. Po ponovnem učenju CNN na kombinaciji originalnih in sintetičnih slik je testna natančnost znašala 96,63 %. Čeprav je to nekoliko pod prejšnjo vrednostjo, so GAN-slike razširile variabilnost podatkov.

V skripto medical_specialised.py sva vključila CT slike, sintetizirane z VQ-GAN-om, skupaj z obstoječimi realnimi posnetki (5 199 realnih + 1 379 sintetičnih slik razredov cancerous in non_cancerous). EfficientNetV2B0 smo trenirali na tej kombinirani množici in dosegli:

val_loss: 0.5511
val_accuracy: 0.8300
val_auc: 0.8615

Na testnem naboru (1 099 slik) je model dosegel test_accuracy = 82,17 %:

cancerous: precision 0,90, recall 0,0849 (F1 = 0,1552)
non_cancerous: precision 0,82, recall 0,9977 (F1 = 0,9003)

Matrika zmede	AUC krivulje

Name		Name	Last commit message	Last commit date
Latest commit History 82 Commits
GUI		GUI
assets		assets
booed_ensamble		booed_ensamble
medical_specialised		medical_specialised
results		results
.gitignore		.gitignore
Dockerfile		Dockerfile
Poričilo.md		Poričilo.md
README.md		README.md
cancer_classifier_cnn.py		cancer_classifier_cnn.py
cancer_classifier_cnn_basic.py		cancer_classifier_cnn_basic.py
gan.py		gan.py
info_o_podatkih.txt		info_o_podatkih.txt
main.py		main.py
medical_specialised.py		medical_specialised.py
requirements.txt		requirements.txt
vqgan.py		vqgan.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sistem za prepoznavo rakavih nodulov na pljučah z uporabo konvolucijskih nevronskih mrež nad podatki augmentiranimi z generativno nasprotniško mrežo

Povzetek

1 Uvod

2 Sorodna dela

3 Metodologija

4 Rezultati

5 Zaključek

Viri

Načrt rešitve

1. šprint

2. šprint

3. šprint

4. Šprint

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Sistem za prepoznavo rakavih nodulov na pljučah z uporabo konvolucijskih nevronskih mrež nad podatki augmentiranimi z generativno nasprotniško mrežo

Povzetek

1 Uvod

2 Sorodna dela

3 Metodologija

4 Rezultati

5 Zaključek

Viri

Načrt rešitve

1. šprint

2. šprint

3. šprint

4. Šprint

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages