μ΄μ μ μ°λ¦¬λ κ°μ²΄ κ°μ§(Object Detection)μ λν΄ λ°°μ μ΅λλ€. κ°μ²΄ κ°μ§λ μ΄λ―Έμ§μμ λ°μ΄λ© λ°μ€λ₯Ό μμΈ‘νμ¬ κ°μ²΄μ μμΉλ₯Ό μ°Ύμ μ μκ² ν΄μ€λλ€. νμ§λ§ μΌλΆ μμ μμλ λ°μ΄λ© λ°μ€λΏλ§ μλλΌ λ μ λ°ν κ°μ²΄ μμΉ μ λ³΄κ° νμν©λλ€. μ΄λ¬ν μμ μ **μΈκ·Έλ©ν μ΄μ (Segmentation)**μ΄λΌκ³ ν©λλ€.
μΈκ·Έλ©ν μ΄μ μ ν½μ λΆλ₯λ‘ λ³Ό μ μμ΅λλ€. μ΄λ―Έμ§μ κ° ν½μ μ λν΄ ν΄λΉ ν½μ μ΄ μνλ ν΄λμ€λ₯Ό μμΈ‘ν΄μΌ ν©λλ€ (λ°°κ²½λ ν΄λμ€ μ€ νλλ‘ κ°μ£Όλ©λλ€). μ£Όμ μΈκ·Έλ©ν μ΄μ μκ³ λ¦¬μ¦μ λ κ°μ§κ° μμ΅λλ€:
- Semantic Segmentationμ ν½μ μ ν΄λμ€λ§ μλ €μ£Όλ©°, λμΌν ν΄λμ€μ μνλ κ°μ²΄ κ°μ ꡬλΆμ νμ§ μμ΅λλ€.
- Instance Segmentationμ ν΄λμ€λ₯Ό μλ‘ λ€λ₯Έ μΈμ€ν΄μ€λ‘ λλλλ€.
μλ₯Ό λ€μ΄, μΈμ€ν΄μ€ μΈκ·Έλ©ν μ΄μ μμλ μ΄ μλ€μ΄ μλ‘ λ€λ₯Έ κ°μ²΄λ‘ ꡬλΆλμ§λ§, μΈλ§¨ν± μΈκ·Έλ©ν μ΄μ μμλ λͺ¨λ μμ΄ νλμ ν΄λμ€λ‘ ννλ©λλ€.
μ΄λ―Έμ§ μΆμ²: μ΄ λΈλ‘κ·Έ κΈ
μΈκ·Έλ©ν μ΄μ μ μν λ€μν μ κ²½λ§ κ΅¬μ‘°κ° μμ§λ§, λͺ¨λ λμΌν ꡬ쑰λ₯Ό κ°μ§κ³ μμ΅λλ€. μ΄μ μ λ°°μ΄ μ€ν μΈμ½λ(autoencoder)μ μ μ¬ν λ°©μμ΄μ§λ§, μλ³Έ μ΄λ―Έμ§λ₯Ό 볡μνλ λμ λ§μ€ν¬λ₯Ό 볡μνλ κ²μ΄ λͺ©νμ λλ€. λ°λΌμ μΈκ·Έλ©ν μ΄μ λ€νΈμν¬λ λ€μκ³Ό κ°μ κ΅¬μ± μμλ₯Ό ν¬ν¨ν©λλ€:
- μΈμ½λ(Encoder): μ λ ₯ μ΄λ―Έμ§μμ νΉμ§μ μΆμΆν©λλ€.
- λμ½λ(Decoder): μΆμΆλ νΉμ§μ λ§μ€ν¬ μ΄λ―Έμ§λ‘ λ³ννλ©°, λ§μ€ν¬ μ΄λ―Έμ§λ μλ³Έ μ΄λ―Έμ§μ λμΌν ν¬κΈ°λ₯Ό κ°μ§λ©° ν΄λμ€ μμ ν΄λΉνλ μ±λμ ν¬ν¨ν©λλ€.
μ΄λ―Έμ§ μΆμ²: μ΄ λ Όλ¬Έ
νΉν μΈκ·Έλ©ν μ΄μ μμ μ¬μ©λλ μμ€ ν¨μμ λν΄ μΈκΈν΄μΌ ν©λλ€. μΌλ°μ μΈ μ€ν μΈμ½λλ₯Ό μ¬μ©ν λλ λ μ΄λ―Έμ§ κ°μ μ μ¬μ±μ μΈ‘μ ν΄μΌ νλ©°, μ΄λ₯Ό μν΄ νκ· μ κ³± μ€μ°¨(MSE)λ₯Ό μ¬μ©ν μ μμ΅λλ€. μΈκ·Έλ©ν μ΄μ μμλ λͺ©ν λ§μ€ν¬ μ΄λ―Έμ§μ κ° ν½μ μ΄ ν΄λμ€ λ²νΈλ₯Ό λνλ΄λ©° (μΈ λ²μ§Έ μ°¨μμμ μ-ν« μΈμ½λ©λ¨), λ°λΌμ λΆλ₯μ νΉνλ μμ€ ν¨μμΈ κ΅μ°¨ μνΈλ‘νΌ μμ€(cross-entropy loss)μ μ¬μ©ν΄μΌ ν©λλ€. μ΄ μμ€μ λͺ¨λ ν½μ μ λν΄ νκ· νλ©λλ€. λ§μ€ν¬κ° μ΄μ§(binary)μΌ κ²½μ° **μ΄μ§ κ΅μ°¨ μνΈλ‘νΌ μμ€(BCE)**μ΄ μ¬μ©λ©λλ€.
β μ-ν« μΈμ½λ©μ ν΄λμ€ λ μ΄λΈμ ν΄λμ€ μμ λμΌν κΈΈμ΄μ 벑ν°λ‘ μΈμ½λ©νλ λ°©λ²μ λλ€. μ΄ κΈ°μ¬μμ μ΄ κΈ°μ μ λν΄ μμΈν μμ보μΈμ.
μ΄λ² κ°μμμλ λ€νΈμν¬λ₯Ό νλ ¨μμΌ μλ£ μ΄λ―Έμ§μμ μΈκ°μ λͺ¨λ°(μΌλͺ μ )μ μΈμνλ μΈκ·Έλ©ν μ΄μ μ μ€μ΅ν΄ λ³΄κ² μ΅λλ€. μ°λ¦¬λ PH2 λ°μ΄ν°λ² μ΄μ€μ νΌλΆκ²½ κ²μ¬λ₯Ό μν μ΄λ―Έμ§λ₯Ό μ¬μ©ν κ²μ λλ€. μ΄ λ°μ΄ν°μ μ μΈ κ°μ§ ν΄λμ€(μΌλ° λͺ¨λ°, λΉμ ν λͺ¨λ°, νμμ’ )μ 200κ° μ΄λ―Έμ§λ₯Ό ν¬ν¨νκ³ μμ΅λλ€. λͺ¨λ μ΄λ―Έμ§μλ λͺ¨λ°μ μ€κ³½μΌλ‘ νμν λ§μ€ν¬λ ν¬ν¨λμ΄ μμ΅λλ€.
β μ΄ κΈ°μ μ νΉν μ΄λ¬ν μ νμ μλ£ μμμ μ ν©νμ§λ§, λ€λ₯Έ μ€μν μμ© μ¬λ‘λ₯Ό μμν΄λ³Ό μ μλμ?
μ΄λ―Έμ§ μΆμ²: PH2 λ°μ΄ν°λ² μ΄μ€
μ°λ¦¬λ λͺ¨λΈμ νλ ¨μμΌ λ°°κ²½μμ λͺ¨λ°μ λΆλ¦¬νλ μΈκ·Έλ©ν μ΄μ μ μνν κ²μ λλ€.
μλ λ ΈνΈλΆμ μ΄μ΄ λ€μν μΈλ§¨ν± μΈκ·Έλ©ν μ΄μ ꡬ쑰μ λν΄ λ°°μ°κ³ , μ΄λ₯Ό μ€μ΅νλ©° μ€μ λ‘ μλνλ λͺ¨μ΅μ νμΈν΄ 보μΈμ.
μΈκ·Έλ©ν μ΄μ μ μ΄λ―Έμ§ λΆλ₯λ₯Ό μν λ§€μ° κ°λ ₯ν κΈ°μ λ‘, λ°μ΄λ© λ°μ€λ₯Ό λμ΄ ν½μ μμ€μ λΆλ₯λ₯Ό μνν©λλ€. μ΄ κΈ°μ μ μλ£ μμ λ± λ€μν μμ© λΆμΌμμ μ¬μ©λ©λλ€.
μ 체 μΈκ·Έλ©ν μ΄μ μ μ¬λ μ΄λ―Έμ§λ₯Ό νμ©νμ¬ μνν μ μλ μΌλ°μ μΈ μμ μ€ νλμ λλ€. λ λ€λ₯Έ μ€μν μμ μΌλ‘λ 골격 κ°μ§μ μμΈ κ°μ§κ° μμ΅λλ€. OpenPose λΌμ΄λΈλ¬λ¦¬λ₯Ό μ¬μ©νμ¬ μμΈ κ°μ§κ° μ΄λ»κ² νμ©λ μ μλμ§ νμΈν΄ 보μΈμ.
μ΄ μν€νΌλμ κΈ°μ¬λ μ΄ κΈ°μ μ λ€μν μμ© μ¬λ‘μ λν μ’μ κ°μλ₯Ό μ 곡ν©λλ€. μΈμ€ν΄μ€ μΈκ·Έλ©ν μ΄μ κ³Ό νλ Ένν± μΈκ·Έλ©ν μ΄μ μ νμ λΆμΌμ λν΄ μ€μ€λ‘ λ μμ보μΈμ.
μ΄λ² μ€μ΅μμλ Segmentation Full Body MADS Datasetμ μ¬μ©νμ¬ μΈκ° μ 체 μΈκ·Έλ©ν μ΄μ μ μλν΄ λ³΄μΈμ.


