Research Paper

Journal of Korean Tunnelling and Underground Space Association. 30 September 2025. 489-504
https://doi.org/10.9711/KTAJ.2025.27.5.489

ABSTRACT


MAIN

  • 1. 서 론

  • 2. 관련 연구

  • 3. 고속 모션 블러 평가를 위한 실험 환경 구축

  •   3.1 고속 병진 이동 패널(HTMP) 장치

  •   3.2 실내 표준 실험 환경

  •   3.3 데이터셋 구축

  •   3.4 물리적 품질 지표 정의

  • 4. 실험 결과 및 분석

  •   4.1 물리적 품질 지표 측정 결과

  •   4.2 NR-IQA 지표와 물리적 지표 간 상관관계 분석

  • 5. 결 론

1. 서 론

도로, 터널, 교량과 같은 사회 기반 시설의 안전성과 지속가능성을 확보하기 위한 구조 건전성 모니터링(structural health monitoring) 기술의 중요성이 증대되고 있다(Chen et al., 2025). 최근 컴퓨터 비전(computer vision) 및 딥러닝(deep learning) 기술의 발전은 기존의 접촉식 센서 기반 점검 방식이 가진 물리적, 시간적 한계를 극복하고, 점검의 자동화와 효율성을 획기적으로 향상시킬 수 있는 새로운 패러다임을 제시하고 있다(Guo et al., 2024). 이러한 기술적 흐름 속에서 이동식 터널 스캐닝 시스템(mobile tunnel scanning system, MTSS)은 고해상도 카메라를 탑재한 차량이 고속으로 주행하며 터널 콘크리트 라이닝에서 균열과 같은 결함을 신속하게 탐지가 가능하여, 효율적인 점검 기술로써 각광받고 있다(Huang et al., 2017).

그러나 MTSS의 현장 적용성과 신뢰성은 고속 주행 환경에서 필연적으로 발생하는 모션 블러(motion blur, MB) 문제에 의해 심각한 제약을 받는다(Liu et al., 2020). MB로 인해 저하된 이미지 품질은 컨볼루션 신경망(convolutional neural network, CNN) 기반 자동 결함 탐지 알고리즘의 성능을 크게 저하시켜 시스템 전체의 신뢰도를 떨어뜨리는 핵심적인 기술적 문제로 작용한다(Lee et al., 2025). 따라서, 취득된 이미지의 품질을 실시간으로 평가하여 저품질 데이터를 선별하거나 후처리 알고리즘의 적용 여부를 결정하는 것은 자동화된 MTSS의 안정적인 운영을 위해 필수적이다.

이러한 배경에서 이미지 품질 평가(image quality assessment, IQA) 기술의 중요성이 부각된다. 특히 MTSS를 활용하여 실제 터널 현장에서는 왜곡되지 않은 원본 참조 이미지를 확보하는 것이 불가능하므로, 참조 이미지 없이 영상 자체의 특성만을 분석하여 품질을 평가하는 무참조 이미지 품질 평가(no-reference IQA, NR-IQA) 방법론의 활용이 요구된다(Pennada et al., 2023). 현재까지 다양한 이미지의 품질 특성을 고려하여 수많은 범용 NR-IQA 지표들이 개발되어 왔다. 그러나 이들 지표가 MTSS 환경에서 발생하는 고유한 특성인 고속 병진 운동에 의한 MB를 얼마나 정확하게 정량화할 수 있는지에 대한 체계적인 성능 평가는 이루어진 바 없다. 대부분의 NR-IQA 지표들은 가우시안 블러, 압축 왜곡, 노이즈 등 일반적인 왜곡 유형을 포함하는 표준 데이터베이스를 기반으로 개발 및 검증되었기 때문에, 특정 물리적 현상에 의해 발생하는 특화된 왜곡 환경에서의 유효성이 보장되지 않는다(Giniatullin et al., 2024).

본 연구의 목적은 실제 MTSS의 촬영 환경을 정밀하게 모사하는 물리적인 실험 환경을 구축하고, 획득한 고속 모션 블러(high-speed motion blur, HSMB) 이미지 데이터셋을 기반으로 기존 NR-IQA 지표들의 성능을 객관적인 물리적인 품질 지표와 비교하여 정량적으로 분석하는 것이다. 이를 통해 MTSS를 활용한 터널 점검시 발생하는 MB 이미지에 대한 NR-IQA 지표들의 성능을 명확히 규명하고자 한다. 또한, MTSS 기반 터널 자동 점검 시스템에서 실시간 이미지 품질 관리를 위한 적합한 NR-IQA 지표 선택에 필요한 실증적 근거를 제공하고자 한다.

2. 관련 연구

IQA는 왜곡된 이미지의 품질을 인간의 시각적 인지와 유사하게 예측하는 것을 목표로 하며, 참조 이미지의 사용 가능 여부에 따라 크게 세 가지 방식으로 분류된다(De and Masilamani, 2013). 전체 참조(full-reference, FR-IQA) 방식은 왜곡되지 않은 원본 이미지를 완전하게 참조하여 품질을 평가한다. 평균 제곱 오차(mean squared error, MSE)를 기반으로 하는 최대 신호 대 잡음비(peak signal-to-noise ratio, PSNR)와 이미지의 휘도, 대비, 구조적 유사성을 종합적으로 평가하는 구조적 유사성 지수(structural similarity index Metric, SSIM)가 대표적이다(Wang et al., 2004). 이들 지표는 이미지 복원 및 디블러링 알고리즘의 성능 평가에 널리 사용되고 있다. 하지만 MTSS를 활용한 터널 환경에서 원본 참조 이미지를 획득할 수 없는 경우에는 적용이 불가능하다는 명백한 한계를 가진다. 그러나 제어된 실험 환경에서는 비교 분석을 위한 유용한 벤치마크로 활용될 수 있다.

부분 참조(reduced-reference, RR-IQA) 방식은 원본 이미지에서 추출된 일부 특징 정보만을 참조하여 품질을 평가한다. 대표적으로 변조 전달 함수(modulation transfer function, MTF)는 이미징 시스템의 공간 주파수 응답 특성을 측정하여 선명도를 평가하는 신뢰도 높은 방법이지만, 표준화된 테스트 차트를 촬영해야 한다는 제약이 있다(Dinh et al., 2023).

NR-IQA 방식은 참조 이미지 없이 왜곡된 이미지 자체의 통계적, 구조적 특성만을 분석하여 품질을 예측하므로 실용성이 매우 높다(Wu et al., 2015). NR-IQA는 크게 지식 기반(knowledge-based) 접근법과 딥러닝 기반(deep learning-based) 접근법으로 나뉜다. 지식 기반 접근법은 이미지 왜곡이 특정 통계적 또는 구조적 특성을 변화시킨다는 사전 지식을 바탕으로 설계된다. 자연 영상 통계(natural scene statistics, NSS) 기반 BRISQUE (blind/referenceless image spatial quality evaluator)와 NIQE (naturalness image quality evaluator)는 자연 이미지가 특정 통계적 분포를 따른다는 가정에 기반한다(Mittal et al., 2012; 2013). 이 모델들은 왜곡이 발생하면 공간 영역에서 정규화된 휘도 값의 분포가 변화하는 것을 감지하여 품질 점수를 산출한다. 이들은 JPEG 압축, 가우시안 블러, 노이즈 등 일반적인 왜곡 유형에 대해서는 강건한 성능을 보이지만, 고속의 단방향성 MB와 같이 고도로 구조화된 왜곡이 기존의 자연 영상 통계 가정을 어떻게 변화시키는지는 명확하지 않다.

인식 및 블록 기반 PIQE (perceptual image quality evaluator)는 이미지를 블록 단위로 분할하고, 각 블록에서 공간적 활동성, 노이즈, 왜곡 아티팩트와 관련된 특징을 추출하여 품질을 평가한다. 그러나 MB와 같이 이미지 전반에 걸쳐 비균일하게 발생하거나 특정 방향성을 가지는 왜곡을 블록 기반 접근법으로 효과적으로 포착하는 데는 한계가 있을 수 있다(Venkatanath et al., 2015).

엣지 기반 블러 모델인 CPBD (cumulative probability of blur detection)는 canny 엣지 검출기를 통해 식별된 엣지 주변의 명암 변화를 분석하여 블러 정도를 측정한다. 이 지표는 인간이 인지할 수 있는 최소한의 블러(just noticeable blur) 개념을 활용하여, 엣지가 얼마나 선명한지를 확률적으로 계산한다. 구조물의 균열과 같이 엣지 정보가 중요한 환경에 적합할 수 있으나, 엣지 검출기의 성능에 크게 의존하며, 복잡한 패턴이나 노이즈가 많은 환경에서는 평가의 정확도가 저하될 수 있다(Narvekar and Karam, 2011).

최근 NR-IQA 연구는 대규모 데이터셋을 통해 이미지 품질과 관련된 복잡한 특징을 자동으로 학습하는 딥러닝 기반 방법론이 주류를 이루고 있다(Zhu et al., 2020). DBCNN (deep bilinear convolutional neural network)은 이미지 왜곡을 합성 왜곡과 실제 왜곡이라는 두 가지 요인의 변동으로 간주한다. 이를 위해 두 개의 병렬적인 CNN 스트림을 사용하는데, 하나는 왜곡의 유형과 수준을 분류하도록 사전 훈련되어 합성 왜곡에 특화되었다. 또 다른 하나는 ImageNet과 같은 대규모 자연 이미지 데이터셋으로 사전 훈련되어 실제 왜곡 특징을 추출한다. 두 스트림에서 추출된 특징들은 bilinear pooling 메커니즘을 통해 결합된다. 이는 두 특징 벡터 간의 모든 쌍별 곱셈적 상호작용(pairwise multiplicative interaction)을 포착하여, 특정 왜곡이 이미지 내용에 따라 어떻게 다르게 인지되는지를 복잡한 비선형 관계로 모델링하는 방식이다(Zhang et al., 2020).

ARNIQA (learning distortion manifold for image quality assessment)는 인간의 주관적 평가 점수(mean opinion score, MOS) 없이도 강력한 품질 특징을 학습하는 자기 지도 학습(self-supervised learning) 방식을 채택하였다. 이 모델의 핵심은 왜곡 다양체(distortion manifold)라는 개념으로, 이미지의 내용과 무관하게 오직 왜곡의 유형과 심각도에 의해서만 이미지가 배치되는 고차원 특징 공간을 학습하는 것을 목표로 한다. 이를 위해 대조 학습(contrastive learning)을 사용하는데, 서로 다른 내용의 이미지 두 개에 정확히 동일한 왜곡을 적용하여 원본-위조 쌍(positive pair)을 만든다. 모델은 이 원본-위조 쌍의 특징 표현이 유사해지도록 학습함으로써, 이미지 왜곡 패턴 자체에만 집중하는 특징 추출기를 훈련시키는 방식이다(Agnolucci et al., 2024).

DBCNN과 ARNIQA와 같은 최신 딥러닝 기반 NR-IQA 지표들의 성능은 학습 데이터셋의 다양성과 분포에 크게 의존한다. MTSS 환경에서 발생하는 고유한 물리적 특성의 MB가 기존의 대규모 IQA 데이터베이스에 충분히 반영되어 있지 않다면, 이들 모델의 일반화 성능은 급격히 저하될 수 있다. 또한, 막대한 연산량으로 인해 실시간 처리가 요구되는 현장 시스템에 적용하기 어렵고, ‘블랙박스’ 특성으로 인해 품질 점수 도출 근거가 불명확하여 결과의 신뢰성을 확보하기 어렵다는 실용적인 한계가 있다. 따라서 MTSS의 고속 촬영 환경에서 기존 NR-IQA 지표들의 성능을 체계적으로 검증하고, 실제 물리적 왜곡 특성과의 연관성을 정량적으로 분석하는 연구가 필요하다.

3. 고속 모션 블러 평가를 위한 실험 환경 구축

3.1 고속 병진 이동 패널(HTMP) 장치

현재까지 70 km/h 이상의 고속 이동 환경에서 촬영된 이미지의 MB 영향을 체계적으로 분석한 연구는 보고된 바 없다. 이러한 연구의 공백을 메우고 실제 MTSS의 고속 주행 환경을 실험실 내에서 정밀하게 재현하기 위해, 고속 병진 이동 패널(high-speed translational moving panel, HTMP) 장치를 자체적으로 설계 및 제작하였다(Fig. 1). 이 장치는 고정밀 서보 모터와 제어 시스템을 통해 구동되는 회전형 패널 구조를 가지며, 최대 110 km/h까지 10 km/h 단위로 속도를 정밀하게 제어할 수 있다. 패널 표면에는 이미지 품질의 물리적 특성을 측정하기 위한 ISO 12233 테스트 차트를 부착할 수 있다.

https://cdn.apub.kr/journalsite/sites/kta/2025-027-05/N0550270511/images/kta_2025_275_489_F1.jpg
Fig. 1.

High-speed translational moving panel (HTMP)

3.2 실내 표준 실험 환경

실험의 객관성과 신뢰도를 보장하기 위해 ISO 12233 표준에 근거하여 실내 테스트 환경을 Fig. 2와 같이 구축하였다. 촬영에는 4,096 × 2,304 해상도의 CMOS 센서를 탑재한 KOMI Phantom VEO4K Basler 고속 카메라와 25 mm 단렌즈를 사용하였다. 카메라와 HTMP 장치 간의 거리는 1.5 m로 일정하게 고정하였다. 조리개 값은 F2.8로 설정하여 충분한 심도를 확보하였다. 또한 색온도 5,600 K의 주광색 120 W LED 투광 조명 2개를 테스트 차트 정면을 기준으로 양쪽 45° 각도에 배치하여 균일한 조도를 확보하였다(Fig. 2(a)). 조명 밝기는 15,000 lx와 40,000 lx의 두 가지 조건으로 통제하여, 다양한 조도 환경에서의 영향을 분석할 수 있도록 하였다. 이미지 품질의 물리적 특성을 정량적으로 측정하기 위한 표준 도구로 Imatest® 사의 eSFR ISO 12233:2017 테스트 차트를 사용하였다(Fig. 2(b)). 이 차트는 저대비 경사 엣지(slanted-edge)의 공간 주파수 응답(spatial frequency response, SFR)을 측정하기 위한 ISO 12233 표준을 준수하며, 선명도 외에도 색수차, 톤 응답, 노이즈 등 다양한 품질 파라미터를 종합적으로 평가할 수 있는 패턴들을 포함하고 있다.

https://cdn.apub.kr/journalsite/sites/kta/2025-027-05/N0550270511/images/kta_2025_275_489_F2.jpg
Fig. 2.

High speed motion blur capturing on HTMP in laboratory

3.3 데이터셋 구축

구축된 HTMP 장치와 표준화된 실험 환경을 이용하여 HSMB 데이터셋을 구축하였다. 데이터셋은 Table 1과 같이 이동 속도, 카메라 셔터 속도와 조명 조도로 세 가지 핵심 변수를 통제하여 획득하였다. HTMP의 이동 속도는 0 km/h (정지사진), 10 km/h, 30 km/h, 50 km/h, 70 km/h로 변경하며 촬영하였다 각 속도 조건에 대해 카메라의 셔터 속도를 50 µs (micro second), 100 µs, 250 µs, 500 µs, ISO는 640, 1,250과 1,600으로 변경하며 촬영하였다.

Table 1.

Test condition for capturing motion blur using moving panel and area scan camera

Panel speed (km/h) Shutter speed (µs) ISO F-number FPS Illuminance (lx)
0
10
30
50
70
500 640 2.8 100 15,000
40,000
250 1250
100 1600
50 1600

각 실험 조건의 조합에 대해 촬영된 동영상에서 테스트 차트 전체가 포함된 프레임을 Fig. 3과 같이 선별하였다. 각 조건당 10장의 이미지를 추출하여 최종적으로 총 400장의 이미지로 구성된 HSMB 데이터셋을 구축하였다(Fig. 4). 이 데이터셋은 Fig. 5에서 보여주듯이 속도와 노출 시간에 따라 MB의 강도가 점진적으로 변화하는 특성을 보여준다. 주관적인 시각에 의하면, HTMP의 속도가 증가할수록 이미지의 MB가 증가한다. 카메라의 셔터스피드가 빨라질수록 MB가 감소하는 경향을 나타내고 있다. 하지만 셔터 스피드가 빨라지면서 ISO 감도를 증가시켰음에도 불구하고 이미지는 어두워지는 경향을 보여준다.

https://cdn.apub.kr/journalsite/sites/kta/2025-027-05/N0550270511/images/kta_2025_275_489_F3.jpg
Fig. 3.

Captured motion blur images from HTMP

https://cdn.apub.kr/journalsite/sites/kta/2025-027-05/N0550270511/images/kta_2025_275_489_F4.jpg
Fig. 4.

HSMB datasets depend on Illuminance (15,000 lx and 40,000 lx)

https://cdn.apub.kr/journalsite/sites/kta/2025-027-05/N0550270511/images/kta_2025_275_489_F5.jpg
Fig. 5.

Comparison motion blur and contrast of slanted-edge images between 15,000 lx and 40,000 lx

3.4 물리적 품질 지표 정의

본 연구에서는 NR-IQA 지표 성능 평가의 객관적인 기준, 즉 실측값으로 MOS에 의존하는 대신, 이미지의 물리적 특성을 직접 측정할 수 있는 RR-IQA의 두 가지 지표인 BEW와 MTF50를 채택하였다. 이는 특정 왜곡 유형에 대한 평가의 일관성과 정밀도를 높이기 위함이다. 두 지표 모두 eSFR 차트로부터 ISO 12233 Slanted-edge 방법을 통해 산출되었다(Masaoka, 2018).

흐릿한 엣지 폭(blurred edge width, BEW)은 경사 엣지 영역에서 추출된 엣지 확산 함수(edge spread function)의 값이 10%에서 90%까지 상승하는 데 걸리는 구간의 폭을 픽셀 단위로 측정한 값이다. 이 값은 엣지가 얼마나 넓게 퍼져 있는지를 나타내므로, MB의 강도를 직관적이고 직접적으로 정량화하는 지표이다. BEW 값이 클수록 블러가 심함을 의미한다.

MTF는 이미징 시스템이 다양한 공간 주파수의 대비(contrast)를 얼마나 잘 재현하는지를 나타내는 척도이다. MTF50은 대비가 저주파 영역 값의 50%로 떨어지는 지점의 공간 주파수(단위: cycles/pixel)를 의미한다(Artmann, 2013). 이미지의 인지적 선명도(perceived sharpness)와 높은 상관관계를 가지는 것으로 알려져 있다. MTF50 값이 높을수록 이미지가 더 선명함을 나타낸다(Koren, 2006).

이 두 가지 물리적 지표는 상호 보완적으로 이미지 품질을 설명한다. BEW는 블러의 물리적 크기를, MTF50은 그로 인한 선명도 저하를 나타내므로, 이들을 기준으로 NR-IQA 지표들의 성능을 평가함으로써 보다 다각적이고 신뢰도 높은 분석이 가능하다.

4. 실험 결과 및 분석

본 장에서는 구축된 HSMB 데이터셋을 이용하여 측정한 RR-IQA의 물리적 품질 지표(MTF50과 BEW)의 변화 양상을 제시하고, 이를 기준으로 다양한 NR-IQA 지표들과의 상관관계를 정량적으로 분석하였다. 분석에는 FR-IQA 지표인 PSNR, SSIM과 지식 기반 NR-IQA 지표인 BRISQUE, NIQE, PIQE, CPBD, 그리고 딥러닝 기반 NR-IQA 지표인 DBCNN와 ARNIQA를 활용하였다.

4.1 물리적 품질 지표 측정 결과

HTMP의 이동 속도와 카메라 셔터 속도 변화에 따른 이미지 품질의 물리적 변화를 정량화하기 위해, 각 실험 조건에서 획득한 이미지에서 RR-IQA의 물리적 품질 지표로 BEW와 MTF50 값을 측정하였다. Table 2는 조도가 15,000 lx 조건에서 촬영한 HSMB 이미지에 대한 측정 결과이다. Fig. 6의 그래프에 나타나듯이 HTMP의 속도가 증가할수록 BEW는 증가하고 MTF50은 감소하는 경향을 보이고 있다. 이러한 경향은 속도가 증가할수록 이미지에서 MB가 증가하는 것을 의미한다. 예를 들어, 70 km/h의 이동 속도에서 카메라의 셔터스피드가 500 µs에서 50 µs로 빨라질수록 BEW는 38.28 pixels에서 5.32 pixels로 감소하였다. MTF50은 0.0227 cycle/pixel에서 0.0955 cycle/pixel로 증가하여 MB가 감소하는 것으로 볼 수 있다.

Table 2.

Results of motion blur images depends on velocity of moving panel and shutter speeds at illuminance 15,000 lx

Shutter speed (µs) RR-IQA 0 km/h 10 km/h 30 km/h 50 km/h 70 km/h
500 BEW (pixels) 3.40 6.31 16.38 27.56 38.28
MTF50 (cy/px) 0.1566 0.0810 0.0375 0.0271 0.0227
250 BEW (pixels) 3.61 4.68 8.78 13.86 18.99
MTF50 (cy/px) 0.1485 0.1118 0.0606 0.0423 0.0338
100 BEW (pixels) 3.56 3.86 4.73 6.33 8.47
MTF50 (cy/px) 0.1505 0.1445 0.1069 0.0806 0.0626
50 BEW (pixels) 3.37 3.66 3.99 4.52 5.32
MTF50 (cy/px) 0.1581 0.1524 0.1337 0.1140 0.0955

https://cdn.apub.kr/journalsite/sites/kta/2025-027-05/N0550270511/images/kta_2025_275_489_F6.jpg
Fig. 6.

Image quality trends at 15,000 lx illuminance

Table 3은 조도가 40,000 lx 조건에서 촬영한 HSMB 이미지에 대한 측정 결과이다. Fig. 7의 그래프로 나타나듯이 15,000 lx의 조건과 동일하게 HTMP의 속도가 증가할수록 BEW는 증가하고 MTF50은 감소하는 경향을 보이고 있다. 70 km/h의 이동 속도에서 카메라의 셔터스피드가 500 µs에서 50 µs로 빨라질수록 BEW는 35.37 pixels에서 5.30 pixels로 감소하였다. MTF50은 0.0155 cycle/pixel에서 0.0897 cycle/pixel로 증가하여 MB가 감소하였음을 보여준다.

Table 3.

Results of motion blur images depends on velocity of moving panel and shutter speeds at illuminance 40,000 lx

Shutter speed (µs) RR-IQA 0 km/h 10 km/h 30 km/h 50 km/h 70 km/h
500 BEW (pixels) 3.23 6.07 15.18 25.19 35.37
MTF50 (cy/px) 0.1692 0.0853 0.0403 0.0295 0.0155
250 BEW (pixels) 3.52 4.39 8.29 12.83 17.44
MTF50 (cy/px) 0.1634 0.1172 0.0583 0.0374 0.0277
100 BEW (pixels) 3.49 3.61 4.76 6.47 8.37
MTF50 (cy/px) 0.1594 0.1456 0.1041 0.0743 0.0567
50 BEW (pixels) 3.42 3.71 3.95 4.43 5.30
MTF50 (cy/px) 0.1569 0.1432 0.1337 0.1135 0.0897

https://cdn.apub.kr/journalsite/sites/kta/2025-027-05/N0550270511/images/kta_2025_275_489_F7.jpg
Fig. 7.

Image quality trends at 40,000 lx illuminance

4.2 NR-IQA 지표와 물리적 지표 간 상관관계 분석

두 조도 조건(15,000 lx, 40,000 lx)의 데이터를 통합하여, NR-IQA 지표들이 물리적 품질 지표인 BEW 및 MTF50과 얼마나 일관된 관계를 보이는지 분석하였다. 평가에는 선형적 관계의 강도를 측정하는 피어슨 선형 상관 계수(pearson linear correlation coefficient, PLCC), 예측값의 순위 단조성을 평가하는 스피어만 순위 상관 계수(spearman’s rank-order correlation coefficient, SROCC), 그리고 순위 일치도를 측정하는 켄달 순위 상관 계수(kendall’s rank correlation coefficient, KRCC)의 세 가지 지표가 사용되었다. 상관계수의 절대값이 1에 가까울수록 두 변수 간의 상관성이 높음을 의미한다. 분석 결과는 Table 4Table 5에 제시되어 있다.

Table 4.

Correlation between BEW and IQA metrics on the combined dataset

IQA SROCC PLCC KRCC
PSNR 0.7515 0.6038 0.5683
SSIM 0.1197 0.0138 0.0738
BRISQUE 0.4618 0.5051 0.3525
NIQE 0.3078 0.0977 0.2825
PIQE 0.3862 0.4076 0.2459
CPBD 0.6931 0.5631 0.5001
DBCNN 0.9244 0.7349 0.7911
ARNIQA 0.8774 0.8317 0.7460
Table 5.

Correlation between MTF50 and IQA metrics on the combined dataset

IQA SROCC PLCC KRCC
PSNR 0.7747 0.7481 0.5929
SSIM 0.1601 0.1018 0.1066
BRISQUE 0.4736 0.4957 0.3525
NIQE 0.339 0.3589 0.3072
PIQE 0.3634 0.4298 0.2295
CPBD 0.6747 0.717 0.4755
DBCNN 0.9280.90880.7993
ARNIQA 0.8664 0.8644 0.7132

NR-IQA 지표와 물리적 품질 지표(BEW, MTF50) 간의 상관관계를 분석한 결과(Tables 4 and 5), 지표별로 뚜렷한 차이가 나타났다. 먼저 FR-IQA 지표의 경우, PSNR은 BEW와의 상관관계에서 SROCC 0.7515, PLCC 0.6038, KRCC 0.5683을 기록하였으며, MTF50과의 상관관계에서는 SROCC 0.7747, PLCC 0.7481, KRCC 0.5929로 나타났다. 반면 SSIM은 BEW에 대해 SROCC 0.1197, PLCC 0.0138, KRCC 0.0738에 불과하였고, MTF50과의 상관관계도 SROCC 0.1601, PLCC 0.1018, KRCC 0.1066으로 매우 낮아, 구조적 유사성에 기반한 SSIM은 BEW 및 MTF50과 거의 상관관계가 없는 것으로 나타났다. 이는 균일한 MB가 이미지의 전반적인 구조, 휘도, 대비를 크게 변화시키지 않아 SSIM의 측정 메커니즘이 블러의 강도를 민감하게 감지하지 못하는 것으로 분석된다.

반면, 픽셀 단위 오차를 측정하는 PSNR은 BEW 및 MTF50과 상당히 높은 상관관계를 보였다. 이는 엣지가 블러 처리되면서 발생하는 수많은 픽셀 값의 미세한 변화가 이미지 전체에 걸쳐 누적되어 MSE에 유의미한 차이를 만들었을 것으로 분석된다. PSNR이 인간의 인지와는 거리가 있음에도 불구하고 특정 물리적 왜곡의 강도를 간접적으로 반영할 수 있음을 시사한다.

전통적인 지식 기반 NR-IQA 지표 중 BRISQUE는 BEW와의 상관관계에서 SROCC 0.4618, PLCC 0.5051, KRCC 0.3525를 보였고, MTF50과의 관계에서도 SROCC 0.4736, PLCC 0.4957, KRCC 0.3525를 기록하여 중간 수준의 결과를 나타냈다. 특히 자연 영상 통계(NSS) 모델에 기반한 NIQE는 BEW와의 상관계수에서 SROCC 0.3078, PLCC 0.0977, KRCC 0.2825로 낮았으며, MTF50과의 경우도 SROCC 0.339, PLCC 0.3589, KRCC 0.3072로 전반적으로 신뢰도가 떨어졌다. 이는 고속 병진 운동 블러가 무작위적인 노이즈나 일반적인 가우시안 블러와 달리, 특정 방향으로 픽셀을 평활화(smoothing)하는 고도로 구조화된 왜곡이라는 점에서 기인한다. 이러한 왜곡은 NSS 모델이 가정하는 ‘자연스러움’의 통계적 분포를 교란하기보다는 오히려 새로운 형태의 통계적 규칙성을 부여하므로 모델이 왜곡으로 민감하게 인지하지 못하는 것으로 분석된다.

PIQE의 경우 BEW에 대해 SROCC 0.3862, PLCC 0.4076, KRCC 0.2459를 기록하였고, MTF50과는 SROCC 0.3634, PLCC 0.4298, KRCC 0.2295로 나타나 NIQE보다는 다소 우수했지만 여전히 제한적이었다. 반면 CPBD는 BEW와의 상관성에서 SROCC 0.6931, PLCC 0.5631, KRCC 0.5001을 기록하였으며, MTF50과의 경우 SROCC 0.6747, PLCC 0.717, KRCC 0.4755로 다른 전통적 NR-IQA 지표 대비 우수한 성능을 보였다. 이는 엣지 기반 접근법이 블러의 물리적 크기와 선명도 저하를 효과적으로 반영했기 때문으로 해석된다.

딥러닝 기반 NR-IQA 지표의 경우, DBCNN은 BEW에 대해 SROCC 0.9244, PLCC 0.7349, KRCC 0.7911을 기록하였고, MTF50과의 관계에서는 SROCC 0.928, PLCC 0.9088, KRCC 0.7993으로 나타나 가장 높은 상관성을 보였다. 이는 DBCNN이 물리적 블러 크기와 선명도 저하를 정밀하게 반영할 수 있음을 의미한다. ARNIQA 또한 BEW에 대해 SROCC 0.8774, PLCC 0.8317, KRCC 0.746을 보였으며, MTF50과는 SROCC 0.8664, PLCC 0.8644, KRCC 0.7132를 기록하여 DBCNN과 유사하게 매우 우수한 결과를 나타냈다.

딥러닝 기반 지표인 DBCNN과 ARNIQA는 전반적으로 BEW 및 MTF50과 가장 높은 상관관계를 보여 HSMB 이미지에서의 NR-IQA 성능 평가에 가장 효과적이라 할 수 있다. 다만, 이들 심층 모델은 연산 복잡도와 학습 데이터 의존성이 크므로, 실시간성이 중요한 MTSS 현장에서는 CPBD와 같은 경량 지표를 우선 적용하고, DBCNN와 ARNIQA와 같은 딥러닝 기반 NR-IQA는 보조적 분석 도구로 활용하는 전략을 고려할 필요가 있다.

5. 결 론

본 연구는 MTSS의 고속 촬영 환경에서 발생하는 MB에 따른 이미지 품질 저하 문제를 해결하기 위해, 범용 NR-IQA 지표의 유효성을 검증하고 적용 가능성을 규명하는 것에 목적이 있다. 이를 위해 자체적으로 개발한 HTMP와 ISO 12233 표준 실험 환경을 활용하여 조도(15,000 lx, 40,000 lx), 셔터속도(50–500 µs), 이동 속도(0–70 km/h) 조건에서 총 400장의 HSMB 데이터셋을 구축하였다.

본 연구의 주요 결과는 다음과 같다.

먼저, NR-IQA 지표의 평가기준을 마련하고자 BEW와 MTF50 물리적 지표로 MB 특성을 정량화하였다. 그 결과, 셔터 스피드를 500 µs까지 늦추면 BEW가 최대 38.28 pixels까지 증가하고 MTF50은 0.0227 cy/px로 감소하지만, 50 µs로 단축하면 BEW가 5.32 pixels까지 줄고 MTF50은 0.0955 cy/px로 회복되어 짧은 노출 시간이 이미지의 선명도 보존에 효과적임을 검증하였다.

이를 바탕으로 NR-IQA 지표와 물리적 지표 간의 상관관계를 분석한 결과, FR-IQA 지표인 SSIM이나 NSS 기반의 NIQE 등은 고속 이동 환경으로 구조화된 MB 특성을 반영하지 못하는 한계를 보였다. 반면, 엣지 기반 접근법인 CPBD는 물리적 지표와 높은 상관관계를 나타냈으며, 특히 DL 기반 지표인 DBCNN과 ARNIQA는 SROCC 및 PLCC 값에서 0.9 내외의 매우 높은 상관성을 보여, 고속 이동 환경에서도 물리적 품질 저하를 정밀하게 반영할 수 있음을 확인하였다.

적용성 측면에서는, CPBD와 같은 경량 NR-IQA 지표는 연산 복잡도가 낮아 실시간 평가에 유리하므로 고속 이동 환경에 활용 가능하며, DBCNN 및 ARNIQA와 같은 DL 기반 지표는 높은 정확도를 제공하는 대신 연산 부담이 크므로 후처리 분석이나 성능 검증용 보조 도구로 활용하는 전략이 적합할 수 있다.

본 연구는 MTSS를 활용한 고속 이동 환경에서 발생하는 HSMB에 대해 기존 NR-IQA 지표의 성능을 체계적으로 검증하고, 물리적 지표와의 연계성을 분석하였다. 이를 통해 MTSS로 촬영한 이미지의 품질을 정량적으로 평가하고 저품질 데이터를 효과적으로 관리함으로써, DL 기반 균열 검출의 안정성과 신뢰도를 향상시킬 수 있는 실증적 근거를 마련하였다. 향후 연구에서는 현장 데이터를 기반으로 한 실시간 품질 관리 프레임워크를 개발하고, 다양한 딥러닝 기반 NR-IQA 모델의 경량화 및 최적화를 통해 MTSS의 실무 적용성을 강화할 필요가 있다.

Acknowledgements

본 연구는 국토교통과학기술진흥원의 기반시설 첨단관리(total care) 기술개발사업(RS-2022-00142566)의 지원으로 수행되었습니다. 이에 감사드립니다.

저자 기여도

이철희는 연구 설계, 데이터 수집, 원고 작성을 하였고, 김동구와 김동규는 연구개념, 분석결과 및 원고 검토를 하였다.

References

1

Agnolucci, L., Galteri, L., Bertini, M., Del Bimbo, A. (2024), “ARNIQA: Learning distortion manifold for image quality assessment”, Proceedings of the 2024 IEEE/CVF Winter Conference on Applications of Computer Vision (WACV), Waikoloa, HI, USA, pp. 188-197.

10.1109/WACV57701.2024.00026
2

Artmann, U. (2013), “Image quality evaluation using moving targets”, Multimedia Content and Mobile Devices, Vol. 8667, pp. 398-409.

10.1117/12.2003027
3

Chen, W., Tan, X.Y., Yang, J. (2025), “Review of state-of-the-art in structural health monitoring of tunnel engineering”, Smart Underground Engineering, Vol. 1, No. 1, pp. 40-50.

10.1016/j.sue.2025.05.004
4

De, K., Masilamani, V. (2013), “Image sharpness measure for blurred images in frequency domain”, Procedia Engineering, Vol. 64, pp. 149-158.

10.1016/j.proeng.2013.09.086
5

Dinh, H., Wang, Q., Tu, F., Frymire, B., Mu, B. (2023), “Evaluation of motion blur image quality in video frame interpolation”, Electronic Imaging, Vol. 35, No. 8, pp. 262-1-262-5.

10.2352/EI.2023.35.8.IQSP-262
6

Giniatullin, A., Dmitrii, T., Elshin, L. (2024), “On the efficiency of the BRISQUE metric for assessing linearly blurred images when deconvoluted with 3x3 convolution matrices”, Proceedings of the Third International Conference on Optics, Computer Applications, and Materials Science (CMSD-III 2023), Vol. 13065, Dushanbe, Tajikistan, 130650U-1.

10.1117/12.3025069
7

Guo, J., Liu, P., Xiao, B., Deng, L., Wang, Q. (2024), “Surface defect detection of civil structures using images: Review from data perspective”, Automation in Construction, Vol. 158, 105186.

10.1016/j.autcon.2023.105186
8

Huang, H., Sun, Y., Xue, Y., Wang, F. (2017), “Inspection equipment study for subway tunnel defects by grey-scale image processing”, Advanced Engineering Informatics, Vol. 32, pp. 188-201.

10.1016/j.aei.2017.03.003
9

Koren, N. (2006), “The Imatest program: Comparing cameras with different amounts of sharpening”, Digital Photography II, Vol. 6069, 60690L.

10.1117/12.650848
10

Lee, C., Kim, D., Kim, D. (2025), “Performance verification of deep-learning based tunnel crack detection using no-reference image quality assessment”, Journal of Korean Tunnelling and Underground Space Association, Vol. 27, No. 4, pp. 287-304.

10.9711/KTAJ.2025.27.4.287
11

Liu, Y., Yeoh, J.K.W., Chua, D.K.H. (2020), “Deep learning-based enhancement of motion blurred UAV concrete crack images”, Journal of Computing in Civil Engineering, Vol. 34, No. 5, 04020028.

10.1061/(ASCE)CP.1943-5487.0000907
12

Masaoka, K. (2018), “Accuracy and precision of edge-based modulation transfer function measurement for sampled imaging systems”, IEEE Access, Vol. 6, pp. 41079-41086.

10.1109/ACCESS.2018.2856742
13

Mittal, A., Moorthy, A.K., Bovik, A.C. (2012), “No-reference image quality assessment in the spatial domain”, IEEE Transactions on Image Processing, Vol. 21, No. 12, pp. 4695-4708.

10.1109/TIP.2012.2214050
14

Mittal, A., Soundararajan, R., Bovik, A.C. (2013), “Making a completely blind image quality analyzer”, IEEE Signal Processing Letters, Vol. 20, No. 3, pp. 209-212.

10.1109/LSP.2012.2227726
15

Narvekar, N.D., Karam, L.J. (2011), “A no-reference image blur metric based on the cumulative probability of blur detection (CPBD)”, IEEE Transactions on Image Processing, Vol. 20, No. 9, pp. 2678-2683.

10.1109/TIP.2011.2131660
16

Pennada, S., Perry, M., McAlorum, J., Dow, H., Dobie, G. (2023), “Threshold-based Brisque-assisted deep learning for enhancing crack detection in concrete structures”, Journal of Imaging, Vol. 9, No. 10, 218.

10.3390/jimaging910021837888325PMC10607118
17

Venkatanath, N., Praneeth, D., Maruthi, C.B., Sumohana, S.C., Swarup, S.M. (2015), “Blind image quality evaluation using perception based features”, Proceedings of the Twenty First National Conference on Communications, Mumbai, India, pp. 1-6.

10.1109/NCC.2015.7084843
18

Wang, Z., Bovik, A.C., Sheikh, H.R., Simoncelli, E.P. (2004), “Image quality assessment: From error visibility to structural similarity”, IEEE Transactions on Image Processing, Vol. 13, No. 4, pp. 600-612.

10.1109/TIP.2003.819861
19

Wu, Q., Li, H., Meng, F., Ngan, K.N., Zhu, S. (2015), “No reference image quality assessment metric via multi-domain structural information and piecewise regression”, Journal of Visual Communication and Image Representation, Vol. 32, pp. 205-216.

10.1016/j.jvcir.2015.08.009
20

Zhang, W., Ma, K., Yan, J., Deng, D., Wang, Z. (2020), “Blind image quality assessment using a deep bilinear convolutional neural network”, IEEE Transactions on Circuits and Systems for Video Technology, Vol. 30, No. 1, pp. 36-47.

10.1109/TCSVT.2018.2886771
21

Zhu, H., Li, L., Wu, J., Dong, W., Shi, G. (2020), “MetaIQA: Deep meta-learning for no-reference image quality assessment”, Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, WA, USA, pp. 14143-14152.

10.1109/CVPR42600.2020.01415
페이지 상단으로 이동하기