SCS; feature engineering

0x20. feature engineering

data source
  • 국토교통부: 유효토심, 자갈함량, 수문 지질단위, 지질 구조 밀도, 배수 등급
  • 서울 열린 데이터 광장: 포트홀 보수 위치, 도시계획시설(도로), 하수관거 통계
  • 건축물 대장 정보(서울 열린 데이터 광장), 지하 안전 정보(국토교통부)

0x21. feature selection1. Natural Factors (자연적 요인)

*자연적 요인의 feature extraction 원리
Feature소스 테이블/뷰과학적 근거출처
risk_soil_depthrisk_soil_depth얕은 토양층은 지반 침하에 더 취약함국토교통부_유효토심
risk_stone_contentrisk_stone_content자갈 함량은 지반 안정성과 투수성에 영향국토교통부_자갈함량
risk_faultrisk_fault단층대는 지반 불안정성의 주요 원인국토교통부_단층
risk_hydrorisk_hydro수문지질학적 특성은 지하수 흐름과 침식에 영향국토교통부_수문지질단위
risk_fracture_densityrisk_fracture_density지질 균열 밀도가 높을수록 지반 취약성 증가국토교통부_지질구조밀도
risk_drainagerisk_drainage배수 불량 지역은 물의 정체 및 침투로 인한 위험 증가국토교통부_배수등급

0x22. feature selection2. Anthropogenic Factors (인공적 요인)

인공 요인의 feature extraction 원리
  • 보안 제한 인프라 데이터의 통계적 대체: 공공 건축 기반 프록시 설계
  • 이 재질의 관이 얼마나 오래 있었는지, 이 재질의 고장률이 평균적으로 얼마나 되는지, 전체 관 중 얼마나 최근에 보강되었는지를 통합하여, 해당 격자의 현재 기준 고장확률(위험도 점수)를 구함.
Feature소스 테이블/뷰과학적 근거출처
infrastructure_vulnerabilitygrid_pipe_risk 시리즈Weibull 모델 기반 하수관 노후화 및 취약성 지수서울특별시_건축물대장 정보
dynamic_signaldynamic_signal_* 시리즈포트홀 제보 기반 지표면 손상 신호 (제보율별)서울 열린데이터 광장_서울시 포트홀 보수 위치

0x23. feature selection3. domain based interaction feature

지질-인프라 상호작용 (Geology-Infrastructure Interactions)
Feature계산식소스 테이블과학적 근거
soil_pipe_riskrisk_soil_depth × grid_pipe_risk_X.risk_piperisk_soil_depth, grid_pipe_risk_X얕은 토양층과 노후 파이프의 결합은 지반 침하 위험 가중
fault_pipe_riskrisk_fault × grid_pipe_risk_X.risk_piperisk_fault, grid_pipe_risk_X단층대의 하수관은 지반 운동으로 인한 손상 위험 증가
hydro_pipe_riskrisk_hydro × grid_pipe_risk_X.risk_piperisk_hydro, grid_pipe_risk_X수문지질학적 취약 지역의 노후 하수관은 지하수 영향으로 위험 증가
수문-인프라 상호작용 (Hydro-Infrastructure Interactions)
Feature계산식소스 테이블과학적 근거
drainage_pipe_riskrisk_drainage × grid_pipe_risk_X.risk_piperisk_drainage, grid_pipe_risk_X배수 불량 지역의 노후 하수관은 침식 위험 증가
pothole_pipe_riskdynamic_signal_X.tilde_R_g × grid_pipe_risk_X.risk_pipedynamic_signal_X, grid_pipe_risk_X포트홀 제보와 파이프 위험도의 복합 작용
지질-도로 상호작용 (Geology-Road Interactions)
Feature계산식소스 테이블과학적 근거
soil_road_stressrisk_soil_depth × risk_road_loadrisk_soil_depth, risk_road_load얕은 토양층 위의 도로 하중은 지반 압력 증가
fault_road_stressrisk_fault × risk_road_features.major_road_presencerisk_fault, risk_road_features단층대 위의 주요 도로는 지반 변동 위험 증가
수문-도로 상호작용 (Hydro-Road Interactions)
Feature계산식소스 테이블과학적 근거
drainage_road_riskrisk_drainage × risk_road_features.road_area_ratiorisk_drainage, risk_road_features배수 불량 지역의 도로 면적 비율이 높으면 물의 우회 침투 위험 증가
pothole_drainage_riskdynamic_signal_X.tilde_R_g × risk_drainagedynamic_signal_X, risk_drainage배수 불량 지역의 포트홀은 물의 침투 경로 형성으로 위험 증가

0x24. feature selection4. Spatial Context Features

인접 그리드 특성 (Neighboring Grid Characteristics)
Feature계산 방법소스 테이블과학적 근거
neighboring_pipe_riskST_DWithin 기반 인접 그리드의 pipe_risk 평균grid_pipe_risk_X, grid_100m지하 인프라 취약성은 공간적으로 연속적인 경향
neighboring_drainage_riskST_DWithin 기반 인접 그리드의 drainage_risk 평균risk_drainage, grid_100m배수 문제는 지역적 특성을 가짐
과거 침하 관련 특성 (Historical Subsidence Characteristics)
Feature계산 방법소스 테이블과학적 근거
min_distance_to_sinkholeST_Distance 기반 최소 거리grid_100m, subsidence_accident_*과거 침하 지점 근처는 유사한 지질/인프라 조건 공유
subsidence_density반경 300m 내 침하 발생 건수grid_100m, subsidence_accident_*싱크홀은 공간적 군집성을 보이는 경향

0x25. feature engineering: 제보 기반 feature 제작

pothole_kde_density각 포트홀 제보가 중심으로부터 퍼지는 영향력(가우시안 분포 형태)을 갖는다고 보고,이 영향력이 현재 위치에 얼마나 겹쳐지는지를 누적해서 계산한 값으로, 포트홀 제보가 많고 제보 위치가 현재 위치에 가까울 수록 이 값이 높아짐$\sum_{i=1}^n \frac{1}{h^2}K(\frac{||c_j-x_i||}{h})$
pothole_pipe_interactionpothole_kde_density × pipe_risk
pothole_drainage_interactionpothole_kde_density × risk_drainage