데이터 출처와 방법론

한 줄 요약

이 사이트의 모든 가격 정보는 국토교통부가 공개하는 아파트 매매 실거래가를 매일 새벽 자동으로 받아 정리한 것입니다. 숫자 계산은 사람이 하지 않고 매일 자동으로 돕니다. “분석 리포트”도 정해진 기준에 들어맞는 거래에 대해서만 자동으로 작성됩니다.

아래는 “정확히 어떤 데이터를 어떻게 계산하나?” 가 궁금한 분을 위한 자세한 방법론입니다. 굳이 다 읽지 않아도 됩니다.

1. 데이터 출처

이 사이트의 모든 실거래 정보는 국토교통부 부동산 거래 정보 OpenAPI(data.go.kr) 에서 매일 새벽 04:00 KST 에 자동 수집됩니다. 응답은 월 단위로 받아 일별 신고일(dealYear/Month/Day) 기준으로 적재합니다.

좌표 정보는 카카오 로컬 REST API 로 단지 단위 1회 지오코딩 후 캐시합니다.

2. 신고 지연에 대한 안내

부동산 매매 계약은 법적으로 계약 후 30일 이내 신고 의무가 있습니다. 따라서 "오늘 계약된 거래"가 오늘 데이터로 잡히는 경우는 매우 드물고, 신고는 보통 며칠~몇 주에 걸쳐 누적됩니다. 본 사이트의 "오늘 신고된 거래" 마커가 0건인 것은 데이터 누락이 아니라 한국 실거래가 신고 정책의 자연스러운 결과입니다.

3. 평당가 계산

평당가(원/㎡) = 거래금액(만원) × 10,000 ÷ 전용면적(㎡)

UI 표시는 평당 만원으로 환산: price_per_sqm × 3.3058 ÷ 10,000. 해제(cdeal_type 채워진) 거래는 모든 통계에서 제외합니다.

4. 자치구 평당가 변화율 (지도 메인)

기간(7일·30일·90일·1년·3년·5년·10년) 토글에 따라 그 기간의 평당가 중앙값과 그 직전 동일 기간의 중앙값을 비교해 변화율을 계산합니다 ((현재 ÷ 직전 - 1) × 100). 평균이 아닌 중앙값을 사용하는 이유: 이상치(고가 거래 1~2건) 영향 최소화.

표본 임계값: 윈도우가 작을수록 표본 부족에 민감하므로 다음 기준을 모두 만족할 때만 변화율을 표시 (둘 다 미달 시 회색):

5. 데이터 분석 리포트 — 필터링 기준

신규로 신고된 거래 중 다음 OR 조건 하나라도 만족하고, 비교 기준 표본이 ≥ 5건일 때만 리포트로 발행합니다. 자치구당 일 최대 1건, 전체 일 최대 25건으로 제한해 thin content 위험을 차단합니다.

우선순위: record_high > outlier > volatility, 그 다음 변동률 절대값 큰 순.

6. AI 활용 범위

모든 통계(중앙값, percentile, 표본수, 변화율, 신기록 판정)는 PostgreSQL 쿼리로 결정적으로 계산됩니다. LLM(Anthropic Claude)은 사전 계산된 사실값(JSON facts)을 자연어 문단으로 정리하는 데에만 사용되며, 추가 추론·일반화·미사여구·매수/매도 자문은 시스템 프롬프트로 금지합니다.

글 footer 에 사용 모델·생성 시각이 명시됩니다. 같은 facts 입력은 같은 글을 생성하도록 결정적 변동 요소(거래·통계 수치)를 전적으로 데이터에서 끌어옵니다.

7. 한계와 면책

문의·정정 요청은 메인 페이지의 피드백 버튼(💬)으로 부탁드립니다.