SQL Study/Programmers

프로그래머스[Lv.4] 오프라인/온라인 판매 데이터 통합하기

choidawon 2025. 11. 21. 09:40

문제설명

ONLINE_SALE 테이블과 OFFLINE_SALE 테이블에서 2022년 3월의 오프라인/온라인 상품 판매 데이터의 판매 날짜, 상품ID, 유저ID, 판매량을 출력하는 SQL문을 작성해주세요. OFFLINE_SALE 테이블의 판매 데이터의 USER_ID 값은 NULL 로 표시해주세요. 결과는 판매일을 기준으로 오름차순 정렬해주시고 판매일이 같다면 상품 ID를 기준으로 오름차순, 상품ID까지 같다면 유저 ID를 기준으로 오름차순 정렬해주세요.

 

ONLINE_SALE 테이블

ONLINE_SALE_ID USER_ID PRODUCT_ID SALES_AMOUNT SALES_DATE
1 1 3 2 2022-02-25
2 4 4 1 2022-03-01
4 2 2 2 2022-03-02
3 6 3 3 2022-03-02
5 5 5 1 2022-03-03
6 5 7 1 2022-04-06

 

OFFLINE_SALE 테이블

OFFLINE_SALE_ID PRODUCT_ID SALES_AMOUNT SALES_DATE
1 1 2 2022-02-21
4 1 2 2022-03-01
3 3 3 2022-03-01
2 4 1 2022-03-01
5 2 1 2022-03-03
6 2 1 2022-04-01

 

각 테이블의 2022년 3월의 판매 데이터를 합쳐서, 정렬한 결과는 다음과 같아야 합니다.

SALES_DATE PRODUCT_ID USER_ID SALES_AMOUNT
2022-03-01 1 NULL 2
2022-03-01 3 NULL 3
2022-03-01 4 NULL 1
2022-03-01 4 4 1
2022-03-02 2 2 2
2022-03-02 3 6 3
2022-03-03 2 NULL 1
2022-03-03 5 5 1

 

코드설명

✔ 온라인 판매(ONLINE_SALE)
✔ 오프라인 판매(OFFLINE_SALE)

"온라인 + 오프라인 판매 내역을 형식 통일해서 한 번에 조회"

 

JOIN은 기본적으로

두 테이블의 ‘공통된 키(열)’를 기준으로 행을 연결하는 작업

즉,
두 테이블을 "옆으로" 붙이는 방식이다.

그냥 위아래로 합쳐서(UNION),
동일한 컬럼 구조로 만들어 하나의 판매 내역 리스트를 만들어야 하므로 JOIN을 사용할 수 없다.

JOIN에는 기준이 되는 공통 컬럼이 필요함

오프라인 판매에는 USER_ID가 없음

JOIN 예시가 되려면 이런 게 있어야 한다:

  • product_id로 연결?
  • sales_date로 연결?

하지만 두 테이블의 날짜/상품이 일대일로 매칭되지 않음
즉, JOIN할 연결 기준이 애초에 성립하지 않는다.

 

UNION은 “서로 다른 테이블을 같은 구조로 맞춘 뒤 합치는 방식”

온라인 판매 내역에는 고객 정보(USER_ID)가 있으므로 그대로 가져온다.

  • DATE_FORMAT: 날짜를 2023-03-15 이런 문자열 형태로 통일
  • MONTH(SALES_DATE) = 3: 3월 데이터만 가져오기
  • USER_ID 있음 → 그대로 표시
  • NION: 중복 제거
  • UNION ALL: 중복 제거 없이 그대로 합쳐줌 → 훨씬 빠름, 판매 내역은 중복될 가능성이 거의 없기 때문에
    중복 제거가 필요 없다 → UNION ALL이 정상적인 선택

오프라인 판매에는 USER_ID(회원 정보)가 없다.
→ 그래서 USER_ID 자리에 NULL을 넣어주고 구조를 맞춘다.

UNION ALL로 합치려면 두 SELECT문의 컬럼 개수와 순서가 정확히 같아야 함.

온라인: (날짜, 제품번호, 고객ID, 판매량)
오프라인: 고객ID 없음 → NULL로 맞춤

 

코드

-- 코드를 입력하세요
SELECT DATE_FORMAT(SALES_DATE, '%Y-%m-%d') AS SALES_DATE, PRODUCT_ID, USER_ID, SALES_AMOUNT
FROM ONLINE_SALE
WHERE MONTH(SALES_DATE) = 3
UNION ALL
SELECT DATE_FORMAT(SALES_DATE, '%Y-%m-%d') AS SALES_DATE, PRODUCT_ID, NULL AS USER_ID, SALES_AMOUNT
FROM OFFLINE_SALE
WHERE MONTH(SALES_DATE) = 3
ORDER BY SALES_DATE, PRODUCT_ID, USER_ID

 

출처 : https://school.programmers.co.kr/learn/courses/30/lessons/131537

 

프로그래머스

SW개발자를 위한 평가, 교육의 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프

programmers.co.kr