SQL 집계함수
SQL에서는 집계함수를 많이 사용합니다.
GROUP BY와 함께 COUNT, SUM 등을 많이 사용하게 됩니다.
집계의 예제를 다시 살펴보겠습니다.
다음은 GROUP BY와 COUNT를 사용해, 나라별 인원 집계를 내려본 것입니다.
SELECT Country, COUNT(*)
FROM customers
GROUP BY Country;
위 쿼리의 실행 결과 중 상위 5개는 다음과 같습니다.
만약 데이터에 숫자인 컬럼이 있었다면, SUM이나 AVG도 사용해 볼 수 있을 것입니다.
윈도우 함수
윈도우 함수는 이 GROUP BY와 비슷하지만, 집계가 없는 것이라고 생각하면 됩니다.
행과 행간의 관계를 쉽게 정의 하기 위해 만든 함수입니다.
따라서 SQL에서 지원하는 집계 함수 외에도, RANK나 ROW_NUMBER와 같은 윈도우 전용 함수가 나왔습니다.
윈도우 함수는 보통 OVER 괄호 안에 PARTITION BY 또는 ORDER BY를 사용하게 됩니다.
아래는 나라에 따른 인원을 COUNT했지만, 집계는 하지 않은 예제입니다.
SELECT Country,
Count(*) OVER (PARTITION BY Country) AS cnt
FROM customers
위 쿼리의 결과 중 상위 10개는 다음과 같습니다.
결과를 보면 아시겠지만, Country값이 같으면 cnt가 같습니다.
하지만 GROUP BY를 사용할때와는 다르게, 행을 집계하지는 않았습니다.
RANK
앞서 RANK와 ROW_NUMBER는 윈도우 함수 전용이라고 언급했습니다.
위의 결과에 RANK를 적용해 어느 나라의 사람이 많은지 알아보겠습니다.
참고로, 윈도우 함수는 중첩해서 사용할 수는 없습니다.
하지만 서브쿼리는 사용 가능하기에 아래와 같은 예제를 실행해볼 수 있습니다.
SELECT Country, cnt,
RANK() OVER (ORDER BY cnt DESC) AS rnk
FROM(
SELECT Country,
Count(*) OVER (PARTITION BY Country) AS cnt
FROM customers
) AS counts;
FROM안에 있는 SELECT문은 바로 위에 있는 예제입니다.
위 쿼리의 결과 중 상위 10개는 다음과 같습니다.
미국에 Customer가 제일 많아 USA가 최 상위로 나오게 됩니다.
위를 조금 더 실용적으로 표현해보기 위해 집계와 윈도우를 함께 사용해보겠습니다.
다음은 내부 윈도우함수를 GROUP BY를 사용한 집계로 바꿔본 것입니다.
SELECT *, RANK() OVER (ORDER BY cnt DESC) AS rnk
FROM(
SELECT Country, Count(*) AS cnt
FROM customers
GROUP BY Country
) AS counts;
위 쿼리의 결과 중 상위 10개는 다음과 같습니다.
실제 쿼리 사용
SELECT
COUNT(*) OVER(PARTITION BY B.r_no, B.r_g_no) -- 2컬럼별 항목 갯수
, COUNT(*) OVER(PARTITION BY B.r_no) -- 1컬럼별 항목 갯수
FROM A
JOIN B ON B.no = A.no AND B.r_no = A.r_no
JOIN C ON C.no = B.no AND C.r_g_no = B.r_g_no
WHERE A.no = 1001
AND A.cstmr_no = 1
'Database > Mysql, MariaDB' 카테고리의 다른 글
mariadb, mysqlDB root password 초기화 (0) | 2024.03.23 |
---|---|
[Mysql] Time to Seconds 과 Seconds to time. (0) | 2021.08.24 |
(1292): Truncated incorrect DOUBLE value (0) | 2020.11.19 |
[Mysql] DUPLICATE KEY UPDATE for multiple rows insert in single query (0) | 2020.11.18 |
[Mysql] Explain Plan 보는법 (0) | 2020.11.18 |