트랜잭션은 ACID라는 원자성(Atomicity), 일관성(Consistency), 격리성(Isolation), 지속성(Durability) 를 보장해야 합니다.
원자성: 트랜잭션 내에서 실행한 작업들은 마치 하나의 작업인 것처럼 모두 성공하든가 모두 실패해야 합니다.
일관성: 모든 트랜잭션은 일관성 있는 데이터베이스 상태를 유지해야 합니다.
격리성: 동시에 실행되는 트랜잭션들이 서로에게 영향을 미치지 않도록 격리합니다.
지속성: 트랜잭션을 성공적으로 끝내면 그 결과가 항상 기록되어야 합니다.
이번 포스팅에서는 격리성에 대해서 알아보겠습니다.
트랜잭션 간에 격리성을 완벽히 보장하려면 트랜잭션을 거의 차례대로 실행해야 하며, 이 경우 동시성 처리 성능이 매우 나빠집니다.
격리 수준은 4단계가 있습니다.
- READ_UNCOMMITTED (커밋되지 않은 읽기)
- READ_COMMITTED (커밋된 읽기)
- REPEATABLE READ (반복 가능한 읽기)
- SERIALIZABLE (직렬화 가능)
READ_UNCOMMITTED가 격리성이 가장 낮고, SERIALIZABLE이 가장 높습니다.
격리 수준에 따라 아래와 같은 문제가 발생할 수 있습니다.
- DIRTY READ
- NON-REPEATABLE READ (반복 불가능한 읽기)
- PHANTOM READ
격리 수준을 이야기하자면 Undo Log에 대해서 알아야 합니다.
Undo Log, 격리 수준 순서로 설명을 이어가겠습니다.
Undo Log
실행 취소 로그 레코드의 집합으로 트랜잭션 실행 후 Rollback 시 Undo Log를 참조해 이전 데이터로 복구할 수 있도록 로깅 해놓은 영역입니다.
작업 수행 중에 수정된 페이지들이 버퍼 관리자의 버퍼 교체 알고리즘에 따라서 디스크에 출력될 수 있습니다. 버퍼 교체는 전적으로 버퍼의 상태에 따라 결정되며, 일관성 관점에서 봤을 때는 임의의 방식으로 일어나게 됩니다. 즉 아직 완료되지 않은 트랜잭션이 수정한 페이지들도 디스크에 출력될 수 있으므로, 만약 해당 트랜잭션이 어떤 이유든 정상적으로 종료될 수 없게 되면 트랜잭션이 변경한 페이지들을 원상 복구되어야 합니다. 이러한 복구를 Undo 라고 합니다.
버퍼(Buffer)
데이터의 임시 저장소로, 두 장치나 프로세스 간에 데이터를 일시적으로 저장하는 메모리 공간입니다.
페이지(Page)
InnoDB 스토리지 엔진이 데이터를 디스크에 저장하고 관리할 때 사용하는 기본적인 데이터 단위입니다.
파일로 저장되는 과정
-- INSERT
INSERT INTO member(m_id, m_name, m_area) VALUES (12, '홍길동', '서울');
COMMIT;
-- UPDATE
UPDATE member SET m_area = '경기' WHERE m_id = 12;
Undo Log는 Log Buffer의 Undo Records 영역에 기록됩니다.
저장되는 데이터는 PK값과 변경되기 전의 데이터 값입니다.
Undo Records
Update나 Delete로 데이터를 변경할 때, 변경되기 전의 데이터(이전 데이터)를 보관하는 영역
InnoDB Buffer pool
Innodb 엔진에서 테이블이나 인덱스 데이터를 캐시하는 메모리 영역을 말합니다.
데이터를 메모리에서 직접 액세스하여 I/O 작업 시 속도가 빠릅니다.
Undo Log는 CheckPoint 시 디스크에 기록됩니다.
위 SQL 코드를 보면 update 쿼리가 실행되면 (commit/rollback) 전 InnoDB Buffer Pool에 캐싱된 데이터는 update한 정보로 수정됩니다. 데이터를 수정함과 동시에 rollback을 대비하기 위해, 업데이트 전의 데이터를 undo records로 기록하는 것입니다.
Checkpoint
Buffer Pool에 있는 데이터를 디스크에 주기적으로 저장하여 데이터 무결성을 보장하는 과정이며 데이터가 메모리에서 디스크로 쓰이는 시점을 의미합니다.
READ UNCOMMITTED
커밋되지 않은 데이터를 읽을 수 있습니다.
예를 들어 트랜잭션1일 데이터를 수정하고 있는데 커밋하지 않아도 트랜잭션 2가 수정 중인 데이터를 조회할 수 있는데 이것을 DIRTY READ라고 합니다. 트랜잭션 2가 DIRTY READ한 데이터를 사용하는데 트랜잭션 1을 롤백하면 데이터 정합성에 심각한 문제가 발생할 수 있습니다.
데이터 정합성이란?
데이터의 일관성과 정확성을 유지하는 개념입니다. 즉, 데이터가 정확하고 일관되게 저장, 관리, 처리되며, 비정상적인 변형이나 손상이 발생하지 않도록 보장하는 것을 말합니다.
READ COMMITTED
커밋한 데이터만 읽을 수 있으며 스프링 트랜잭션의 격리 수준 기본값입니다.
따라서 DIRTY READ가 발생하지 않지만 NON-REPEATABLE READ는 발생할 수 있습니다.
예를 들어 트랜잭션 1이 회원 A를 조회 중인데 갑자기 트랜잭션 2가 회원 A를 수정하고 커밋하면 트랜잭션 1이 다시 회원 A를 조회했을 때 수정된 데이터가 조회됩니다. 이처럼 반복해서 같은 데이터를 읽을 수 없는 상태를 NON-REPEATABLE READ라 합니다.
REPEATABLE READ
한 번 조회한 데이터를 반복해서 조회해도 같은 데이터가 조회됩니다.
하지만 PHANTAOM READ는 발생할 수 있습니다.
예를 들어 트랜잭션 1이 10살 이하의 회원을 조회했는데 트랜잭션 2가 5살 회원을 추가하고 커밋하면 트랜잭션1이 다시 10살 이하의 회원을 조회했을 때 회원 하나가 추가된 상태로 조회됩니다. 이처럼 반복 조회 시 결과 집합이 달라지는 것을 PHANTOM READ라고 합니다.
SERIALIZABLE
가장 엄격한 트랜잭션 격리 수준입니다.
여기서는 PHANTOM READ가 발생하지 않지만 동시성 처리 성능이 급격히 떨어질 수 있습니다.
Reference URIs
https://nesoy.github.io/articles/2019-05/Database-Transaction-isolation
https://velog.io/@pk3669/Mysql-Redo-Undo-Log
https://blog.naver.com/PostView.nhn?blogId=writer0713&logNo=222343184320&redirect=Dlog&widgetTypeCall=true&directAccess=false
Reference Books
자바 ORM 표준 JPA 프로그래밍
'[개발] 데이터베이스 > MySQL' 카테고리의 다른 글
Driving 테이블의 정의와 선정 방법 (2) | 2024.12.01 |
---|---|
에러) Column in field list is ambiguous (0) | 2024.10.23 |
MySQL 프로시저를 자바 코드로 이관 (0) | 2023.11.13 |
MySQL) DATABASE 에서 가장 큰 용량을 지닌 테이블 조회하기 (0) | 2021.09.09 |
MySQL Server 설치 오류시 해결방법 (0) | 2017.12.02 |