Kafka 심화 개념 | LogLee's Training Ground

Kafka 심화 개념

Producer Acks, Batch, Page Cache and Flush #

acks 설정은 요청이 성공할 때를 정의하는 데 사용되는 Producer 에 설정하는 Parameter

acks=0 : ack가 필요하지 않음. 이 수준은 자주 사용되지 않음. 메시지 손실이 다소 있더라도 빠르게 메시지를 보내야 하는 경우에 사용된다.
acks=1(default) : Leader가 메시지를 수신하면 ack를 보냄. Leader가 Producer에게 ACK를 보낸 후, Follower가 복제하기념전에 Leader에 장애가 발생하면 메시지가 손실. “At most once(최대 한 번)” 전송을 보장
acks=-1(acks=all) : 메시지가 Leader가 모든 Replica까지 Commit 되면 ack를 보냄 Leader를 잃어도 데이터가 살아남을 수 있도록 보장. 그러나 대기 시간이 더 길고 특정 실패 사례에서 반복되는 데이터 발생 가능성 있음. “At least once(최소 한 번)” 전송을 보장

Producer Retry #

retry와 관련된 Parameters:

Parameter	설명	Default 값
retries	메세지를 send하기 위해 재시도하는 횟수	MAX_INT
retry.backoff.ms	재시도 사이에 추가되는 대기 시간	100
request.timeout.ms	Producer가 응답을 기다리는 최대 시간	30,000(30초)
delivery.timeout.ms	send() 후 성공 또는 실패를 보고하는 시간의 상한	120,000(2분)
=> retries를 조정하는 대신 delivery.timeout.ms 조정으로 retries 제어

Producer Batch 처리 #

메시지를 모아서 한번에 전송
Batch 처리는 RPC(Remote Procedure Call)수를 줄여서 Broker가 처리하는 작업이 줄어들기 때문에 더 나은 처리량을 제공
linger.ms : (default : 0). 메시지가 함께 Batch 처리될 때까지 대기 시간
batch.size : (default : 16KB). 보내기 전 Batch의 최대 크기

Batch 처리의 일반적인 설정은 linger.ms=100 및 batch.size=1000000

Page Cache와 Flush #

메시지는 Partition에 기록됨
Partition은 Log Segment file로 구성 (기본값 : 1GB마다 새로운 Segment 생성)
성능을 위해 Log Segment는 OS Page Cache에 기록됨
로그 파일에 저장된 메시지의 데이터 형식은 Broker가 Producer로부터 수신한 것, 그리고 Consumer에게 보내는 것과 정확히 동일하므로, Zero-Copy(Zero-copy 전송은 데이터가, User Space에 복사되지 않고, CPU 개입 없이 Page Cache와 Network Buffer 사이에서 직접 전송되는 것을 의미. 이것을 통해 Broker Heap 메모리를 절약하고 또한 엄청난 처리량을 제공)가 가능
Page Cache는 다음과 같은 경우 디스크로 Flush됨
- Broker가 완전히 종료
- OS background “Flusher Thread” 실행

Flush 전에 Broker 장애가 발생하면… #

OS가 데이터를 디스크로 flush하기 전 broker의 시스템에 장애가 발생하면 해당 데이터가 손실됨
Partition이 Replication되어 있다면, Broker가 다시 온라인 상태가 되면 필요시 Leader Replica에서 데이터가 복구됨
Replication이 없다면, 데이터는 영구적 손실 가능

Kafka 자체 Flush 정책 #

마지막 Flush 이후의 메시지 수(log.flush.interval.messages) 또는 시간(log.flush.interval.ms)으로 Flush(fsync)를 트리거하도록 설정할 수 있음
Kafka는 운영 체제의 background Flush 기능(예: pdflush)을 더 효율적으로 허용하는 것을 선호하기 때문에 이러한 설정은 기본적으로 무한(기본적으로 fsync 비활성화)으로 설정
이러한 설정을 기본값으로 유지하는 것을 권장
*.log 파일을 보면 디스크로 Flush된 데이터와 아직 Flush되지 않은 Page Cache (OS Buffer)에 있는 데이터가 모두 표시됨
Flush된 항목과 Flush되지 않은 항목을 표시하는 Linux 도구(예: vmtouch)도 있음

Replica Failure #

메시지가 ISR 리스트의 모든 Replica에서 수신되면 Commit된 것으로 간주

n개의 Replica가 있는 경우 n-1개의 장애를 허용 가능

Follower가 실패하는 경우	Leader가 실패하는 경우
Leader에 의해 ISR 리스트에서 삭제됨	Controller는 Follower 중에서 새로운 Leader를 선출
Leader는 새로운 ISR을 사용해 Commit함	Controller는 새 Leader와 ISR 정보를 먼저 Zookeeper에 Push한 다음 로컬 캐싱을 위해 Broker에 Push함

Replica Recovery #

Consumer Rebalance #

Partition Assignment Strategy #

Cooperative Sticky Assignor #

Kafka Log File #

Log Retention and Cleanup Policy #

Exactly Once Semantics(EOS) #