본문 바로가기
Splunk

[tip] 분산 명령어를 먼저 사용하라

by 앗사비 2025. 1. 10.
728x90
a)
index=main sourcetype=access_combined_wcookie
| stats count by clientip
| rename clientip as sourceIp
| table sourceIp, count

b)
index=main sourcetype=access_combined_wcookie
| rename clientip as sourceIp
| stats count by sourceIp
| table sourceIp, count

 

스플렁크 블로그를 보다가 알게됨

명령어 순서만 다를 뿐인데 b가 a보다 더 빠름

rename이 분산형이라 그렇다

 

 

명령어의 스트리밍 유형에 따른 차이

  •   스트리밍
    • 분산 : 인덱서에서 동작 (ex. rename)
    • 중앙 : 검색헤더에서 동작 (ex. head)
  • 비스트리밍 : 검색헤더에서 동작 (ex. sort)
    • 스트리밍 분산형 먼저 처리 후 사용하는 것이 효율적 (이벤트가 매우 많은 경우)
    • 비유 : 놀이터에서 친구들이 각자 구역을 맡아서 먼저 쓰레기를 주워오면, 나중에 한 사람이 중앙에서 그 쓰레기를 모아서 정리하는 것이 훨씬 빠르고 효율적이에요. 만약 처음부터 한 사람이 모든 쓰레기를 모으려고 하면 시간이 훨씬 더 오래 걸리겠죠. 이렇게 각자 먼저 할 일을 나눠서 처리한 후에 마지막에 정리하는 것이 더 빠르고 효율적이니까, 스트리밍 분산형 작업을 먼저 처리하는 것이 좋은 거예요. (gpt 도움)

 

---

참고

https://www.splunk.com/en_us/blog/tips-and-tricks/learn-spl-command-types-efficient-search-execution-order-and-how-to-investigate-them.html

https://velog.io/@munang/Splunk-%EC%9D%98-%EC%BB%A4%EB%A7%A8%EB%93%9C-%EC%9C%A0%ED%98%95-Commands-Type

 

728x90