2월 25, 2022

7 분 안에 대기 시간을 올바르게 측정하는 방법

대기 시간을 올바르게 측정하려면 품질 데이터가 있어야합니다. “2016 글로벌 최고 경영자 아웃룩”은 대표이사의 84%가 결정을 내리고 있는 데이터의 품질에 대해 우려하고 있으며,이는 너무 자주 데이터가 오도될 수 있기 때문이다.

데이터에 관심이 있는 기업과 그렇지 않은 기업 간의 차이는 엄청납니다. 데이터 기반 설계를 채택한 기업은 다른 투자 및 정보 기술 사용을 고려할 때 예상되는 것보다 5-6%높은 출력이 있음을 발견했습니다. 이러한 이유만으로도 비즈니스 성공에 중요한 대기 시간을 이해할 수 있습니다.

단 7 분 만에 대기 시간 측정에 대해 알아야 할 모든 것을 배울 수 있습니다

  • 대기 시간을 측정하는 방법
  • 왜 제대로 측정이 중요
  • 대기 시간 데이터를 볼 때 일반적인 함정
  • 즉각적인 피드백의 중요성
  • 샘플링되지 않은 데이터가 필요한 이유

대기 시간은 무엇입니까?

Dictionary.com 대기 시간을”하드웨어 시스템의 한 구성 요소가 다른 구성 요소에 의해 동작이 실행되기를 기다리는 지연 기간”으로 정의합니다. 간단히 말해 함수 호출과 실제 실행 사이의 시간을 의미합니다. 대기 시간은 모든 시스템에 내재;우리는(존재하지 않는)완벽한 시스템을 한 경우에도,그것은 컴퓨터의 전자가 오프 또는 그 반대로 트랜지스터를 전환하는 데 걸리는 시간의 양을 잠재 될 것이다.

소규모 작업에서 대기 시간은 큰 문제는 아니지만 수백만 개의 작업을 처리 할 때 수백만 개의 대기 시간이 빠르게 추가됩니다. 대기 시간은 작업 단위/시간에 의해 정의되지 않고 대신 작동 방식에 의해 정의됩니다. 모니터링 도구는 함수의 시작부터 함수의 끝까지 걸리는 시간을 다시 보고합니다.

대기 시간은 비즈니스에 큰 영향을 미칠 수 있습니다. 따라서 대기 시간을 최대한 이해하는 것이 매우 중요합니다.

대기 시간 데이터를 볼 때 일반적인 함정:

대기 시간은 정상,가우스 또는 포아송 분포를 거의 따르지 않습니다. 대기 시간이 대기 시간을 관찰하는 방식으로 인해 이러한 분포 중 하나를 따르더라도 평균,중앙값 및 표준 편차를 쓸모 없게 만듭니다! 예를 들어 페이지 로드를 측정하는 경우 이러한 로드의 99.9999999999%가 중앙값보다 나쁠 수 있습니다. (이 통계를 트윗하려면 클릭)이것은 대기 시간을 무작위로 샘플링하면 부정확 한 데이터가 발생하는 이유 중 일부이지만 나중에 더 자세히 설명합니다.

이 시점에서,당신은 아마도 우리가 표준 편차를 사용하지 않고 있는지 스스로에게 묻고 있습니다. 응답은 우리가 백분위수와 최대값을 봐야 한다 고 이다. 대부분의 사람들은 스스로 생각,좋아,그래서 나는 95 에보고 나는”일반적인 경우”를 이해. 이 문제는 95 가 모든 나쁜 물건을 숨길 것입니다. 아줄시스템즈의 길텐은”마케팅 시스템”이라며 누군가가 속아 넘어가고 있다.”

이 그래프를 예로 들어 보겠습니다:

2015 년 11 월 15 일~2015 년 12 월 15 일

이 그래프를 볼 때 중앙값과 평균이 실제 의미가 없으며 문제 영역을 표시하지 않는 이유를 명확하게 알 수 있습니다. 95 번째 백분위수가 왼쪽으로 쏘는 것을 볼 때 당신은 문제의 핵심을 보고 있다고 생각합니다.

물론 이것은 사실이 아니지만,프로그램이 딸꾹질을 한 이유를 조사 할 때 일어난 일의 최악의 5%를 보지 못하고 있습니다. 이런 종류의 스파이크를 얻으려면 데이터의 상위 5%가 훨씬 더 나빠야합니다.

이제 99.99 번째 백분위수를 보여주는 동일한 그래프를 보십시오:

2015 년 11 월 15 일~2015 년 12 월 15 일

빨간색 선은 95 번째 백분위수이고 녹색은 99.99 번째 백분위수 선입니다. 당신이 명확하게 볼 수 있듯이 95 백분위 수는 문제의 22 중 2 를 보여줍니다! 이 때문에 데이터의 전체 스펙트럼을 살펴보아야 합니다.

많은 사람들이 데이터의 마지막 5%는 그 정도 의미를 보유하지 않는 것을 생각할 수 있다는 사실에도 불구하고. 물론,그것은 단지 가상 컴퓨터를 다시 시작하거나 시스템의 딸꾹질,또는 그런 일이 될 수 있지만 그 그것을 무시하여 사실이다 동안,당신은 가장 중요한 것들 중 하나가 될 수있을 때 그것은 단지 발생하지 않는 것을 말하고있다 당신을 위해 대상!

길 테넬은”절대 없애면 안되는 숫자 1 은 최대값이다. 이것은 소음이 아니라 신호입니다. 나머지는 소음이다.”최대값은 실제로 대규모의 시스템에서 큰 단일 인 반면,최대값만을 추구하는 것은 종종 실용적이지 않습니다. 어떤 시스템은 완벽하지 않고 딸꾹질 독점적으로 최대의 경우를 추구하는 대규모 실제 시스템에서 자주 개발 팀을 구울 수있는 좋은 방법입니다 발생 않습니다.

99.99 번째 백분위수를 볼 때 당신은 당신의 고객의 대다수에게 무슨 일이 일어나는지보고있다 그리고 당신은 당신이 알고있는 모든 스파이크는 실제 문제입니다,최대 어떤 스파이크는 시스템에 딸꾹질 수있는 반면. 당신의 개발 운영 팀은 이러한 작은 딸꾹질에 자신의 노력을 집중할 때 그들은 대신 더 큰 문제에 작업 할 수 없기 때문에 그들은 큰 기회 비용으로 그렇게하고 있습니다.

99.99 번째와 최대 값이 서로 매우 가깝다면(그리고 둘 다 스파이크 된 경우)이것이 팀이 작업해야하는 문제라는 큰 신호입니다. 이 방법으로,길 최대 큰 신호 것을 맞다,하지만 데이터의 나머지 부분은 단지 잡음이 잘못. 이 그래프에서 볼 수 있듯이:

편집자 주:위와 같이,이 스크린 샷을 생성 한 제품은 더 이상 사용할 수 없습니다,하지만 그 기능은 인스타나의 응용 프로그램 및 관찰 가능성 플랫폼의 일부입니다.

우리의 99.이전 예제의 99 번째 백분위 수와 최대 값이 정확히 일치합니다. 이것은 당신이 무엇을보고있는 것은 진짜 버그뿐만 아니라 딸꾹질 것을 좋은 신호입니다.

평균 백분위수:사전 계산으로 인해 대기 시간이 잘못 측정되는 방법:

95 번째 백분위수를 보는 것보다 훨씬 더 심각한 함정은 백분위수가 평균화되었음을 인식하지 못하는 것입니다. 백분위 수를 평균하는 것은 통계적으로 터무니없는 것입니다;그것은 당신이보고있는 것으로부터 모든 의미를 제거합니다. 우리는 이미 대기 시간을 볼 때 평균이 좋지 않은 방법을 보여 주었다,당신은 평균 백분위 수를 찾고 있다면 당신은 바로 다시 제곱에 단순히. 많은 소프트웨어의 평균 백분위 수는 예를 들어이 그라파 나 차트를:

이 모든 백분위 수 전에 실현 여부 평균입니다! 그것은 엑스 축 원장에 그렇게 말한다. 거의 모든 모니터링 서비스는 백분위 수를 평균! 이것은 사전 계산으로 인한 현실입니다. 모니터링 서비스가 데이터를 취하면 해당 분 동안 데이터의 백분위수를 계산합니다.

당신이 당신의 95 백분위 수를 살펴 갈 때,그들은 당신에게 모든 백분위 떨어져 평균을 보여주고있다. “당신의 좋은”에 대한이 바로 가기는 데이터에서 모든 통계적 유의성을 제거,현실에서,빠른 서비스를 만들 수 있습니다.

지연 시간을 적절하게 측정하기 위해 샘플링되지 않은 데이터가 있어야 하는 이유:

데이터 샘플링에 참여하는 도구를 모니터링하면 평균 데이터를 생성합니다. 거의 모든 모니터링 도구가 데이터를 샘플링합니다. 예를 들어 데이터 도그;그들은 주요 데이터 손실이 있습니다. 당신이 분에 그들에게 300 만 포인트를 보낼 경우 그들은 그들 모두를 적용되지 않습니다. 대신,그들은 무작위로 포인트를 샘플링 한 다음 분당 1 점으로 집계합니다.

대기 시간을 이해하려면 샘플링되지 않은 데이터가 있어야 합니다. 샘플링 된 데이터를 사용하면 전체 배포에 액세스 할 수 없다는 것이 내재되어 있습니다! 너의 최대치는 너의 진실한 최대치가 아니고,도 아니다 일어나고 있는 것이의 너의 세계적인 백분위수는 정확한 대표 이다!

샘플링 된 데이터는 조정 된 누락을 악화시킵니다!

데이터를 샘플링하면 데이터가 생략됩니다. 예를 들어 모니터링 시스템에 각각 2 개의 데이터 포인트를 보내는 1 분 안에 10,000 개의 작업이 발생한다고 가정해 보겠습니다. 시스템에 버그가 있고 이러한 데이터 요소 중 하나가 10,000 개의 작업 당이를 표시한다고 가정 해보십시오. 모니터링 시스템은 최대로 당신을 보여줍니다 데이터 포인트로이 선택의 1/20,000 기회가있다!

충분히 오래 실행하면 데이터 요소가 결국 표시되지만 결과적으로 매분마다 고객 중 한 명에게 발생하더라도 산발적 인 에지 케이스처럼 보입니다! 데이터를 샘플링하지 않고 이러한 스파이크 중 하나가 있으면 99.99 번째 백분위수로 명확하게 표시되며 최대 값은 프로그램에 버그가 있음을 알립니다. 당신이 당신의 데이터를 샘플링 할 때,그러나,그것은 당신이 버그로 볼 수 없습니다 의미,자주 표시되지 않습니다 아니라 딸꾹질로. 이는 엔지니어링 팀이 그 중요성을 깨닫지 못한다는 것을 의미합니다!

모니터링 도구를 사용하면 대기 시간에 무슨 일이 일어나고 있는지 알고 생각으로 당신을 속일 수 있도록하지 마십시오.

샘플링된 데이터를 제공하지 않는 도구를 선택합니다. 전역 백분위수를 평균하지 않는 도구를 선택합니다. 오늘 2 주 무료 평가판을 시작하십시오!

답글 남기기

이메일 주소는 공개되지 않습니다.