Elasticsearch는 Lucene 검색 라이브러리 기반인 오픈소스 검색 서버입니다. 이 서버는 여러 운영체제의 Java 가상 머신에서 실행됩니다. elasticsearch
수신자는 Elasticsearch 인스턴스에서 노드 및 클러스터 수준의 원격 분석을 수집합니다.
Elasticsearch에 대한 자세한 내용은 Elasticsearch 문서를 참조하세요.
기본 요건
Elasticsearch 원격 분석을 수집하려면 운영 에이전트를 설치해야 합니다.
- 측정항목의 경우 버전 2.21.0 이상을 설치합니다.
- 로그의 경우 버전 2.9.0 이상을 설치합니다.
이 통합에서는 Elasticsearch 버전 7.9 이상을 지원합니다.
Elasticsearch 인스턴스 구성
Elasticsearch 보안 기능을 사용 설정하는 경우 monitor
또는 manage
클러스터 권한으로 사용자를 구성해야 합니다.
Elasticsearch용 작업 에이전트 구성
운영 에이전트 구성 가이드에 따라 Elasticsearch 인스턴스에서 원격 분석을 수집하는 데 필요한 요소를 추가하고 에이전트를 다시 시작합니다.
구성 예시
다음 명령어는 Elasticsearch용 원격 분석을 수집하고 운영 에이전트를 다시 시작하는 구성을 만듭니다.
로그 수집 구성
Elasticsearch에서 로그를 수집하려면 Elasticsearch에서 생성하는 로그의 수신자를 만든 후 새 수신자의 파이프라인을 만들어야 합니다.
elasticsearch_json
로그의 수신자를 구성하려면 다음 필드를 지정합니다.
필드 | 기본값 | 설명 |
---|---|---|
exclude_paths |
include_paths 중에서 일치하는 집합에서 제외할 파일 시스템 경로 패턴의 목록입니다. |
|
include_paths |
[/var/log/elasticsearch/*_server.json, /var/log/elasticsearch/*_deprecation.json, /var/log/elasticsearch/*_index_search_slowlog.json, /var/log/elasticsearch/*_index_indexing_slowlog.json, /var/log/elasticsearch/*_audit.json] |
각 파일을 테일링하여 읽을 파일 시스템 경로의 목록입니다. 와일드 카드(* )를 경로에 사용할 수 있습니다. |
record_log_file_path |
false |
true 로 설정된 경우 로그 레코드를 가져온 특정 파일의 경로가 출력 로그 항목에 agent.googleapis.com/log_file_path 라벨 값으로 표시됩니다. 와일드 카드를 사용할 경우 레코드를 가져온 파일의 경로만 기록됩니다. |
type |
값은 elasticsearch_json 여야 합니다. |
|
wildcard_refresh_interval |
60s |
include_paths 의 와일드 카드 파일 경로가 새로 고쳐지는 간격입니다. 기간(예: 30s 또는 2m )으로 지정됩니다. 이 속성은 로그 파일이 기본 간격보다 빠르게 순환되는 높은 로깅 처리량에서 유용할 수 있습니다. |
elasticsearch_gc
로그의 수신자를 구성하려면 다음 필드를 지정합니다.
필드 | 기본값 | 설명 |
---|---|---|
exclude_paths |
include_paths 중에서 일치하는 집합에서 제외할 파일 시스템 경로 패턴의 목록입니다. |
|
include_paths |
[/var/log/elasticsearch/gc.log] |
각 파일을 테일링하여 읽을 파일 시스템 경로의 목록입니다. 와일드 카드(* )를 경로에 사용할 수 있습니다. |
record_log_file_path |
false |
true 로 설정된 경우 로그 레코드를 가져온 특정 파일의 경로가 출력 로그 항목에 agent.googleapis.com/log_file_path 라벨 값으로 표시됩니다. 와일드 카드를 사용할 경우 레코드를 가져온 파일의 경로만 기록됩니다. |
type |
값은 elasticsearch_gc 여야 합니다. |
|
wildcard_refresh_interval |
60s |
include_paths 의 와일드 카드 파일 경로가 새로 고쳐지는 간격입니다. 기간(예: 30s 또는 2m )으로 지정됩니다. 이 속성은 로그 파일이 기본 간격보다 빠르게 순환되는 높은 로깅 처리량에서 유용할 수 있습니다. |
로깅되는 내용
logName
은 구성에 지정된 수신자 ID에서 파생됩니다. LogEntry
내의 자세한 필드는 다음과 같습니다.
elasticsearch_json
로그에는 LogEntry
의 다음 필드가 포함됩니다.
필드 | 유형 | 설명 |
---|---|---|
jsonPayload.cluster |
문자열 | 로그 레코드를 내보내는 클러스터 |
jsonPayload.cluster.name |
문자열 | 로그 레코드를 내보내는 클러스터의 이름 |
jsonPayload.cluster.uuid |
문자열 | 로그 레코드를 내보내는 클러스터의 UUID |
jsonPayload.component |
문자열 | 로그를 내보낸 Elasticsearch의 구성요소 |
jsonPayload.level |
문자열 | 로그 항목 수준입니다. |
jsonPayload.message |
문자열 | 로그 메시지 |
jsonPayload.node |
문자열 | 로그 레코드를 내보내는 노드 |
jsonPayload.node.name |
문자열 | 로그 레코드를 내보내는 노드의 이름 |
jsonPayload.node.uuid |
문자열 | 로그 레코드를 내보내는 노드의 UUID |
jsonPayload.type |
문자열 | 레코드가 발생한 로그를 나타내는 로그 유형(예: 서버는 이 LogEntry가 서버 로그에서 제공된 것임을 나타냄) |
severity |
문자열(LogSeverity ) |
로그 항목 수준입니다(번역됨). |
elasticsearch_gc
로그에는 LogEntry
의 다음 필드가 포함됩니다.
필드 | 유형 | 설명 |
---|---|---|
jsonPayload.gc_run |
숫자 | 가비지 수집기 실행 |
jsonPayload.message |
문자열 | 로그 메시지 |
jsonPayload.type |
문자열 | 로그 레코드의 유형 |
severity |
문자열(LogSeverity ) |
로그 항목 수준입니다(번역됨). |
측정항목 수집 구성
Elasticsearch에서 측정항목을 수집하려면 Elasticsearch에서 생성하는 측정항목의 수신자를 만든 후 새 수신자의 파이프라인을 만들어야 합니다.
이 수신자는 구성에서 여러 인스턴스 모니터링과 같은 여러 인스턴스의 사용을 지원하지 않습니다. 이러한 모든 인스턴스는 동일한 시계열에 기록되며, Cloud Monitoring은 이를 구분할 수 있는 방법이 없습니다.
elasticsearch
측정항목의 수신자를 구성하려면 다음 필드를 지정합니다.
필드 | 기본값 | 설명 |
---|---|---|
ca_file |
CA 인증서의 경로입니다. 클라이언트로서 서버 인증서를 확인합니다. 비어있으면 수신자는 시스템 루트 CA를 사용합니다. | |
cert_file |
mTLS 필수 연결에 사용할 TLS 인증서의 경로입니다. | |
collection_interval |
60s |
기간 값(예: 30s 또는 5m )입니다. |
endpoint |
http://localhost:92002 |
Elasticsearch REST API의 기준 URL입니다. |
insecure |
true |
보안 TLS 연결을 사용할지 여부를 설정합니다. false 로 설정하면 TLS가 사용 설정됩니다. |
insecure_skip_verify |
false |
인증서 확인을 건너뛸지 여부를 설정합니다. insecure 이 true 로 설정된 경우 insecure_skip_verify 값이 사용되지 않습니다. |
key_file |
mTLS 필수 연결에 사용할 TLS 키의 경로입니다. | |
password |
Elasticsearch 인증을 위한 비밀번호입니다. username 설정 시 필수입니다. |
|
type |
값은 elasticsearch 여야 합니다. |
|
username |
Elasticsearch 인증을 위한 사용자 이름입니다. password 설정 시 필수입니다. |
모니터링 대상
다음 표에서는 운영 에이전트가 Elasticsearch 인스턴스에서 수집하는 측정항목의 목록을 보여줍니다.
측정항목 유형 | |
---|---|
종류, 유형 모니터링 리소스 |
라벨 |
workload.googleapis.com/elasticsearch.breaker.memory.estimated
|
|
GAUGE , INT64 gce_instance |
name
|
workload.googleapis.com/elasticsearch.breaker.memory.limit
|
|
GAUGE , INT64 gce_instance |
name
|
workload.googleapis.com/elasticsearch.breaker.tripped
|
|
CUMULATIVE , INT64 gce_instance |
name
|
workload.googleapis.com/elasticsearch.cluster.data_nodes
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.cluster.health
|
|
GAUGE , INT64 gce_instance |
status
|
workload.googleapis.com/elasticsearch.cluster.in_flight_fetch
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.cluster.nodes
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.cluster.pending_tasks
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.cluster.published_states.differences
|
|
GAUGE , INT64 gce_instance |
state
|
workload.googleapis.com/elasticsearch.cluster.published_states.full
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.cluster.shards
|
|
GAUGE , INT64 gce_instance |
state
|
workload.googleapis.com/elasticsearch.cluster.state_queue
|
|
GAUGE , INT64 gce_instance |
state
|
workload.googleapis.com/elasticsearch.cluster.state_update.count
|
|
CUMULATIVE , INT64 gce_instance |
state
|
workload.googleapis.com/elasticsearch.cluster.state_update.time
|
|
CUMULATIVE , INT64 gce_instance |
state type
|
workload.googleapis.com/elasticsearch.indexing_pressure.memory.limit
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.indexing_pressure.memory.total.primary_rejections
|
|
CUMULATIVE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.indexing_pressure.memory.total.replica_rejections
|
|
CUMULATIVE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.memory.indexing_pressure
|
|
GAUGE , INT64 gce_instance |
stage
|
workload.googleapis.com/elasticsearch.node.cache.count
|
|
GAUGE , INT64 gce_instance |
type
|
workload.googleapis.com/elasticsearch.node.cache.evictions
|
|
CUMULATIVE , INT64 gce_instance |
cache_name
|
workload.googleapis.com/elasticsearch.node.cache.memory.usage
|
|
GAUGE , INT64 gce_instance |
cache_name
|
workload.googleapis.com/elasticsearch.node.cluster.connections
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.cluster.io
|
|
CUMULATIVE , INT64 gce_instance |
direction
|
workload.googleapis.com/elasticsearch.node.disk.io.read
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.disk.io.write
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.documents
|
|
GAUGE , INT64 gce_instance |
state
|
workload.googleapis.com/elasticsearch.node.fs.disk.available
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.fs.disk.free
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.fs.disk.total
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.http.connections
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.ingest.documents
|
|
CUMULATIVE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.ingest.documents.current
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.ingest.operations.failed
|
|
CUMULATIVE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.open_files
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.operations.completed
|
|
CUMULATIVE , INT64 gce_instance |
operation
|
workload.googleapis.com/elasticsearch.node.operations.time
|
|
CUMULATIVE , INT64 gce_instance |
operation
|
workload.googleapis.com/elasticsearch.node.pipeline.ingest.documents.current
|
|
GAUGE , INT64 gce_instance |
name
|
workload.googleapis.com/elasticsearch.node.pipeline.ingest.documents.preprocessed
|
|
GAUGE , INT64 gce_instance |
name
|
workload.googleapis.com/elasticsearch.node.pipeline.ingest.operations.failed
|
|
CUMULATIVE , INT64 gce_instance |
name
|
workload.googleapis.com/elasticsearch.node.script.cache_evictions
|
|
CUMULATIVE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.script.compilation_limit_triggered
|
|
CUMULATIVE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.script.compilations
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.shards.data_set.size
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.shards.reserved.size
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.shards.size
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.thread_pool.tasks.finished
|
|
CUMULATIVE , INT64 gce_instance |
state thread_pool_name
|
workload.googleapis.com/elasticsearch.node.thread_pool.tasks.queued
|
|
GAUGE , INT64 gce_instance |
thread_pool_name
|
workload.googleapis.com/elasticsearch.node.thread_pool.threads
|
|
GAUGE , INT64 gce_instance |
state thread_pool_name
|
workload.googleapis.com/elasticsearch.node.translog.operations
|
|
CUMULATIVE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.translog.size
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.node.translog.uncommitted.size
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.os.cpu.load_avg.15m
|
|
GAUGE , DOUBLE gce_instance |
|
workload.googleapis.com/elasticsearch.os.cpu.load_avg.1m
|
|
GAUGE , DOUBLE gce_instance |
|
workload.googleapis.com/elasticsearch.os.cpu.load_avg.5m
|
|
GAUGE , DOUBLE gce_instance |
|
workload.googleapis.com/elasticsearch.os.cpu.usage
|
|
GAUGE , INT64 gce_instance |
|
workload.googleapis.com/elasticsearch.os.memory
|
|
GAUGE , INT64 gce_instance |
state
|
구성 확인
이 섹션에서는 Elasticsearch 수신자를 올바르게 구성했는지 확인하는 방법을 설명합니다. 운영 에이전트에서 원격 분석 수집을 시작하려면 1~2분 정도 걸릴 수 있습니다.
Elasticsearch 로그가 Cloud Logging으로 전송되고 있는지 확인하려면 다음을 수행합니다.
-
Google Cloud 콘솔에서 로그 탐색기 페이지로 이동합니다.
검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Logging인 결과를 선택합니다.
- 편집기에 다음 쿼리를 입력한 후 쿼리 실행을 클릭합니다.
resource.type="gce_instance" (log_id("elasticsearch_json") OR log_id("elasticsearch_gc"))
Elasticsearch 측정항목이 Cloud Monitoring으로 전송되고 있는지 확인하려면 다음을 수행합니다.
-
Google Cloud 콘솔에서 leaderboard 측정항목 탐색기 페이지로 이동합니다.
검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.
- 쿼리 빌더 창의 툴바에서 이름이 code MQL 또는 code MQL인 버튼을 선택합니다.
- MQL 전환 버튼에 MQL이 선택되어 있는지 확인합니다. 언어 전환 버튼은 쿼리 형식을 지정할 수 있는 동일한 툴바에 있습니다.
- 편집기에 다음 쿼리를 입력한 후 쿼리 실행을 클릭합니다.
fetch gce_instance | metric 'workload.googleapis.com/elasticsearch.node.open_files' | every 1m
대시보드 보기
Elasticsearch 측정항목을 보려면 차트 또는 대시보드가 구성되어 있어야 합니다. Elasticsearch 통합에는 대시보드가 하나 이상 포함됩니다. 통합을 구성하고 운영 에이전트가 측정항목 데이터 수집을 시작한 후 모든 대시보드가 자동으로 설치됩니다.
통합을 설치하지 않고도 대시보드의 정적 미리보기를 볼 수 있습니다.
설치된 대시보드를 보려면 다음을 수행합니다.
-
Google Cloud 콘솔에서 대시보드 페이지로 이동합니다.
검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.
- 대시보드 목록 탭을 선택한 후 통합 카테고리를 선택합니다.
- 확인할 대시보드의 이름을 클릭합니다.
통합을 구성했지만 대시보드가 설치되지 않은 경우 운영 에이전트가 실행 중인지 확인합니다. 대시보드에 차트의 측정항목 데이터가 없으면 대시보드 설치가 실패합니다. 운영 에이전트가 측정항목 수집을 시작하면 대시보드가 자동으로 설치됩니다.
대시보드의 정적 미리보기를 보려면 다음을 수행합니다.
-
Google Cloud 콘솔에서 통합 페이지로 이동합니다.
검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.
- Compute Engine 배포 플랫폼 필터를 클릭합니다.
- Elasticsearch 항목을 찾고 세부정보 보기를 클릭합니다.
- 정적 미리보기를 보려면 대시보드 탭을 선택합니다. 대시보드가 설치되어 있으면 대시보드 보기를 클릭하여 대시보드로 이동할 수 있습니다.
Cloud Monitoring의 대시보드에 대한 자세한 내용은 대시보드 및 차트를 참조하세요.
통합 페이지 사용에 대한 자세한 내용은 통합 관리를 참조하세요.
알림 정책 설치
알림 정책은 지정된 조건이 발생할 때 Cloud Monitoring에서 알림을 받도록 지시합니다. Elasticsearch 통합에는 사용할 알림 정책이 하나 이상 포함됩니다. Monitoring의 통합 페이지에서 이러한 알림 정책을 보고 설치할 수 있습니다.
사용 가능한 알림 정책에 대한 설명을 보고 설치하려면 다음을 수행합니다.
-
Google Cloud 콘솔에서 통합 페이지로 이동합니다.
검색창을 사용하여 이 페이지를 찾은 경우 부제목이 Monitoring인 결과를 선택합니다.
- Elasticsearch 항목을 찾고 세부정보 보기를 클릭합니다.
- 알림 탭을 선택합니다. 이 탭에는 사용 가능한 알림 정책에 대한 설명과 이를 설치하기 위한 인터페이스가 제공됩니다.
- 알림 정책을 설치합니다. 알림 정책은 경고가 트리거되었다는 알림을 전송할 위치를 알아야 하므로, 설치 시 사용자에게 해당 정보를 요청합니다.
알림 정책을 설치하려면 다음을 수행합니다.
- 사용 가능한 알림 정책 목록에서 설치할 정책을 선택합니다.
알림 구성 섹션에서 알림 채널을 하나 이상 선택합니다. 알림 채널 사용을 중지할 수 있지만 사용 중지하면 알림 정책이 자동으로 실행됩니다. Monitoring에서 상태를 확인할 수 있지만 알림이 수신되지 않습니다.
알림 채널에 대한 자세한 내용은 알림 채널 관리를 참조하세요.
- 정책 만들기를 클릭합니다.
Cloud Monitoring의 알림 정책에 대한 자세한 내용은 알림 소개를 참조하세요.
통합 페이지 사용에 대한 자세한 내용은 통합 관리를 참조하세요.
다음 단계
Ansible을 사용하여 운영 에이전트를 설치하고, 서드파티 애플리케이션을 구성하고, 샘플 대시보드를 설치하는 방법은 운영 에이전트를 설치하여 서드파티 애플리케이션 문제 해결 동영상을 참조하세요.