CS 지식/chat gpt와 TIL

배치 작업(batch job)이란?

쑨토리 2023. 9. 10. 17:26

배치 작업(batch job)은 컴퓨터 프로그램이나 스크립트를 사용하여 일괄적으로 실행되는 작업을 가리키는 용어입니다. 

(사용자 데이터 작성을 의미하나 보다.. ) 이러한 작업은 대부분 자동화된 방식으로 수행되며, 특정 작업을 주기적으로 실행하거나 대량의 데이터를 처리하는 데 사용됩니다. 배치 작업은 다음과 같은 특징을 갖고 있습니다.

[ 일괄처리, 자동화, 일정, 대량 데이터 처리, 자원 활용 최적화, 오류 처리 ]

1. 일괄 처리

배치 작업은 주로 일괄 처리 프로세스로 실행됩니다. 즉, 한 번에 여러 작업을 처리하거나 여러 데이터 항목을 처리할 수 있습니다.

2. 자동화

대부분의 배치 작업은 인간의 개입 없이 자동으로 실행됩니다. 예를 들어, 정기적으로 데이터베이스에서 보고서를 생성하거나, 백업을 수행하거나, 대량의 데이터를 변환하거나, 업데이트를 배포하는 등의 작업이 이에 해당합니다.

3. 일정

배치 작업은 특정한 일정 또는 주기에 따라 실행됩니다. 예를 들어, 매일 밤에 주문 데이터를 처리하거나, 매주 월요일에 주간 보고서를 생성하는 등의 작업이 포함됩니다.

4. 대량 데이터 처리

주로 대량의 데이터를 처리하는 데 사용됩니다. 데이터베이스에서 수천 또는 수백만 건의 레코드를 처리하거나, 대량의 로그 파일을 분석하거나, 대용량 파일을 변환하는 등의 작업이 이에 해당합니다.

5. 자원 활용 최적화

배치 작업은 자원(컴퓨팅 리소스)을 효율적으로 활용하기 위한 목적으로 사용됩니다. 예를 들어, 일반적인 업무 시간이 아닐 때 서버 자원을 활용하여 대규모 데이터 처리를 수행할 수 있습니다.

6. 오류 처리

배치 작업은 자동화되지만 오류 처리 기능을 포함할 수 있습니다. 작업 중 오류가 발생하면 시스템이 이를 처리하고 알림을 보내거나 작업을 중단할 수 있습니다.

배치 작업은 많은 업무 환경에서 사용되며, 데이터 처리, 보고서 생성, 자동 업데이트, 백업 및 복원 등 다양한 용도로 활용됩니다. 이를 통해 반복적이고 시간 소모적인 작업을 자동화하고 효율성을 향상시킬 수 있습니다.

 

 


배치 작업을 쉽게 예시로 이해해보자.



예시 1: 주간 이메일 보고서 생성


한 회사가 매주 월요일주간 이메일 보고서를 관리해야 한다고 가정해 봅시다.

이 보고서는 주간 판매 데이터를 기반으로 하며, 매주 월요일 아침에 관리팀과 경영진에게 보내집니다.

이 예시의 경우 진행해야 할 배치 작업의 예시는 다음과 같습니다.

1. 일괄 처리 작업 설정

매주 월요일 아침 8시에 주간 보고서를 자동으로 생성하는 일괄 처리 작업을 설정합니다.

2. 데이터 추출

주간 판매 데이터베이스에서 지난 주 판매 데이터를 추출합니다.

3. 데이터 처리

추출한 데이터를 분석하고 요약하여 보고서 형식으로 만듭니다.

4. 이메일 발송

생성된 보고서를 관리팀과 경영진의 이메일 주소로 자동으로 전송합니다.

5. 오류 처리

만약 데이터 추출 또는 이메일 발송 중에 오류가 발생하면, 시스템은 이를 기록하고 관리자에게 알립니다.

이것이 배치 작업의 간단한 예입니다. 이러한 일련의 과정은 매주 월요일 아침에 자동으로 실행되며, 인간 개입 없이 원활하게 작동합니다. 이것이 배치 작업의 핵심 아이디어입니다.

 


예시 2: 주간 백업

또 다른 예시로는 데이터베이스 백업 작업을 생각해 봅시다.

1. 일괄 처리 작업 설정

매일 밤 자정에 데이터베이스 백업을 수행하는 일괄 처리 작업을 설정합니다.

2. 데이터베이스 백업

데이터베이스의 모든 내용을 안전한 위치에 복사하여 백업 파일을 생성합니다.

3. 압축 및 저장

백업 파일을 압축하고 원격 서버 또는 클라우드 스토리지에 저장합니다.

4. 오류 처리

만약 백업 중에 오류가 발생하면, 시스템은 이를 기록하고 관리자에게 알립니다.

이런 식으로 백업은 매일 자동으로 실행되며, 데이터 손실을 방지하고 비즈니스 연속성을 유지하기 위한 중요한 일괄 처리 작업입니다.

이렇게 배치 작업은 일상적인 작업을 자동화하여 일괄 처리하고, 시간을 절약하며 오류를 줄일 수 있는 방법으로 많이 사용됩니다.