들어가기 전에
Excel에서 지저분한 데이터로 어려움을 겪는 것은 정말 골치 아픈 일일 수 있습니다. 중복 제거부터 강력한 Excel 함수 사용까지 Excel 데이터를 정리하는 다양한 기술을 소개합니다.
※ 이 글은 아래 기사 내용을 토대로 작성되었습니다만, 필자의 개인 의견이나 추가 자료들이 다수 포함되어 있습니다.
- 원문: How to clean data in Excel spreadsheets for improved results
- URL: https://www.geeky-gadgets.com/cleaning-data-in-excel-2024/
개요
데이터는 모든 분석의 생명줄이지만 원시 데이터에는 결과를 왜곡하고 잘못된 결론을 도출할 수 있는 불완전성이 있는 경우가 많습니다. Excel 통합 문서를 기반으로 정보에 입각한 의사 결정을 내리려면 데이터 정확성과 일관성을 유지하는 것이 중요합니다. 고품질의 신뢰할 수 있는 데이터 집합을 유지하는 데 도움이 되는 Microsoft Excel의 필수 기술과 강력한 기본 제공 도구에 대해 알아봅니다.
분석을 왜곡할 수 있는 일반적인 문제 중 하나는 중복 항목의 존재입니다. 이러한 중복 레코드는 평균, 합계 및 기타 집계 계산을 왜곡할 수 있습니다. 다행히 Excel에서는 중복을 쉽게 식별하고 제거할 수 있습니다.
- 중복을 제거하려는 데이터 범위를 선택합니다.
- [데이터] 탭으로 이동합니다.
- [중복 제거] 버튼을 클릭합니다.
이 편리한 기능은 선택한 데이터를 스캔하여 반복되는 항목을 식별하고 중복을 제거하여 데이터 세트에 고유한 레코드만 포함되도록 합니다. 이 기능을 주기적으로 실행하면 데이터를 간결하고 정확하게 유지하는 데 도움이 됩니다.
누락된 데이터 포인트
또 다른 일반적인 과제는 데이터 포인트가 누락되는 것 입니다 . 이는 데이터 세트에 실망스러운 갭을 남기고 분석을 방해할 수 있습니다. Excel은 누락된 값을 지능적으로 처리하는 데 도움이 되는 여러 가지 유용한 함수를 제공합니다.
- IF: 빈 셀을 테스트하고 기본값을 적용할 수 있습니다.
- ISBLANK: 비어 있는 셀을 식별하는 데 도움이 됩니다.
- VLOOKUP: 다른 테이블에서 백업 데이터를 가져와 누락된 값을 채울 수 있습니다.
이러한 함수를 결합하면 누락된 데이터 포인트에 대한 합리적인 추정치를 보간하거나 기본값을 지정하여 데이터 세트의 무결성과 연속성을 유지할 수 있습니다.
일관되지 않은 데이터 형식은 또 다른 빈번한 걸림돌이며, 특히 여러 소스에서 데이터를 컴파일할 때 그렇습니다. 날짜, 숫자 및 텍스트 항목은 쉽게 일치하지 않는 형식으로 뒤섞일 수 있습니다. Excel의 기본 제공 함수도 이러한 문제를 해결하는 데 도움이 됩니다.
- TEXT: 날짜나 숫자 값의 형식을 원하는 형식으로 변환할 수 있습니다.
- VALUE: 텍스트로 저장된 숫자를 실제 숫자 데이터로 변환할 수 있습니다.
- TRIM: 텍스트 입력 앞이나 뒤에 있는 불필요한 공백을 제거합니다.
- CLEAN: 데이터에 몰래 들어올 수 있는 인쇄할 수 없는 문자를 제거합니다.
- SUBSTITUTE: 특정 텍스트 문자열을 찾아 바꿀 수 있습니다.
이러한 함수를 데이터에 적용하면 항목을 일관되고 통일된 형식 으로 표준화하는 데 도움이 되며 , 데이터 세트를 분석하고 조작하기가 훨씬 쉬워집니다.
데이터 유효성 검사
어수선한 데이터가 워크시트를 오염시키지 않도록 하는 가장 좋은 방법 중 하나는 데이터 검증 규칙을 설정하는 것입니다.
- 검증하려는 셀을 선택합니다.
- [데이터] 탭 - [데이터 유효성 검사]을 클릭합니다.
- 특정 형식, 범위 또는 값 유형에 대한 데이터 입력을 제한하기 위한 규칙을 설정합니다.
예를 들어, 셀이 1에서 100 사이의 정수만 허용하도록 요구하거나, 날짜 필드가 2022년 이후의 항목만 허용하도록 요구할 수 있습니다. 검증 규칙을 설정하면 잘못된 데이터 입력에 대한 첫 번째 방어선이 됩니다.
텍스트 정렬
때로는 데이터가 분석하기 어려운 방식으로 뭉쳐져 도착합니다. 일반적인 경우는 구성 요소가 단일 셀로 연결된 이름이나 주소입니다. Text to Columns 기능을 사용하면 이 결합된 데이터를 별도의 분석 가능한 열로 쉽게 분할할 수 있습니다.
- 분할하려는 데이터가 있는 열을 선택합니다.
- [데이터] 탭에서 [텍스트 나누기]를 클릭합니다.
- 데이터 구조에 따라 [구분 기호로 분리됨], [너비가 일정함] 중에서 해당되는 것을 선택합니다.
- 마법사를 따라 데이터를 여러 개의 개별 열로 분할하는 방법을 정의합니다.
이 도구를 사용하면 섞여 있는 데이터를 간단히 분리하여 분석에 필요한 특정 구성 요소만 분리할 수 있습니다.
찾기 및 바꾸기
검증 규칙과 표준화된 형식이 있어도 데이터 입력 오류는 여전히 발생할 수 있습니다. Excel의 찾기 및 바꾸기 기능을 사용하면 실수나 불일치를 쉽게 찾아내고 수정할 수 있습니다.
- Ctrl + F를 눌러 찾기 및 바꾸기 대화 상자를 엽니다.
- 찾으려는 오류나 불일치 사항을 입력합니다.
- 이를 대체할 수정 사항을 지정합니다.
- 모든 발생 사항을 수정하려면 "모두 바꾸기"를 클릭합니다.
이것은 오타, 철자 오류 또는 일관되지 않은 카테고리 이름을 빠르게 수정하는 좋은 방법입니다. 또한 플레이스홀더 또는 더미 데이터를 실제 값으로 대체하는 데도 편리합니다.
조건부 서식
때로는 문제가 데이터 자체가 아니라, 주의가 필요한 이슈나 영역을 강조하는 방법입니다. 조건부 서식을 사용하면 특정 기준에 따라 시각적 단서를 설정할 수 있습니다.
- 조건부 서식을 지정할 셀(또는 범위)을 선택합니다.
- [홈] 탭에서 [조건부 서식]을 클릭합니다.
- 값에 따라 셀을 서식 지정하는 규칙을 설정합니다.
예를 들어, 특정 임계값을 넘는 값을 가진 셀은 녹색으로, 다른 임계값을 밑도는 값을 가진 셀은 빨간색으로 바꿀 수 있습니다. 또는 특정한 날짜를 노란색으로 강조 표시할 수 있습니다. 조건부 서식은 주요 기준을 충족하는(또는 충족하지 못하는) 데이터를 표면화하는 빠른 시각적 방법을 제공합니다.
피벗 테이블
데이터가 깔끔하게 정리되면 피벗 테이블은 정보를 요약하고 탐색하고 분석하는 매우 강력한 방법을 제공합니다.
- 데이터 범위를 선택합니다.
- [삽입] 탭에서 [피벗 테이블]을 클릭합니다.
- 피벗 테이블을 구축하고 주요 지표를 계산하기 위해 필드를 끌어서 놓습니다.
피벗 테이블을 사용하면 여러 차원에서 데이터를 슬라이스하고 다이스하여 원시 정보에 묻혀 있을 수 있는 추세, 패턴 및 통찰력을 드러낼 수 있습니다. 정리된 데이터를 실행 가능한 인텔리전스로 전환합니다.
매크로 자동화
마지막으로, 동일한 데이터 정리 작업을 반복해서 수행한다면 매크로를 사용하여 해당 프로세스를 자동화 할 수 있습니다.
- Excel 옵션에서 [개발 도구] 탭을 활성화합니다.
- "매크로 기록"을 클릭하고 청소 작업을 수행합니다.
- 매크로 기록을 중지하고 저장합니다.
- 한 번의 클릭으로 실행하려면 매크로를 버튼에 할당합니다.
매크로를 사용하면 복잡한 일련의 청소 단계를 원샷 프로세스로 캡슐화하여 시간을 절약하고 청소 일관성을 보장할 수 있습니다. 들어오는 데이터에서 정기적으로 실행해야 하는 반복 작업에 이상적입니다.
매크로와 VBA에 대한 자세한 강의는 [여기]를 참고하세요.
마치며
데이터 정리는 화려하지 않을 수 있지만 Excel 분석가가 마스터해야 할 가장 필수적인 기술 중 하나입니다. 이러한 기술과 도구를 결합하면 데이터 품질을 제어하여 모델과 보고서에 입력되는 정보가 가능한 한 정확하고 일관되며 신뢰할 수 있도록 할 수 있습니다. 정리된 데이터는 건전한 분석 과 자신감 있는 의사 결정의 기초입니다. 이러한 전략을 갖추면 지저분한 데이터를 세련된 통찰력으로 바꿀 수 있습니다.
'Excel' 카테고리의 다른 글
Excel의 강력한 비즈니스 인텔리전스(BI) 도구를 사용하는 방법 (4) | 2024.09.06 |
---|---|
종합적인 Excel 재무 데이터 분석 워크플로 (5) | 2024.09.05 |
파이썬과 Excel을 결합하여 스프레드시트를 강화하는 방법 (8) | 2024.09.04 |
필요성을 몰랐던 5가지 Excel 빠른 팁 (7) | 2024.09.04 |
수식을 한 단계 업그레이드할 수 있는 10가지 새로운 Excel 함수 (6) | 2024.09.03 |