Search

데이터의 종류

대분류
인공지능/데이터
서적
소분류
SQL 레시피
최종 편집 일시
2024/10/31 06:59
생성 일시
2024/10/28 04:41
16 more properties

데이터의 종류

마케팅 담당자가 다루는 데이터를 크게 두 가지 종류로 구분하면 다음과 같다.
‘업무에 필요한 데이터’ - 업무 데이터
‘업무에 직접적으로 필요하지는 않지만 분석을 위해 추출해야하는 데이터’ - 로그 데이터

업무 데이터

서비스와 시스템을 운용하기 위한 목적으로 구축된 데이터베이스에 존재하는 데이터
갱신형 데이터 : 상품을 추가할 때는 새로운 데이터로 레코드 하나를 삽입한다. 그리고 해당 데이터의 가격 변경 등이 있을 때, 새로운 데이터를 삽입하는 대신 기존의 데이터를 갱신하는 것.

업무 데이터의 특징

데이터의 정뮐도가 높다.
갱신형 데이터이다.
다뤄야 하는 테이블 수가 많다.

업무 데이터 축적 방법

모든 데이터 변경하기
모든 레코드의 스냅샷을 날짜별로 저장하기
어제와의 변경 사항만 누적하기

업무 데이터 다루기

매출액, 사용자 수처럼 정확한 값을 요구할 경우 활요하기
서비스의 방문 횟수, 페이지뷰, 사용자 유도 등의 데이터 분석에는 사용할 수 없음
데이터 변경이 발생할 수 있으므로 추출 시점에 따라 결과가 변화할 수 있음

업무 데이터의 종류

트랜젝션 데이터
구매 데이터, 리뷰 데이터, 게임 플레이 데이터처럼 서비스와 시스템을 통해 사용자의 행동을 기록한 데이터
날짜, 시각, 마스터 데이터의 회원 ID, 상품 ID, 수량, 가격 등이 포함되는 경우가 많다.
마스터 데이터
카테고리 마스터, 상품 마스터처럼 서비스와 시스템이 정의하고 있는 데이터
회원과 관련된 정보도 사용자 마스터 테이블에 저장하므로 마스터 데이터로 분류한다.
트랜젝션 데이터만으로는 분석 범위가 한정되어 버리므로, 트랜잭션 데이터에 포함된 마스터 데이터는 리포트 업무 전에 대충 확인해두는 것이 좋다.

로그 데이터

통계 또는 분석을 주 용도로 설계된 데이터
특정 태그를 포함해서 전송된 데이터
특정 행동을 서버 측에 출력한 데이터

로그 데이터의 특징

누적형 데이터이다.
시간, 사용자 엔드 포인트, IP, URL, 레퍼러, Cookie 등의 정보 저장하기
로그 데이터는 추출 방법에 따라 데이터의 정밀도가 달라짐
계속 기록을 추가하는 것 뿐이므로 과거의 데이터가 변경되지는 않음

로그 데이터 축적 방법

태그, SDK를 통해 사용자 장치에서 데이터를 전송하고 출력하기(비컨 형태)
서버에서 데이터를 추출하고 출력하기(서버 형태)

로그 데이터 다루기

사이트 방문 횟수, 페이지뷰, 사용자 유도 상황을 집계하고 분석할 때 주로 사용
최신 상태를 고려한 분석에는 적합하지 않음
계속 기록을 누적하는 형태이므로 추출 결과가 변할 가능성이 적음
데이터의 정확도는 업무 데이터에 비해 낮음

두 데이터를 사용해서 생성되는 가치

업무 데이터의 가치

매출액의 추기, 인기 상품 등을 파악하여 사용자에게 조금 더 많은 관심을 주어 구매를 유도한다.
어떤 상품이 계절성을 가지는 지, 특정 시간에 많이 팔리는지 등도 과거의 경향을 파악하면 무엇을 해야 하는지 알 수 있다.
이를 활용하여 다양한 이벤트를 통해 상품을 더 많이 노출시켜 더 많은 구매를 유도할 수 있다.

로그데이터의 가치

빅데이터 기반이 있다면 원하는 리포트를 자유롭게 정의할 수 있다. 데이터 수집 및 가공, 집계를 자유롭게 할 수 있으므로 접근 분석 도구의 제한을 받지 않고 원하는 결과를 도출해 낼 수 있다.

두 데이터를 사용했을 때 발생하는 새로운 가치

웹 사이트에서의 행동이 오프라인의 행동에 어떠한 영향을 미치는지 등을 조사 할 수 있다.
웹사이트에서 오프라인으로 사용자를 유도하는 서비스라면 , 두 가지 데이터를 함께 활용했을 때 분석 가능성이 훨씬 넓어진다고 할 수 있다.

데이터 사용 가치

목표를 관리하고 설계하고, 서비스/조직의 성장에 기여하기(목표 관리)
사용자 행동을 기반으로 경향을 발견하고, 매출과 서비스 개선에 기여하기(서비스 개선)
과거의 경향을 기반으로 미래의 행동 예측하기(미래 예측)