백혜진의 데이터 프로젝트


안녕하세요. 제 이름은 백혜진입니다. 법무법인 기업에서 고객 데이터를 생성하고 처리하고 있습니다.
데이터를 통해 더 나은 해결방법을 찾아, 새로운 고객서비스를 제공하고자 합니다.

1. 데이터 자동화
누구든지 쉽게 접근하여 원하는 데이터나 insight를 찾을 수 있도록 데이터가 흐르는 환경을 구축합니다.

2. 데이터 올라운더
DW부터 BI 그리고 AI 까지 개선을 위한 INSIGHT를 발굴하기 위해, 무엇이든지 특정 역할에 제한을 두지 않고 활동합니다.


AI와 법률

Python

텍스트 데이터 분석

1. 디시인사이드 웹사이트에서 "통매음"이라는 키워드로 검색되는 게시글의 데이터를 수집하고 정제하여 분석
2. 수집 : requests 와 BeautifulSoup 을 이용한 스크래핑 및 HTML 파싱
3. 정제 : 정규 표현식 (re), 날짜 데이터 추출, 형태소 분석기 Kiwi 등으로 전처리
4. 분석 : 다빈도 단어 Counter, 단어조합 nGram, TF-IDF, PCA 차원축소 , 군집분석 등


분석과 시각화

Redash

DB 기반 MySQL 쿼리문 작성

1. 가상의 식품 회사 DB를 활용한 MySQL 쿼리 작성
2. 가설 검증을 위한 데이터 분석과 시각화

amplitude

이벤트ㆍ유저 분석

1. 가상의 기업용 메시징 앱을 활용
2. 활성 유저수와 수익성을 증가시키기 위한 분석과정
3. 다양한 시각화 대시보드 제작

excel

공공데이터 활용한 지표분석

1. 서울시에서 제공한 2022년 상권 데이터 등 활용
2. 엑셀을 이용한 데이터 전처리
3. 상권변화지표 분석 및 가설수립 후 시각화

R , Python

다변량 분석 : 상관관계 분석, 주성분 분석, 군집 분석

1. 박사학위 취득 후 경력년수와 급여의 상관관계 분석
2. 1973년 미국 각 주의 강력범죄 자료에 따른 주성분 분석
3. 전세계 144개 국가의 국민 행복지수 군집 분석






감사합니다.