1. SQL
쿼리 명령어가 실행되는 순서
form, where, group by, having, order by, limit
in/between = or/and
where절 사용시 or나 and 보다 간편하게 표현할 수 있는 명령어
like/ not like: 특정 문자가 포함된 데이터만 불러오는 명령어
ex) where Unit LIKE '%box%'
is null/ is not null: 비어 있거나 비어 있지 않은 상태에서 값을 가져오는 명령어
ex) where Country is null: county에서 null을 가져와라
case: 데이터를 특정한 '기준'에 따라 카테고리를 분류할 때 쓰이는 기능
이건 잘 모르니 해보자.
SELECT *
,case
when Price >= 50 then '고가'
else '보통'
end price_category
FROM Products;

, case라고 해야 된다.
if도 case와 동일한 기능이다.
SELECT *, if(Price>=50,'고가','보통') as price_category FROM Products;
Sub Query: 쿼리 안에 쿼리의 결과를 넣을 수 있습니다.
SELECT * FROM Products where Price >= (select avg(Price) from Products)

Union/ Union all: 같은 구조의 테이블 두 개를 붙여주는 명령, union은 중복 제거 후, union all은 중복 포함해 합쳐짐
ex) select * from Customer_Oct union select * from Customer_Nov
관계형 데이터의 관계란? : 데이터를 하나의 큰 테이블에 저장하지 않고 작은 테이블로 쪼개
Join: 테이블 간의 관계로 데이터를 붙여서 보는 명령어
inner join, left join이 많이 쓰인다.
ex) select * from OderDetails inner join Orders on OderDetails.OrderID = Orders.OrderID
2. A/B테스트
A/B테스트
원본 변주1 변주2 변주3 위너 하나만 남김
시청시간 늘리기
abtest닷컴에 다양한 사례들이 있다.
몇명에게 실험해야 유의미한 결과라고 할 수 있을까?
전체를 다 보는 것은 사실상 불가능 -> 일부만 뽑아(sampling) 분석해 전체를 추정
EX) 출구조사
추정이 가능한 이유는 정규분포 때문이다.
정규분포: 자연 현상이나 여러 통계적 테이터에서 보여지는 분포패턴, 평균을 중심으로 몰려있고, 멀어질수록 빈도가 줄어듬
회고
비즈니스 이해 도메인을 바탕으로
가설 , 데이터 확보(쿼리, 공공데이터 등)하여
가시화 (액셀, 파이썬, 태블로)하고
임의의 결론을 낸다.
다시 가설 무한반복한다.
나는 데이터를 확보하여 직접 추출하는 방법을 배우고 있다.
내가 무엇을 하기 위해 어떤 툴을 배우고 있는 것인지 잊지말자.
'성동1기 전Z전능 데이터 분석가 과정' 카테고리의 다른 글
| [성동1기 전Z전능 데이터 분석가] 25일차 SQL.5 (0) | 2023.11.17 |
|---|---|
| [성동1기 전Z전능 데이터 분석가] 24일차 SQL.4 (0) | 2023.11.16 |
| [성동1기 전Z전능 데이터 분석가] 21일차 데이터리터리시 6 (0) | 2023.11.13 |
| [성동1기 전Z전능 데이터 분석가] 19일차 - SQL.1 (0) | 2023.11.12 |
| [성동1기 전Z전능 데이터 분석가] 16일차 - GA4 (0) | 2023.11.06 |