Study_note(zb_data)/Statistics

μ±… 데이터 μ‚¬μ΄μ–ΈμŠ€ μž…λ¬Έ 3 (기술 ν†΅κ³„λŸ‰ ~ ν‘œμ€€νŽΈμ°¨)

KloudHyun 2023. 9. 18. 01:41

πŸ“Œ 데이터λ₯Ό κ°’μœΌλ‘œ μš”μ•½ν•˜λŠ” 기술 ν†΅κ³„λŸ‰μ˜ 4κ°€μ§€ λΆ„λ₯˜

πŸ”» 쀑심 κ²½ν–₯μ„±

- 평균 κ°’, 쀑앙 κ°’, 졜빈 κ°’ 등이 쀑심 κ²½ν–₯성이닀

- μ–΄λŠ 값이 λΉˆλ²ˆν•˜κ²Œ λ‚˜νƒ€λ‚˜λŠ” μ§€, μ • κ°€μš΄λ° 값은 무엇인지 등을 λ‚˜νƒ€λ‚΄λ―€λ‘œ μΌμƒμ—μ„œλ„ 많이 μ‚¬μš©λœλ‹€.

πŸ”»μ‚°ν¬λ„

- λ°μ΄ν„°μ˜ 흩어져 μžˆλŠ” 정도, μ΅œλŒ“κ°’κ³Ό μ΅œμ†Ÿκ°’μ€ κ°€μž₯ 큰 데이터와 κ°€μž₯ μž‘μ€ 데이터λ₯Ό λ‚˜νƒ€λ‚Έλ‹€.

- λ²”μœ„ λ‚΄μ—μ„œ 데이터가 μ „λ°˜μ μœΌλ‘œ μ–΄λ–»κ²Œ 흩어져 μžˆλŠ”μ§€, μ–Όλ§ˆλ‚˜ λ³€ν™”ν•˜λŠ”μ§€ λ‚˜νƒ€λ‚΄κΈ° μœ„ν•΄

λΆ„μ‚°, ν‘œμ€€νŽΈμ°¨, ν‘œμ€€μ˜€μ°¨ 등이 쓰인닀.

πŸ”»λΆ„ν¬μ˜ ν˜•νƒœ

- 쀑심 κ²½ν–₯μ„±κ³Ό 산포도λ₯Ό μ΄μš©ν•˜λ©΄, 데이터 쀑심이 μ–΄λ”” 인지와 각 데이터가 μ€‘μ‹¬μœΌλ‘œλΆ€ν„° μ–΄λŠ 정도 흩어져 μžˆλŠ”μ§€ μ•Œ 수 μžˆλ‹€.

- but μ–΄λŠ μͺ½μœΌλ‘œ 쏠렀 μžˆλŠ”μ§€λŠ” 확인이 μ–΄λ ΅λ‹€. 

-- 이λ₯Ό ν•΄κ²°ν•˜κΈ° μœ„ν•΄ 첨도와 μ™œλ„λ₯Ό μ‚¬μš©ν•œλ‹€.

πŸ’‘μ²¨λ„μ™€ μ™œλ„?

- μ²¨λ„λŠ” 데이터 λΆ„ν¬μ˜ λΎ°μ‘±ν•œ 정도λ₯Ό λ‚˜νƒ€λ‚΄λ©°, μ™œλ„λŠ” 데이터가 μ–Όλ§ˆλ‚˜ ν•œ μͺ½μœΌλ‘œ 치우쳐 μžˆλŠ”μ§€ λ‚˜νƒ€λ‚Έλ‹€

πŸ”»λ°±λΆ„μœ„μˆ˜

- 데이터λ₯Ό μ •λ ¬ν–ˆμ„ λ•Œ, λ°±λΆ„μœ¨λ‘œ λ‚˜νƒ€λ‚Έ νŠΉμ • μœ„μΉ˜μ™€ 값을 μΌμ»«λŠ”λ‹€.

- μ•„λž˜ κ·Έλž˜ν”„μ—μ„œ, λˆ„μ  P(10)은 961만 원, P(90)은 5,562λ§Œμ›μœΌλ‘œ ν‘œν˜„λ˜μ–΄ μžˆλ‹€.

- μΆ”κ°€λ‘œ μ€‘μœ„μ†Œλ“μ€ 2,643 λ§Œμ›μœΌλ‘œ μ±…μ •λ˜μ–΄ μžˆλ‹€.

 

자료 좜처 : (μ±…) 데이터 μ‚¬μ΄μ–ΈμŠ€ μž…λ¬Έ

πŸ“Œ μ°¨νŠΈμ— λŒ€ν•΄μ„œ

πŸ”» κ·Έλž˜ν”„

- 꺾은 μ„ ν˜• κ·Έλž˜ν”„λŠ” μ‹œκ°„μ˜ 흐름에 따라 데이터 λ³€ν™” 좔이λ₯Ό μ•Œμ•„λ³Ό 수 μžˆλŠ” μœ μš©ν•œ μ°¨νŠΈμ΄λ‹€.

- ν•˜μ§€λ§Œ 값을 κ΅¬μ„±ν•˜λŠ” 속성을 λ‹€μ–‘ν•˜κ²Œ ν‘œν˜„ν•˜κΈ°λŠ” μ–΄λ ΅λ‹€λŠ” 단점이 μžˆλ‹€ (이λ₯Ό λ³΄μ™„ν•˜κΈ° μœ„ν•΄ μ˜μ—­ν˜• or λ§‰λŒ€ν˜• 차트λ₯Ό ν™œμš©ν•˜κΈ°λ„ ν•œλ‹€)- κ·Έ μ™Έ 파이차트, μ›Œλ“œ ν΄λΌμš°λ“œ, 히트맡 λ“± λ‹€μ–‘ν•œ κ·Έλž˜ν”„κ°€ 쑴재 ν•œλ‹€. 

Tableau둜 λ§Œλ“€μ–΄λ³Έ 꺾은 μ„  κ·Έλž˜ν”„

 

쒌 : μ˜μ—­ν˜• κ·Έλž˜ν”„ / 우 : λ§‰λŒ€ν˜• κ·Έλž˜ν”„

 

 

πŸ“Œ ν‘œμ€€νŽΈμ°¨μ™€ λΆ„μ‚°μ˜ κ°œλ… 작기

πŸ”» μ•„λž˜ 데이터λ₯Ό 보고 κ°œλ…μ„ 이해 ν•΄λ³΄μž

좜처 : (μ±…) 데이터 μ‚¬μ΄μ–ΈμŠ€ μž…λ¬Έ

 

πŸ”» 평균

β–Ά 155 / 5 = 31λΆ„

πŸ”» 편차

- (평균 - κ΄€μΈ‘κ°’)

 

β–Ά (31-32) /(31-27) /(31-29) /(31-34) /(31-33)

β–Ά 1, 4, 2, -3, -2  (편차 값을 λͺ¨λ‘ λ”ν•˜λ©΄ 0이 λœλ‹€)

πŸ”» λΆ„μ‚°

- κ΄€μ°°λœ 데이터가 μ„œλ‘œ λ–¨μ–΄μ§„ 정도λ₯Ό λ‚˜νƒ€λ‚Έλ‹€.

 

β–Ά((31-32)^2 + (31-27)^2 + (31-29)^2 + (31-34)^2 + (31-33)^2 ) / 5

β–Ά (1 + 16 + 4 + 9 + 4) / 5 = 6.8 (λΆ„μ˜ 제곱)

πŸ”» ν‘œμ€€ 편차

- 평균과 직접 비ꡐ할 수 μžˆλŠ” 데이터 κ°’, 뢄산에 μ œκ³±κ·Όμ„ μ μš©μ‹œμΌœμ„œ 같은 λ‹¨μœ„λ‘œ λ§Œλ“€μ–΄ μ€€λ‹€.

- ν‘œμ€€ νŽΈμ°¨κ°€ μž‘μœΌλ©΄ 비ꡐ적 λ°μ΄ν„°μ˜ 변동성이 적고, λ†’μœΌλ©΄ 변동성이 λ§Žλ‹€κ³  해석할 수 μžˆλ‹€.

 

β–Ά λΆ„μ‚°μ˜ 제곱근 = μ•½ 2.607 (λΆ„)

 

πŸ“Œ μ •κ·œ 뢄포 (κ°€μš°μŠ€ 뢄포)

- 평균을 μ€‘μ‹¬μœΌλ‘œ 쒌우 λŒ€μΉ­μ΄λ‹€.

좜처 : (μ±…) 데이터 μ‚¬μ΄μ–ΈμŠ€ μž…λ¬Έ

πŸ”» μ •κ·œ λΆ„ν¬μ˜ μ˜ˆμ‹œ

7μ‹œ(평균)에 μ˜€λŠ” ν‘œμ€€νŽΈμ°¨ 5뢄인 λ²„μŠ€λ₯Ό μƒκ°ν•΄λ³΄μž, λ²„μŠ€κ°€ 1,000회 도착을 κ°€μ •

683νšŒλŠ” 7μ‹œλ‘œλΆ€ν„° ν‘œμ€€νŽΈμ°¨μ˜ 1배인 5λΆ„ 만큼 λ–¨μ–΄μ§„ λ²”μœ„μ— 도착할 것이닀. Range -> (6:55 ~ 7:05)

955νšŒλŠ” 7μ‹œλ‘œλΆ€ν„° ν‘œμ€€νŽΈμ°¨μ˜ 2배인 10λΆ„ 만큼 λ–¨μ–΄μ§„ λ²”μœ„μ— 도착할 것이닀. Range -> (6:50 ~ 7:10)

997νšŒλŠ” 7μ‹œλ‘œλΆ€ν„° ν‘œμ€€νŽΈμ°¨μ˜ 3배인 15λΆ„ 만큼 λ–¨μ–΄μ§„ λ²”μœ„μ— 도착할 것이닀. Range -> (6:45 ~ 7:15)

 

λ‚΄μš©μΆœμ²˜ :

https://search.shopping.naver.com/book/catalog/32481689677?cat_id=50010586&frm=PBOKPRO&query=%EB%8D%B0%EC%9D%B4%ED%84%B0%EC%82%AC%EC%9D%B4%EC%96%B8%EC%8A%A4+%EC%9E%85%EB%AC%B8&NaPm=ct%3Dlmowyv4w%7Cci%3D5cbc727822335b637510a554a3e7a3a7283fcf8f%7Ctr%3Dboknx%7Csn%3D95694%7Chk%3D3f64e15ac2cb880c21e5c4060a74b6f370484310 

 

데이터 μ‚¬μ΄μ–ΈμŠ€ μž…λ¬Έ : 넀이버 λ„μ„œ

넀이버 λ„μ„œ 상세정보λ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€.

search.shopping.naver.com