Notice
Link
Recent Posts
Recent Comments
- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 컴퓨터통신
- MySQL
- pre-course
- map
- ERROR: install is not COMMAND nor fully qualified CLASSNAME.
- 연관분석
- 딥러닝 개요
- TabNet
- 역전파
- yarn 설치 에러
- 부스트캠프
- 부스트캠프ai
- 행렬
- HackerRank
- sql
- 쉽게 배우는 데이터 통신과 컴퓨터 네트워크 답지
- 딥러닝 역사
- gpt-api에러
- 프로그래머스
- python
- 프로그래머스 SQL
- pandas
- 쉽게 배우는 데이터 통신과 컴퓨터 네트워크
- 코딩테스트
- 깃
- 컴퓨터 통신
- gpt-api
- npm install -g yarn 에러
- inner join
- NumPy
Archives
목록데이터전처리과정 (1)
최말짱 블로그
데이터 전처리
데이터 전처리 정의 - 데이터 분석 작업을 하기 전에 데이터를 분석하기 좋은 형태로 만드는 과정을 총칭 데이터 전처리가 필요한 이유 - 실무 데이터는 분석 기법을 바로 적용하기 힘든 형태 - 비어있음(missing value), 잡음(noise), 적합하지 않은 데이터 구조 - 낮은 품질의 데이터로는 좋은 분석결과를 얻기 힘듦 데이터 품질 저하의 원인 - 불완전(incomplete) : 데이터가 비어 있는 경우로 DB 테이블의 속성값이 NULL인 경우 - 잡음(noisy) : 데이터에 오류(error)가 포함된 경우 ex) 나이가 음수인 경우 - 모순된(inconsistent) : 데이터 간의 일관성이 없는 경우. ex) 성별은 남자인데 주민번호 뒷 7자리 중 첫 자리가 2인 경우 고품질 데이터라고 하더..
데이터청년캠퍼스
2022. 7. 19. 16:16