1. 좋은데이터 기준 1 - 1. 완결성 필수적인 데이터는 모두 기록되있어야 한다. 결측값: 채워져야 하는데 비어있는 값이다. 데이터프레임에서 NaN으로 표시된다. 1 - 2. 유일성 값이 중복되면 안된다. 1 - 3. 통일성 데이터가 동일한 형식으로 저장되어 있어야 한다. ex) kg, lbs, 띄어쓰기, 표기법 등등.... 1 - 4. 정확성 이상점: 박스그래프때도 잠깐 언급했었다. 정상적인 범주를 벗어나, 자료분석에 방해가 되는 데이터를 말한다. 2. 데이터 클리닝 2 - 1. 완결성 결측값은 NaN으로 뜬다고 했다. 보자 변수.isnull() 결측값이 true라고 나온다. 변수.isnull().sum() 각 칼럼의 결측값 갯수를 말해준다. 변수.dropna() 이면 결측값을 제거한다. ( ) 안에..