어제 논문 때문에 데이터 분석 잠깐 할것이 생겨서 했는데요.
분석하기전에 결측값 처리를 해야하는데 결측값에 값이 안들어가지는겁니다.
값을 넣어도 오류가 나지 않고 적용도 되지 않습니다 -_-?
재밌는건 분명히 열에 아무 값도 없는데 데이터 타입이 object라는 겁니다.
-_-?
데이터 타입을 바꾸는 명령을 해도 먹지도 죽어라 먹지도 않고..
그렇게 2시간 뻘짓을 하고 알아낸 결과
엑셀파일에서 결측값을 공란으루 둔게 아니라 공백(스페이스)를 넣어 두었네요?
-_-
역시 엑셀이 짱이예요. 직관적인게 짱입니다.
지금 생각해보니 왜 그런가 싶었더니
사실 빅데이터다 뭐다 해서 해외에선 파이썬,R이 많이 쓰이지만
우리나라는 SPSS로 작성하다보니까
미응답이나 복수응답 처리할 때는 변수를 그만큼 더 만들어서 처리를 하기에 빈칸으로 냅두면 다음 칸에 값을 못 넣으니 공백을 넣어 두었네요.
사실 빅데이터다 뭐다 해도, SPSS도 그만큼 업데이트 되서 신경망 분석, 의사결정나무 다 그릴 수 있습니다.
(물론 그 자바 기반으로 만들어진 괴랄한 속도를 감내 할 수 있다면야..)
요즘 SPSS설치하면 파이썬 라이브러리도 설치하게끔 하더라구요.
결론은 아오, 저 스페이스 때문에 2시간 이상 삽질한거 생각하면-_-;;
저도 줄바꿈 문자때문에 고생한 기억이 새록새록..