ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [혼공데분] 1주차 데이터 분석을 시작하며
    혼공공부단11기_혼공데분 2024. 1. 2. 23:42

    초반 1-1은 데이터 분석, 데이터 과학이란? 데이터 분석가는 무슨 일을 하는 사람이고 데이터 분석을 위해선 어떤 기술을 쓰는 지에 대한 내용이다. 

    1-2는 colab 관련 내용. 1-1과 마찬가지로 나에게 새로운 내용 없겠거니 하고 넘기다가...

    코랩 툴바에 Latex 수식 작성 기능있다는 거 처음 알았다. 코랩 평소에 안쓰긴하지만 유용한 기능이 많네

    * 코랩 노트북은 한번에 최대 5개까지 실행가능하고 한 노트북은 12시간 이상 실행가능하다고 한다.(그전에 런타임 안끊기게 하는게 더 어려울 것 같지만) 

    1-3은 공공데이터를 활용한 간단한 실습내용이다.(아직 데이터 분석 실습은 아니고 데이터 읽기 저장하기 내용밖에 없다)

    실습 내용 자체는 간단한데 초반 파일 인코딩이나 한글 인식 관련한 내용은 기초 분석책에서 처음 본 내용이었고 유익해보였다. 가끔 일하다 한글 인식 관련 문제생기면 구글링해서 온갖 방법 다 사용해보는데다가 보통 분석 책들은 이 부분은 대강 넘어가기 때문에 이런 식으로 지면 할애한 부분이 긍정적으로 다가왔다.

    * pandas read_csv의 low_memory 매개변수도 처음 보네...실제로는 dtype명시하는 방법이 더 효율적일 것 같긴 하다.

    * p78-89의 공공데이터 사이트는 개인 프로젝트에 유용해보인다.

     

     * 기본 미션(p81 Q4)

    pandas 라이브러리의 read_csv() 함수의 매개변수 관련 문제이다.

    - 1. 첫번째 행을 열이름으로 사용하는 것은 맞는데, 기본값이 0

    - 2. 행 이름이 아니라 열 이름

    - 3. 정답

    - 4. 일부 열만 데이터 타입 지정해도 됨

     

    소감: 첫주차라 그런지 쉬워서 좋고 한주의 시작(월요일은 휴일이었으니까 화요일이 시작 맞음^^)에 미션 마무리해서 기분 좋다

     

Designed by Tistory.