본문 바로가기

반응형

빅데이터

(2)
[데이터시각화] 제21대 국회의원 관련 통계 시각화(1) 국회사무처에서 제공하는 OpenAPI를 통해서 국회의원들에 대한 세부 정보를 손쉽게 스크래핑 할 수 있어서, 이 데이터를 가지고 간단한 통계를 추출, 시각화를 해보았다. 국회 사무처 OpenAPI : https://data.go.kr/data/15012647/openapi.do 1. 출생연도별 국회의원수 총 300명의 국회의원들 중에 1964년 출생한 국회의원 수가 26명으로 가장 많았고, 그 다음으로 63년 출생 24명, 62년 출생 20명 순으로 많은 것으로 나타난다. 2020년 현재 기준 만 58~56세 정도로 일반적인 경제활동인구의 연령에 비해서는 많은 편이다. 2. 정당별 평균 연령 주요 정당별로는 미래통합당이 평균 연령이 만 57세로 가장 많은 편이고, 그 다음 더불어민주당 55세, 국민의 당..
빅데이터 분석 공부를 시작하면서.. 언제부터인가 데이터 분석을 취미생활로 하기 시작하면서 장대한 플랜을 세웠는데, 그 플랜에서 이제 다음 단계로 넘어갈 준비가 되었다고 생각되어 이제 그동안 계속 미루어두었던 빅데이터 공부를 시작하려고 합니다. 사실 처음부터 빅데이터에 매우 관심이 많았지만, 진입장벽이 워낙에 높은 부분이라 당장 다가서기가 어려웠습니다. 그리고 무엇보다도 하둡이나 NoSQL, 머신러닝 등은 빅데이터의 처리와 분석에 보다 관심이 집중되어 있다보니, 빅데이터의 수집 방법을 알지 못하는 저로서는 당장 배우고자 하는 동기부여가 잘 되질 않았던 게 사실이지요. 때문에 한동안 관심을 접어둘수 밖에 없었고, VBA와 파이썬, R, 자바로 웹크롤링(파싱)을 공부를 해서 원하는 데이터를 수집하는 기술을 익히는 시간을 가졌습니다. 그리고 꽤 ..

반응형