본문 바로가기

빅데이터

빅데이터 분석 공부를 시작하면서..

반응형

 

언제부터인가 데이터 분석을 취미생활로 하기 시작하면서 장대한 플랜을 세웠는데, 그 플랜에서 이제 다음 단계로 넘어갈 준비가 되었다고 생각되어 이제 그동안 계속 미루어두었던 빅데이터 공부를 시작하려고 합니다.

 

사실 처음부터 빅데이터에 매우 관심이 많았지만, 진입장벽이 워낙에 높은 부분이라 당장 다가서기가 어려웠습니다. 그리고 무엇보다도 하둡이나 NoSQL, 머신러닝 등은 빅데이터의 처리와 분석에 보다 관심이 집중되어 있다보니, 빅데이터의 수집 방법을 알지 못하는 저로서는 당장 배우고자 하는 동기부여가 잘 되질 않았던 게 사실이지요.

 

때문에 한동안 관심을 접어둘수 밖에 없었고, VBA와 파이썬, R, 자바로 웹크롤링(파싱)을 공부를 해서 원하는 데이터를 수집하는 기술을 익히는 시간을 가졌습니다. 그리고 꽤 오랜시간이 걸렸지만, 이제는 나름 스스로 데이터 수집 및 전처리에 있어서는 자신감이 생긴 것 같습니다.

 

때문에 이제는 데이터 처리와 분석에 대한 공부를 시작해보려고 합니다. 그 일환으로 오늘 서점에 가서 책을 읽어보고 마음에 드는 머신러닝과 하둡에 대한 책 두권을 샀습니다.

 

머신러닝 인 액션

 

저자 피터 해링턴|역자 김영진|제이펍|2013.06.26
원제 Machine learning in action
페이지 448|ISBN 9788994506661

http://book.naver.com/bookdb/book_detail.nhn?bid=7235092

하둡 프로그래밍 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

아직 자세히 읽어보지 못해서 이러한 내용을 모두 익히는데 얼마가 걸릴지 알수 없지만, 조금씩 조금씩 공부를 하면 그 재미가 쏠쏠할 것 같네요. 가끔 공부하다 보면 더 몰입해서 공부하고 싶은 욕심이 생기겠지만, 어디까지나 취미로 하는 공부이기 때문에 자제를 잘 해야 할 것 같네요.

 

너무 지나친 꿈일지는 모르겠지만, 언젠가는 영화 Her나, 트랜센더스, 아이언맨에 나오는 AI를 만들 수 있는 날이 오지 않을까 싶습니다. 물론 저와 저의 가족에게 특화된 AI이겠지만요. 이러한 꿈을 가질 수 있다는 것만으로도 공부를 하는 재미가 생기는 것 같습니다. 앞으로 어떤 가능성이 더 열릴지 저 스스로도 매우 기대가 되네요!

 

 

반응형