본문 바로가기

반응형

분류 전체보기

(92)
[웹] Html5 +JQuery로 무한반복 영상 플레이어(화면보호기) 제작 Html5 +JQuery로 무한반복 영상 플레이어(화면보호기) 제작 크롬브라우저에는 새탭을 열때마다 근사한 배경 영상들을 보여주는 UseDelight라는 꽤 유명한 확장 프로그램이 있다. 영상 수준이 괜찮아서 전체화면으로 해놓으면 화면보호기로도 쓸만하고 가만히 틀어놓고 감상하기에도 괜찮다. (웹 페이지로도 확인이 가능하다. usedelight.com) 다만, 보여지는 영상의 개수가 제한적이고 내가 원하는 영상을 선택하지 못한다는 점. 그리고 영상의 길이가 짧다는 단점이 있어서, 계속하여 틀어놓고 보기에는 다소 불편한 느낌이 든다. 특히 듀얼보니터로 작업시 한쪽 모니터에 힐링이 되는 멋진 영상을 틀어놓으면 기분전환이 되곤 하는데 UseDelight는 다소 아쉬운 점이 있다. 그래서 비슷한 걸 html과 c..
[RPA] UI.Vision을 사용한 국세청 휴폐업 조회 자동화 UI.Vision을 사용한 업무 자동화 최근 RPA 업무가 활성화되면서 일반 상용툴 외에 무료로 배포되는 툴들도 기능들이 상당히 좋아지고 있다. 특히, 웹브라우저를 통한 업무와 관련해서는 Web automation 툴이 굉장히 많은데, 그 중에서도 가장 많이 이용하는 것은 단연 Selenium이다. 그리고 Selenium은 크롬 브라우저에서 자동화 작업을 만들고 실행할 수 있는 Selenium IDE라는 크롬 확장 프로그램을 제공하는데, 사실 이 확장 프로그램만으로도 웬만한 인터넷과 관련된 업무 자동화가 가능하다. 그리고 Selenium IDE와 호환되면서 좀더 기능이 추가된 UI.Vision이라는 확장 프로그램도 무료로 제공되고 있는데, 이미지 기반 자동화 기능을 제공하고, 제한적으로 OCR 기능도 제..
[파이썬] 파이썬으로 알리익스프레스(aliexpress) 상품 스크래핑(크롤링) 파이썬으로 알리익스프레스(aliexpress) 상품 스크래핑(크롤링) 도전 예전부터 알리익스프레스 상품 정보를 긁어와 달라고 부탁하는 분들이 많이 계셔서 가끔 작업을 하고는 했는데, 매번 할때마다 항상 작업 난이도는 최상급이었던 듯 하다. 알리익스프레스는 크롤링 방지를 위한 솔루션을 계속 고도화시키고 있는 것이 분명하다. 때문에 알리익스프레스를 크롤링할 수 있다면 그 사람의 실력은 거의 검증된 것으로 봐도 무방할 듯 하다. 아무튼 각설하고, 이번에는 순전히 재미로 크롤링에 도전해 보았다. 실력 점검 차원이기도 하고, 그동안 알리익스프레스의 기술이 얼마나 발전했는지 궁금하기도 했다. Selenium으로 크롤링 시도 우선은 가장 쉬운 selenium을 통한 자동화. 처음 몇번은 성공했지만, 3~4번부터는 막..
[파이썬] 파이썬, 머신러닝으로 네이버페이 키패드 인식 후 입력하기 파이썬, 머신러닝으로 네이버페이 키패드 인식 후 입력하기 요즘 간편결제가 활성화되면서 공인인증서나 복잡한 패스워드 없이 4~6자리 PIN 번호 입력만으로 결제가 되는 시스템이 활성화되고 있는 듯 하다. 하지만 단순히 번호를 입력하는 방식이 아니라, 화면을 보고 키패드를 누르는 방식이다 보니, 이를 자동화하는 것이 생각보다 쉽지가 않은 모양이다. 그래서 이번에는 머신러닝을 통해서 키패드를 인식하는 것을 한번 만들어보았다. 우선 아래 이미지는 PC에서 네이버페이를 통해서 결제를 할때 나타나는 PIN 입력 화면 창이다. 여기서 아래 초록색 키패드 부분의 숫자가 무작위로 정렬이 되는데, 이를 인식하여 마우스 등을 통해 클릭하게 하는 작업을 해볼까 한다. 작업 순서 1. 네이버페이 PIN입력 화면 크롤링 - 학습..
[서버] Centos6에 python3.6, OpenCV 설치하기 Centos6에서는 기본적으로 파이썬2.7 버전이 설치되어 파이썬3를 설치하기 위해서는 별도의 작업이 필요하다. 아마도 아래 코드는 Centos7과 Centos8에서도 동일하게 사용이 가능할 것으로 생각된다. 파이썬 3.6 설치 아래 코드에서 파일명 등에 붙어 있는 버전을 변경하면 다른 버전의 파이썬도 설치 가능하다. (다만, 경우에 따라서 pip를 통한 라이브러리 설치 시 ssl 모듈 에러를 발생시키기도 하기 때문에 추천하지는 않는다.) yum -y install gcc openssl-devel bzip2-devel wget opencv wget https://www.python.org/ftp/python/3.6.6/Python-3.6.6.tgz tar xzf Python-3.6.6.tgz cd Pyt..
[파이썬] 머신러닝으로 캡챠(captcha) 뚫기 2편 (위메프 파트너) 관련글 : 머신러닝으로 민원24 캡챠(Captcha) 뚫기 이전에 머신러닝으로 민원24 캡챠를 뚫는 글을 쓴 적이 있었는데, 많은 분들이 문의를 주시고 답변을 해드리는 과정에서 생각보다 다양한 곳에서 캡챠를 사용하고 있고 그것때문에 고생하시는 분들이 많다는 것을 알게 되었다. 그리고 최근에 위메프 파트너스 사이트에도 캡챠가 적용이 되어서, 이 캡챠를 해결해 달라는 요청이 있었는데, 지금까지 정부사이트 캡챠와 형식은 동일하지만 영문알파벳까지 포함되어 있는 좀더 고도화된 캡챠를 사용하고 있었다. 알파벳이 포함되면.. 총 26개 글자가 더 늘어나니깐 기존 10개 숫자를 학습시킬 때 필요했던 데이터의 3.6배의 데이터가 필요하게 된다. (10+26=36) 그렇다는 말은 캡챠마다 레이블 붙여주는데 걸리는 시간의 ..
[파이썬] 코스피, 코스닥 전 종목 데이터 스크래핑 다음증권을 통한 데이터 수집 다음증권에서 업종별로 현재가 및 등락률 거래량, 외국인 지분율 등 시세를 제공하는데, 파이썬을 이용해서 전체 종목에 대한 시세 데이터를 스크래핑 할 수 있다. 파이썬 스크래핑 코드 아래는 파이썬의 requests 라이브러리와 pandas 라이브러리를 통해서 전체 업종 시세 데이터를 스크래핑 한뒤 CSV 파일로 저장하는 코드이다. 여기서 주의할 점은 업종별로 스크래핑 하다보니, 중복되는 종목이 일부 존재하는데, 이를 반드시 제거해주어야 한다. (아래 코드에 포함) import requests import pandas as pd headers = { "Host": "finance.daum.net", "Connection": "keep-alive", "Accept": "applic..
[트레이딩] 전자공시시스템 : 미국 - EDGAR 미국 [EDGAR] 미국 SEC에서는 EDGAR라는 전자공시시스템을 운영하고 있다. 상장기업이라면 EDGAR에서 US-GAAP에 따른 재무제표와 기타 중요 공시정보를 확인할 수 있다. SEC.gov | Company Search Page www.sec.gov 우선 위의 웹 사이트에 접속하면 아래와 같은 화면이 나타는데, 상장사의 경우 Ticker Symbol을 넣어주면 된다. 예를 들어 애플의 symbol은 AAPL이다. symbol을 입력하고 검색버튼을 누르면 아래와 같이 공시 문서를 확인할 수 있다. 다만, EDGAR에서 제공하는 문서들은 각각의 이름을 가지고 있는데 (예 : Form Q-10) 문서이름 옆에 약간의 설명이 있긴 하지만, 밑의 가이드를 통해서 각각의 문서가 어떤 내용을 담고 있는지 미..

반응형