책소개
본서는 외부의 정형 및 반정형 데이터를 수집하기 위해, Open-API, 트위터 데이터 수집, 웹페이지 및 웹에 올린 파일 데이터로 읽어오기 등을 습득 할 수 있습니다.
목차
I.트위터 데이터 가져와 분석하기
1.트위터 데이터 가져와서 저장하기
2.키워드 입력해서, 트윗 데이터 가져와서 단어-문서 테이블 만들기
II.Open-API로 데이터 가져오기
1.Open-API 이해 및 Json 읽기 함수
2. 날씨 json 파일 읽어서 가공후 저장하기
3. 교통사고 데이터를 Open API를 사용해서 가져오기
4. 서울열린데이터 광장(seoul.data.go.kr) Open-API 사용하기 : XML로 받는 경우
III. CURL로 데이터 가져오기
1. 레파지토리에서 데이터 읽어와서 하드디스크의 R작업 디렉터리00-R 폴더에 저장하기
IV. CSV 파일 읽기
1. csv 파일 가져오기
2.read.csv() 함수의 default 옵션
3.Factor Object로 읽지 않기
4.NA로 처리할 값 설정하기
5.따라하기 과제
6.글깨짐 처리하기
7.금액 등 중간에 쉼표(“,”)가 포함된 CSV 파일 읽기
8."열의 개수가 열의 이름들보다 많습니다."처리하기
9.컬럼별로 데이터 타입을 지정하여 읽기
10.상위 몇 개 라인을 제외하고 읽고, 메타 데이터 입력하기
11.관련 에러 및 경고 메시지의 처리
12.csv 파일 읽어오고 날짜 가공하기 따라하기
13.주소에서 국가, 도, 시, 읍, 리 로 파생변수 생성하여 데이터셋 구성하기
V. 탭으로 구분된 파일 읽기
1.탭으로 구분된 파일 읽기 함수
2. 일정한 간격으로 구분된 파일 읽기
3.Wi-fi 설치 위도경도 좌표 데이터 읽기 따라하기
4.연습 문제
VI. 규칙적인 형식의 다양한 Text 파일 읽기
1.규칙적인 형식의 다양한 Text 파일 읽기 함수
2.함수 형식
3. 헤드가 있는 데이터 읽기
4.“#”표시가 입력되있고, 모양이 불일치해보이는 Text 파일
5. 앞줄 몇 라인 건너 뛰고 읽고 메타데이터로 입력하기
VII. 넓이로 고정된 형식의 테이블 읽기
1. 넒이로 고정된 데이터 파일 읽기 함수
2. 특정 위치 제외하고 읽기
VIII. 웹페이지 및 웹에 올린 파일, 연결된 링크 주소 읽기
1.크롤링과 스크레이핑
2.웹 페이지 읽고 패턴단어 찾기
3.여러 웹 페이지 읽고 패턴단어 찾기
4.웹에 올린 엑셀 파일 읽어오기
5.웹에 올린 CSV 및 텍스트 파일 읽어오기
6.URL 중에 특수문자(?)를 기준으로 앞의 내용만 추출하기
7.웹페이지에 연결된 링크 주소 가져오기
IX. x l s, x l s x 파일 읽기
1.gdata
2.서식있는 엑셀 파일 읽기, xlsx 패키지
3.x l s x 관련 함수
4.관련 에러 메시지 해결하기
5.엑셀파일 여러개 동시에 읽기
6.x l s x 확장자 엑셀 파일 읽기
7. 서식이 있는 엑셀파일 읽기에서 잘못 읽혀진 부분 제대로 읽기
X. SPSS 데이터 파일 R로 읽기
1.SPSS 데이터 읽기 함수
2.SPSS 파일 읽기 따라하기
XI. PDF 파일 읽기
XII. 데이터 파일로 저장하기
XIII. XML 데이터 읽기
XIV. 오픈 데이터
1.서울시 열린 데이터 광장
2.경제 관련 데이터
3.월별 업종별 기업전망 지수
4.기업의 감사정보
5.기상 관련 데이터
6.경기 데이터 드림 오픈데이터 셋 사용하기