구글 빠 를 자부 하고 다녔습니다.
수십년간 구글을 사용해오고 구글의 문서들을 이용했는데 이제야 알게된 함수가 있었습니다.
- IMPORT로 시작되는 함수들이 그 것들입니다.
- IMPORTDATA : .csv(쉼표로 구분된 값) 또는 .tsv(탭으로 구분된 값) 형식으로 주어진 URL에서 데이터를 가져옵니다.
- IMPORTXML : XML, HTML, CSV, TSV, RSS 및 Atom XML 피드를 포함한 다양한 구조화된 데이터로부터 데이터를 가져옵니다.
- IMPORTRANGE : 지정된 스프레드시트에서 셀 범위를 가져옵니다.
- IMPORTFEED: RSS 또는 Atom 피드를 가져옵니다.
- IMPORTHTML: HTML 페이지에서 표 또는 목록에 있는 데이터를 가져옵니다.
IMPORT 와 관련된 위 함수들은 외부에서(Web)상에서 여러가지 정보를 가져와 시트로 정리해주는 기능을 가지고 있습니다.
아래에는 위중 제가 종종 사용하는 3가지 IMPORTHTML , IMPORTXML , IMPORTFEED 에 관하여 간단하게 정리해 보려합니다.
매우 간단해서 굳이 정리할 필요는 없지만 일단 짧게 나마 안내해보려 합니다.
IMPORTHTML 활용 예시

이런식으로 해당 사이트의 DATA 정보를 가져와 줍니다.

원본 사이트는 이런 형태입니다.
함수의 형태
함수의 형태는 IMPORTHTML(URL, 쿼리, 색인) 의 형식을 가지고 있습니다.
URL - 검토할 페이지의 주소를 입력합니다.
URL 값은 http://를 포함하여 따옴표로 묶거나, 해당 텍스트를 포함하는 셀에 대한 참조여야 합니다.
쿼리 - 원하는 데이터가 어떤 구조에 포함되었는지에 따라 목록인 경우에는 "list", 표인 경우에는 "table"로 입력합니다.
색인 - HTML 소스에 정의된 표 또는 목록 중 반환되어야 하는 것을 확인하는 색인으로 1에서 시작합니다.
사용방법

IMPORTHTML("데이터를 가져올 주소", "table", 순서)
또는
IMPORTHTML("데이터를 가져올 주소", "list", 순서)
해당 원본 시트가 TABLE / LIST 형식에 따라 지정을 해주면 됩니다.
주의 사항
IMPORTHTML함수는 웹페이지에서 table 태그나 ul 혹은 ol의 리스트 태그로 작성된 데이터만 불러올 수 있음.
IMPORTXML 활용 예시

이런식으로 해당 사이트의 DATA 정보를 가져와 줍니다.
함수의 형태
IMPORTXML(URL, xpath)
이런 형식으로 사용됩니다.
URL - 검토할 페이지의 URL이며 프로토콜(예: http://)을 포함합니다.
URL 값은 따옴표로 묶거나, 적절한 텍스트를 포함하는 셀에 대한 참조여야 합니다.
XPath- 구조화된 데이터에서 실행되는 XPath 검색어입니다.
XPath 관련 자세한 정보는 XPath Tutorial을 참고하면 좋을 듯 합니다.
사용방법
IMPORTFEED 활용 예시

이런식으로 RSS 피드가 제공되는 사이트의 정보를 가져올수 있습니다.
함수의 형태
IMPORTFEED("http://news.google.com/?output=atom")
IMPORTFEED(A2,B2,C2,D2)
이런 형식으로 사용됩니다.
URL - RSS를 참조할 페이지의 URL이며 프로토콜(예: http://)을 포함합니다.
URL 값은 따옴표로 묶거나, 적절한 텍스트를 포함하는 셀에 대한 참조여야 합니다.
사용방법

IMPORTFEED(A1,"items")
위 구문은 A1 셀에 가져올 RSS 주소를 입력한 것입니다.
간단하게 RSS 를 가져온 것을 볼수 있습니다.
마무리
IMPORT 함수를 많이 사용하면 시트가 느려지거나, 데이터를 불러오는데 문제가 생길 수 있으니 적절한 곳에만 사용하시길 권장합니다.
모든 사람에게 공개된 웹페이지의 데이터만 불러 올 수 있고, 로그인이 필요한 페이지는 불러올 수 없습니다.
겉보기에는 html 로 이루어진 웹페이지처럼 보이더라도, 그 안에 javascript 등 프로그램이 데이터를 불러오는 부분이 포함되어있다면, 불러오지 못할 수 있습니다..
또한 구글 스크립트를 실행 할때는 되도록 크롬 브라우저의 시크릿모드를 사용하는것이 좋습니다.
캐시 와 쿠키등의 문제로 하나의 브라우저에서 여러개의 계정을 이용하는 것이 문제가 되어 구글에서 스크립트 사용시 오류가 발생 할수 있습니다.
참고
구글 문서 편집기 관련 내용 참고 : 문서편집기 고객센터