2019年2月14日 星期四

用 Google 試算表抓取第三方資料教學 (以基金淨值為例)

之前把一些文章轉到Dcard,發現引起不少迴響,其中有人問到,想把基金也加入,希望能知道自己買的基金現值多少,比較能清楚看到自己的總資產。

因為個人目前是沒有在做基金,請網友提供想抓取的基金淨值連結,然後來寫個範例供大家參考。

沒有看過之前教學的建議先去看看,比較能夠了解google試算表的運作方式。


用 Google 試算表製做簡易股票報價表及理財表

用 Google 試算表製做歷史股價走勢圖(K線)

用 Google 試算表進行技術分析(雙週線)(月線)

本次教學是使用IMPORTHTML函數,官方的文件請參考以下連結
https://support.google.com/docs/answer/3093339?hl=zh-Hant


解決的思路是使用IMPORTHTML函數,去將表格或清單中的資料匯入,官方的範例如下。


用法範例

IMPORTHTML("http://en.wikipedia.org/wiki/Demographics_of_India","table",4)
IMPORTHTML(A2,B2,C2)

語法

IMPORTHTML(網址, 查詢, 索引)
  • url - 要檢查的網頁所在網址,包括通訊協定名稱 (例如 http://)。
    • url 的值必須放置在引號內,或者是一個含有適當文字的儲存格參照。
  • query - 根據存放資料的結構類型而定,此值可設定成 "list" (清單) 或 "table" (表格)。
  • index - 從 1 開始的索引,指明應該傳回 HTML 原始碼中界定的表格或清單。
    • 系統會分開處理清單及表格的索引;如果 HTML 網頁上同時有清單和表格,這兩種元素可能都會有 1 的索引值。

網友提供的基金連結如下(兆豐國際中國A股基金(台幣) 基金淨值走勢圖)
https://fund.bot.com.tw/w/wr/wr02a.djhtm?a=ACII31-5422&customershowall=0

網頁如下圖



我們要抓的是淨值的部分


程式撰寫如下
=IMPORTHTML("https://fund.bot.com.tw/w/wr/wr02a.djhtm?a=ACII31-5422&customershowall=0","table",4)

"table" 代表表格
後面的數字,代表從 1 開始的索引,指明應該傳回 HTML 原始碼中界定的表格或清單。

把程式放進A2



然後資訊就會自己載入了,是不是很簡單呢?

如果有需要詳細的程式碼及試算表表單,請留言mail我會將連結開啟共用權限給你。以下為試算表連結
https://docs.google.com/spreadsheets/d/1hgkNeyEhwhQsLybdiOPwjw5kIQKyO-qjq5AGECRVHW8/edit#gid=0

如果你覺得我寫的文章不錯
可以按讚給我支持與鼓勵
https://www.facebook.com/IEPSYfinancenote/



新成立的ig歡迎追蹤:iepsyfinancenote
https://www.instagram.com/iepsyfinancenote/
 



我將思想傳授他人,他人之所得,亦無損於我之所有;猶如一人以我的燭火點燭,光亮與他同在,我卻不因此身處黑暗。湯瑪斯‧傑弗遜(Thomas Jefferson)

13 則留言:

  1. 您好~可以分享權限我的IMPORTHTML一段時間後都會失效無法自動更新,謝謝,
    yichenlihi@gmail.com

    回覆刪除
  2. 自己用importxml去拉上櫃股票
    但在非交易時間會拉不到!!!

    只好跟大神借鏡來學習學習了
    hsien616@gmail.com
    麻煩了

    回覆刪除
  3. 謝謝! 敬請分享 hseyilishih@gmail.com

    回覆刪除
  4. 資工大大你好:
    首先要跟你說謝謝,你的文章讓我學習到很多東西!
    想請問一下,以這個基金的淨值為例,他可以每天更新最新的淨值嗎?
    那如果他自動更新也會自動增加欄位?

    如果都不會自動更新且自動增加欄位,有什麼辦法可以做到?

    回覆刪除
    回覆
    1. 只要第三方資料來源有更新,他就會更新

      刪除
  5. 謝謝您,煩請分享u9611143@gmail.com

    回覆刪除
  6. 請問像
    https://hk.finance.yahoo.com/quote/MMM/balance-sheet?p=MMM
    若想抓其現金流量表資料
    利用importhtml
    table 或 list 的 index 要怎麼設呢?
    一直試1~9 好像還是跑不出資料....
    要怎樣才能知道要的資料是 table or list 以及對應的 index
    有辦法用甚麼方法直接判斷嗎?
    不知您有甚麼好的建議
    感恩

    回覆刪除
  7. 您好 最近搜尋爬蟲相關初步學習收穫良多
    想請協助開放文章借我參考
    也想研究股票現價等

    另外請教工作面
    如果我需要登入使用像是intel等網站搜尋更新的tool/doc的文件版本
    不知可否也使用這類的方式自動抓新版本的板號呢?


    我的信箱: meganchou1120@gmail.com

    謝謝您

    回覆刪除
  8. 您好,近期想要學習這方面不知是否可以分享程式碼及試算表表單?

    回覆刪除
  9. 您好 請問用上述教的方法 這個網頁的歷史股價資料怎麼抓不下來?
    https://hk.finance.yahoo.com/quote/1565.TWO/history?p=1565.TWO

    回覆刪除

經濟日報數位訂閱懶人包

  去年寫過一篇介紹文,經濟日報推出了數位訂閱產品,如果你是價值投資者,或是對產業研究及經濟數據有興趣的朋友,包含深耕國內外財經深度內容、圖像式產業資料庫、早安經濟日報聽新聞等等。   目前有「彭博新聞獨家聯名、七大外媒授權合作、專家解析深度專欄」三大內容,豐富你的關鍵投...