2010年3月8日 星期一

Google V.S Yahoo History Data

  1. 在 History Data上大家很容易發現Google 跟 Yahoo 是有些微的差距,底下就來看一下各有什麼差別.不然 Garbage In = Garbage Out 摟.
  2. 底下左邊是Google Finance,右邊是 Yahoo Finance,我們會發現以下幾點不同. (1)在Google的Data 中少了 2010/03/03這筆資料而Yahoo卻有,查了一下開市紀錄,發現確實2010/03/03是有開盤的,可能當天美國休市.所以變的要從Yahoo那邊把資料補齊. (2) 成交量的地方又有明顯的差距,核對了券商的軟體之後發現Google的準確性較高.可能Yahoo有做adjust把成交量轉換過一次.
soluation: 目前解決方案,先抓取Yahoo的Data當基礎,在抓取Google的Data取代掉Yhoo 跟 Google重疊的部分,就可得到最適當的Data,隨然有幾天的成交量不怎麼理想, 但整體而言,我覺得對我們的Input Data影響不大.

沒有留言:

張貼留言