開放數據 資料一線通年底添「地理資訊平台」

社會

發布時間: 2017/06/06 08:00

最後更新: 2017/06/06 22:36

分享:

分享:

資訊科技辦公室系統經理(標準)勞敏明(左)強調,他們不是追求數據量的增幅、而是追求數據的質素。右為助理系統經理(標準)黃穎欣(陳偉英攝)

踏入數據時代(Age of data),各地政府均忙於建立開放數據。本港資訊科技總監辦公室(資科辦)公布,旗下「資料一線通」計劃於年底推出地理資訊平台的應用程式界面(API)版本,可於指定區域中顯示多項數據,包括診所、電動車充電站等資料。

在80多個政府部門中,只有約50個提供開放數據,資科辦指不是所有部門數據均合適開放,強調他們不追求數據量、反而重視數據的質素。

全球數據量似雪球般愈滾愈大,根據市場研究公司IDC報告,全球數據將由2013年的4.4ZB、增長9倍至2020年的44ZB,惟2013年只有少於5%數據被整合、分析。

愈來愈多機構透過大數據尋找商機,政府在開放數據上愈為重要。資科辦自2011年開始做「資料一線通」平台,至今提供近7,000組數據集,扣除因不同語言、格式而重複及圖像等檔案,實際機器可讀(Machine readable)數據集為1,800組;英國倫敦市有716組非重複數據集,紐約市則有2,500個數據集,而鄰近國家如南韓,提供近2萬個數據集。

資科辦網絡安全及標準部(標準分部)勞敏明強調,他們不是追求數據量的增幅、而是追求數據的質素,坊間有程式引用他們提供數據,例如警務處發放的失蹤人口資料,有開發者已用來尋找失蹤人士。

平台上的數據格式五花八門,有TXT、CSV、XML,甚至PDF及圖片,她建議不同部門提供機器可讀格式,惟並非所有部門均可提供,資科辦網絡安全及標準部(標準分部)黃穎欣稱,有些收集的數據本來是供內部使用,故部門須去除私隱資料,並轉化成公眾常用格式。

為方便程式開發者,資科辦於去年10月開始推出應用程式界面(API)版本,跟純數據集不同,開發者不用下載整個數據檔,反之可直接於部門的數據庫中取得最新的數據,再匯出成CSV、XML及JSON格式,不用每次下載大量數據。勞敏明指,至今有750組API數據,使用次數達3萬次,冀本月底可增至1,000組數據。

在眾多API中,資科辦發現就近位置資訊(Nearby)相關的API數據最受歡迎,如附近電動車充電站、學校、康體設施、WiFi等。他們更計劃於本年底推出地理資訊平台,以API形式,可在指定區域中顯示多項資料,如灣仔至薄扶林的附近設施如充電站、診所等,將來計劃加上統計數字。

微軟前首席研發策略長Craig Mundie曾形容,數據是新的商業原材料。香港資訊科技商會會長黃岳永稱,政府開放大數據思維要變,須以應用(application)角度考慮哪些數據才開放,而不是所有數據都適合作開放數據。

他以平安鐘為例,若想得知某區晚上氣溫低於某個溫度時,召喚白車的頻率會否增加?要得知答案,必先取得天文台晚上溫度的數據、該區該段時間召喚白車的頻率、救護車到達需時等資料,綜合各數據後,若發現該區愈冷召喚救護車的長者愈多,可事前先協調,如安排救護車於附近,並提供最快路線。

他指出,本港政府雖然開放數據,但資料不是貼近市民所需。例如早前小一派位,若希望叩門的家長,現要到第三方小學網頁或心儀學校網站獲得學位資訊。他認為,教育局可主動提供各學校學位及其收生條件等數據,若市民可即時得知最新情況,不需要走來走去,建議政府部門在決定開放數據時,要以應用的角度出發。

政府有意吸引私營企業開放數據,他直言誘因很重要,例如Uber向新加坡政府提供即時交通數據,而政府有權參與Uber的收費設定,藉此保障市民。

【其他熱話】「四大」畢馬威員工遲到罰100元 發言人:正調查事件

【其他熱話】古埃及金字塔的背後 建築工人日薪有幾多?

【其他熱話】《90後的半退休生活》作者由4000元變出逾百萬生意