日本色色网,性做久久久久久蜜桃花,欧美日本高清动作片www网站,亚洲网站在线观看

大數據開放的價值與隱憂
2012-07-10   作者:石劍峰  來源:東方早報
 
【字號

  涂子沛,知名專欄作家、信息管理專家,畢業于華中科技大學。赴美留學前,曾做過職業程序員,擔任過公安邊防巡邏艇的指揮官,也從事過政府統計工作,現居美國匹茲堡,是美國某軟件公司數據中心的主任。

    ■ 《大數據》作者涂子沛談不可阻擋的大數據浪潮
  小數據時代,可以研究個體但不能研究群體,因為只有關于個人的數據。而在大數據時代,人的行為都以數據形式存在,這里面就有很多商機。

  從中國的邊防警到美國的軟件公司數據中心主任,20年來,涂子沛的工作一直跟數據處理有關。他在最近由廣西師范大學出版的《大數據:正在到來的數據革命》(下稱《大數據》)一書中,以美國半個多世紀以來的信息開放、技術創新歷史為例,談在這個大數據時代,政府該如何推動信息公開,企業在其中有何商機,數據創新給民眾、政府、社會帶來的種種挑戰和變革。昨晚,涂子沛在上海以“不可阻擋的大數據浪潮”為題與讀者見面,并接受了專訪。
  大數據是與云計算同時興起的一個商業概念,從谷歌到騰訊,過去一年他們都在談大數據能帶來的商機。何為大數據?涂子沛有過一個簡單的描述:“什么叫大數據,簡單理解就是超大量的數據。到底多大才算大呢?我們一般認為按π為單位的數據就是大數據。π下面的單位就是G,一部電影大約一個G,一π就等于1024個G。你乘上π,1000多部電影那就算大數據了。我們再舉個形象的例子,現在美國國會圖書館是比較大的圖書館,所有的印刷品如果輸入電腦的話,它才是幾十個π,基本上人類的知識要是全部放在電腦里,也就是按π為單位。”
  在這本《大數據》里,涂子沛要討論的是,大數據時代能夠幫助我們走向更自由的社會。因為信息社會最重要的資產是信息,信息的產生、信息的使用、信息的整合,這都是信息社會最重要的生產活動。

    用數據說話,別用數據說謊

  問:在全世界,哪個公司或哪個機構擁有最多的數據?
  涂子沛:
我在書中有一個圖表,是2009年美國各行業數據存儲量對比,其中排在第一位的是制造業企業,第二位的就是政府。我們說數據帝國的興起,美國聯邦政府首先就是一個數據帝國,它擁有前所未有的數據。當然Google、Facebook也有大量數據,但只是其中一個公司。我們有一個錯覺,僅僅把互聯網數據當作數據,這是不全的。

  問:所以這本書最重要的主題是,推動政府開放數據?
  涂子沛:
數據開放運動為什么在政府部門開啟?技術的開放是一步步的,最早的開放是代碼開放,形成了1990年代的開源運動。這在當時有很大的爭議,比爾·蓋茨就曾反對代碼開放,但最后代碼開放都被接受了,大家也都在用開源軟件。軟件由兩部分組成,一部分是代碼,一部分是數據,開放完了代碼,接下來就是開放數據。開放代碼發生在私營企業中,開放數據則要看誰擁有最多數據,當然是政府。那么政府開放數據,首先開放什么?當然是公共財政支出的數據。這種情況已經在英、美出現。
  相比商業企業,為什么政府要推動大數據開放,因為企業的數據是零散的、案例性質的。大數據從三個層面發生影響:商業、政府和個人生活。因為政府擁有最多數據,應該首先開放。奧巴馬在美國推行數據開放運動,在全世界掀起一個數據開放浪潮。大數據要發揮作用,不僅是收集、挖掘,目前最重要的是開放。大數據可以從很多角度去談,我也談到了大數據怎么起源的,但我最關注的是,大數據真正要發揮作用是要開放,否則就不會產生價值。開放誰來推動?那就是政府。

  問:政府擁有那么多數據,但很多是不能開放的。如何界定哪些數據可以開放?
  涂子沛:
這里有兩條標準,首先是這些數據不能侵犯國家安全,其次是不能侵犯個人隱私。比如最先開放的內容之一,有政府福利項目支出數據,但開放時上面的名字都會抹掉。

  問:如何讓我們相信數據?
  涂子沛:
我之前有個講演,就是用數據說話,別用數據說謊。很多報告里都有數據,但通常的情況是,這些數據常常成為說謊的工具,成為任人打扮的小姑娘。現在經常會出現的情況是,孤立地解釋數據。合理地來說,我們不僅僅是要公布一個數據,還要公布數據的來龍去脈,一個數據可以復制才是站得住腳的。只公布一個數據是不夠的,還要求數據背后的數據公布。一個公布的數據是很難判對錯的,數據之間要互證才可以避免偽造。這就是數據開放的價值。不只是要公布一個孤立的GDP,更要開放整個數據,可以讓所有人自己去算這個GDP數據怎么來的。

    用數據提高生產力

  問:大數據開放的商機在哪里?
  涂子沛:
我們講到數據開放,首先想到的是知情權和政府透明,但這只是一方面。現在推進數據開放,不再只是政府監督方面,而是要看是否有商業價值,如何用這些數據推進生產?大數據時代標志著人類向知識時代的邁進。美國的數據開放運動,從數據中整合、發現新的知識,成為經濟發展的動力。比如沃爾瑪,在數據挖掘中發現,一來颶風某些產品就會脫銷,那么他們就去看颶風按照哪些線路走,沿著颶風路線的那些沃爾瑪超市,就會把相應的商品調高倉儲量。
  在這個時代,因為大數據的存在,人的行為是可以研究的。以前,小數據時代,可以研究個體但不能研究群體,因為只有關于個人的數據。而在大數據時代,人的行為都以數據形式存在。這里面就有很多商機。通過研究消費者習慣,可以找到很多市場商機。就算在企業運營中,優化才能提高效率,減少成本,優化就要基于數據。產品也離不開數據,產品質量控制就是以數據為支持的。大數據最根本的,就是促進經濟的發展,知識時代的特點就是信息和數據的整合產生新的價值。

  問:為什么直到現在,大家才開始談數據的商機?
  涂子沛:
因為直到現在才有那么多數據可供研究。以前,保存數據很貴,現在很便宜;第二,以前收集不到那么多數據,現在每個人在互聯網上的行為都可以記錄下來。現在數據庫就是資產,如果有數據,就能掌握我的用戶。所以麥肯錫說,大數據是下一個創新、競爭、生產力提高的前沿。數據就是一種生產資料。

  問:我們在互聯網上留下那么多蹤跡和數據,誰是數據的擁有者呢?
  涂子沛:
在數據開放運動中,英國提出了一個數據權問題。個人的數據該由個人做主。你在超市購物,你會在那里留下大量消費記錄。英國的做法是,每個消費者登錄網站是可以看到自己的消費記錄的。谷歌在英國也簽了協議,要開放相關的數據。谷歌已經開放了一部分。你的數據是你的,你是有權利看的。那政府的數據更有義務去看了,因為你的數據是拿著納稅人的錢去收集的。這些是公共數據,本來就是公共資產。
  數據開放之后,是面向社會大眾的開放。任何人都可以使用,只要有能力都能創造新的商機。產生的新知識都是由精英壟斷,但現在每個人都可以接觸這些數據,誰都可以做這些事情。

  問:但這只是一種理想,你的消費記錄,你的互聯網記錄,其實已經隨意泄露。
  涂子沛:
信息時代,我個人能不能決定怎么發布數據,什么時候開放,什么時候修改,但現在已經失控了。無論是在美國還是中國,尤其是在中國,隱私權非常薄弱,個人信息被隨意買賣。

  問:個人留下的數據越多,它對你的掌握就越容易。大數據會成為老大哥嗎?
  涂子沛:
大數據是老大哥,這是不可避免的。美國想建中央數據銀行,把每個人從出生到墳墓的記錄整合起來,后來很多組織反對。經過許多博弈,美國政府還是放棄了,但對政府來說,他們很想建立這樣一個“銀行”。

  凡標注來源為“經濟參考報”或“經濟參考網”的所有文字、圖片、音視頻稿件,及電子雜志等數字媒體產品,版權均屬經濟參考報社,未經經濟參考報社書面授權,不得以任何形式刊載、播放。
 
相關新聞:
· 新華讀書“六月十大好書”揭榜 2012-07-09
· 《讀書很好》 2012-07-09
· 牽手"三秦書月青年讀書節" 2012-05-14
· “2012讀書盛典”電視晚會舉辦 2012-05-08
· 世界讀書日 讓讀書成為干部第一愛好 2012-04-23
 
頻道精選:
·[財智]誠信缺失 家樂福超市多種違法手段遭曝光·[財智]歸真堂創業板上市 “活熊取膽”引各界爭議
·[思想]夏斌:人民幣匯率不能一浮了之·[思想]劉宇:轉型,還須變革戶籍制度
·[讀書]《歷史大變局下的中國戰略定位》·[讀書]秦厲:從迷思到真相
 
關于我們 | 版權聲明 | 聯系我們 | 媒體刊例 | 友情鏈接
經濟參考報社版權所有 本站所有新聞內容未經經濟參考報協議授權,禁止轉載使用
新聞線索提供熱線:010-63074375 63072334 報社地址:北京市宣武門西大街57號
Copyright 2000-2010 XINHUANET.com All Rights Reserved.京ICP證010042號
石河子市| 麻栗坡县| 怀柔区| 靖州| 高阳县|