午夜直播免费看-亚洲国产精品日韩av不卡在线-少妇三级全黄-欧美日韩国产一区二区三区,

首頁

下載中心

新聞中心│News center

	行業新聞

	最新公告

最新公告│Announcement

	IT外包首選我們的八大理由...
	中國勞科院與我公司續簽了...
	感謝中成航宇與我們公司續...
	感謝深圳市城市空間規劃建...

詳細內容

當前位置：首頁 >> 新聞中心 >> 詳細內容

詳細內容

我的“大數據“觀：管理、豐富與洞察力

發布時間：2013-01-03 | 點擊次數：1070

　　微軟亞太研發集團首席技術官孫博凱

    去年以來，從硅谷到中關村，從白宮到中國工信部，從《彭博商業周刊》、Business Insider到《商業價值》和新浪科技，“大數據“這個名詞已經成為各界新寵，甚至連以穩重著稱的《紐約時報》都宣稱：“大數據時代”已經來臨！

    或許您有一種“前度劉郎今又來“的感覺？我想是的，正如科技史上每一種新技術出現時，都會或多或少地引發一些泡沫和虛熱，但真正經得起時間考驗的技術與產品，會成為推進文明的原動力，譬如PC、互聯網、云計算。

    大數據時代的到來，意味著在這一領域擁有專長的人士面臨著前所未有的機會。幸運的是，我恰好身處其中。在過去的20年里，大部分時間我都在做與數據相關的技術研發，對于我這樣一個“數據人”來說，這是一個激動人心的時刻，因為數據庫、大數據正成為一場變革的中心，并終將改變世界的運行方式。

    什么是大數據？

    鑒于“大數據”正如當年的“云計算”一樣，還處在眾說紛紜的階段，所以在具體展開之前，有必要先厘清“大數據”的定義。

    在我看來，凡是具有3V特性的數據，就是大數據，即：其一為Volume，極大的數據量；其二為Variety，極復雜的數據類型與數據來源；其三為Velocity，極高的數據產生與流轉速度。以Windows Azure為例，該平臺上的計算使用量在過去6個月中翻了一番，現有計算容量已超過1999年全球服務器計算資源的總和，其上存儲的數據在過去2個月中增加了一倍。

從3個V的角度看，大數據可以說是IT產業發展的必然結果。僅在15年前，我們主要面對的數據還是ERP和CRM系統的結構化數據，其來源是交易、產品銷售、客戶信息等，產生和流轉的速度多以年、月計。

隨著互聯網的興起，數據量開始攀升，同時數據類型也不斷豐富，網頁、文件、日志，非結構化、半結構化數據的存儲技術隨之興起，同時我們看到新的數據平臺、分析和展示工具不斷誕生，對大爆炸的數據進行分析和存儲，其時數據產生與流轉的速度大概以周、日計。

時至今日，來自物聯網（典型如智能設備傳感器網絡、車載傳感器網絡、氣候傳感器網絡、海洋傳感器網絡等、太空傳感器網絡等）、互聯網、移動互聯網、通信網、廣播電視網上的數以百十億計的傳感器與智能終端，能讓人類搜集到前所未有的宇量信號。而云計算成為主流，則讓網絡、計算和存儲資源的潛力得到了充分利用，再加上摩爾定律的持續影響，讓上述設備產生的信號得以被快速地處理為數據，并進行存儲和傳輸。接下來要解決的問題，就是如何通過數據挖掘、數據呈現、數據洞察，利用好其中蘊藏的巨大價值——在這樣的背景下，大數據成為全球熱門話題，自然是水到渠成。

微軟的“大數據”觀

如上所述，大數據中所增加的大多是社交網絡的言論、圖片、視頻等不受控制的內容，以及來自于各類傳感器的不規則信號，這些非關系型數據與傳統數據庫中的關系型數據有本質不同，作為專業的“數據人”，我們正在試圖從這些龐大的“數據寶藏”中獲得知識和洞察力。例如，我們已經開始嘗試通過對社交網絡數據的分析，來量化評估企業或個人的品牌影響力；可以利用實時的交通、天氣信息為每個人優化出行日程與線路；甚至可以幫助分析企業策略，如某種新產品投放市場后，其反響會怎樣，如何優化市場戰略？

在我看來，大數據并不特指某一種具體的技術與產品，而應包括三個層次，分別是：數據管理，即如何獲取、存儲和保護數據；其二是數據豐富，即如何清洗、發現不同數據間的數據相關性；其三是，數據洞察力，即通過分析、呈現與決策工具，獲得洞察力，并最終通過付諸行動，產生價值。

從14年前進入微軟起，我們便開始了類似的研究，當時就有這樣一個愿景：希望建立一個體系，可以讓任何客戶，管理任何種類、任何大小、任何來源的數據。現在我們正逐步實現這個愿景。

作為微軟大數據解決方案的核心基礎，最新版本的SQL Server 2012也已是今非昔比，它已完全成為一個綜合性平臺，可以管理比以前復雜一百倍的數據——關系型數據、空間數據、圖像、數據流以及高性能的數據存儲和獲取，過往可能需要幾個月時間來進行的數據分析，現在只需要幾天。

微軟“大數據”：兼顧簡易、開放與靈活

微軟所提供的大數據平臺，有著對大數據生命周期的全方位考慮，從數據到工具再到最后產生價值，都會納入到微軟的大數據平臺上。這也是為什么我們決定將Hadoop等開源架構，整合到微軟的大數據平臺里，一方面是將Hadoop作為SQL Server一部分進行無縫整合，將其作為對非關系型數據處理的補充；另一方面是將Hadoop作為一個服務，整合到微軟的公有云與私有云平臺里。

對于非技術企業的IT部門而言，Hadoop部署比較復雜，微軟即將正式發布的Hadoop版本則非常強調部署的簡易性，這也是微軟的傳統優勢。同時在Hadoop高性能和高擴展性的基礎上，增強了它的安全性和可靠性，打消了客戶對開源軟件的顧慮。

值得強調的是，微軟不是簡單地將Hadoop遷移到微軟的大數據平臺上，而是真正的融合，會系統地考慮其可用性、可靠性、安全性、部署的簡易性與靈活性，乃至對Hadoop上工具的集成與優化。與此同時，微軟也會堅持開源的原則，將在Hadoop上做的一些研發工作回饋給社區，與社區形成良性互動。

我們期待著，無論是數據科學家，還是商業智能專業人員或是普通的業務分析人員，都可以通過微軟的大數據平臺，去探索關于過去、關于現在、關于未來的奧秘，并得到答案。

編輯：北京信誠IT保姆IT外包部 http:// www.aboverow.cn www.xcit.com.cn

下一篇: 為什么知識產權訴訟高發？
上一篇: 微軟高擎“3E戰略” 大力反盜版和維護消費者權益

友情鏈接
深圳無線覆蓋	廣信鴻業	昊瑞爾科技	及好科技	信諾IT服務	北京IT外包	無線覆蓋	起秀網絡
版權所有：北京信誠眾業科技有限公司　總部：010-62075251　400-698-1290　技術支持：010-62365952 地址：北京市北三環中路2號匯鑫祥源大廈328室　京ICP備09096604-3號

主站蜘蛛池模板：珲春市| 磐石市| 岗巴县| 海宁市| 吉水县| 新乡市| 上犹县| 松溪县| 图们市| 得荣县| 太和县| 靖州| 丽江市| 龙游县| 博客| 德兴市| 库车县| 垦利县| 从化市| 玛沁县| 河北省| 嘉兴市| 临泽县| 久治县| 康乐县| 昌图县| 榆中县| 涿州市| 信宜市| 长岛县| 正蓝旗| 奉新县| 宝鸡市| 门源| 喀喇沁旗| 乌恰县| 武穴市| 师宗县| 宾阳县| 泸水县| 垣曲县|