什么是大數(shù)據(jù)應(yīng)用并不重要,“啤酒與尿布”的故事屬不屬于大數(shù)據(jù)也不重要,重要的是時下熱炒的大數(shù)據(jù)應(yīng)用能夠給我?guī)硎裁矗袠I(yè)企業(yè)大數(shù)據(jù)應(yīng)用從何著手,換句話說,大數(shù)據(jù)應(yīng)用究竟如何落地。
我認為大數(shù)據(jù)應(yīng)用落地需要想清楚幾個事情:一是大數(shù)據(jù)從何而來,或者說要進行應(yīng)用的大數(shù)據(jù)都包括哪些數(shù)據(jù)?二是采用什么技術(shù)手段或者方法對這些大數(shù)據(jù)進行應(yīng)用?三是大數(shù)據(jù)應(yīng)用預(yù)計會產(chǎn)生哪些價值,對業(yè)務(wù)帶來哪些幫助。把這些問題把握好了,大數(shù)據(jù)應(yīng)用自然就落地了。
在所接觸過的大數(shù)據(jù)應(yīng)用方案中,我認為Splunk大數(shù)據(jù)應(yīng)用是一個比較令人滿意的答案。其他的一些方案要么只提供了一個處理平臺,沒有提供配套的應(yīng)用;要么提供了數(shù)據(jù)處理和挖掘的軟件,但是讓搞不清楚,如此大數(shù)據(jù)應(yīng)用與BI、數(shù)據(jù)挖掘究竟有何不同,“啤酒與尿布”是不是就是大數(shù)據(jù)應(yīng)用。只有Splunk能夠從上述的幾個方面提供一個相對完整的答案。
首先,大數(shù)據(jù)都包括哪些數(shù)據(jù)。對哪些數(shù)據(jù)進行分析處理,在Splunk方案中,需要用戶首先對數(shù)據(jù)來源確認。Splunk給出的參考包括:文件或者文件目錄、syslog、Windows事件日志、Windows注冊表、Windows性能指標(biāo)、Unix/Linux日志和指標(biāo)、文件完整性監(jiān)視、配置文件、OPSEC LEA、Cisco設(shè)備日志、IIS日志、Apache日志、WebSphere日志/指標(biāo)和其他數(shù)據(jù)、以及任何其他數(shù)據(jù)。給我的感覺這些數(shù)據(jù),此前都是系統(tǒng)管理所需要的數(shù)據(jù),多數(shù)都與系統(tǒng)管理相關(guān)。沒有做過系統(tǒng)管理員,不知道系統(tǒng)管理員使用這些數(shù)據(jù),是否注意到這些數(shù)據(jù)所帶來的價值,如今,大數(shù)據(jù)應(yīng)用就是要盤活這些數(shù)據(jù)。
其次,沒有Splunk,這些數(shù)據(jù)都是存在,也在被使用。所不同的是,在Splunk方案中,將這些數(shù)據(jù)集中收集起來,Splunk對這些數(shù)據(jù)提供各種實現(xiàn)在線的查詢,提供了靈活、方面的手段。例如鼠標(biāo)點擊數(shù)據(jù)中的某字符串,就可以實時篩選出大數(shù)據(jù)中與此相關(guān)的數(shù)據(jù)集合。也許這樣的描述過于抽象,其實就是一句話,就是提供了針對大數(shù)據(jù)的查詢,隨時可以了解相關(guān)數(shù)據(jù),并提供了豐富的展示手段。
最后,這種查詢究竟產(chǎn)生了哪些效果。這就要結(jié)合具體應(yīng)用進行說明了。華夏威科是一家提供虛擬化和云計算服務(wù)的軟件公司,也是Splunk公司的合作伙伴。他們將Splunk應(yīng)用在桌面虛擬化應(yīng)用,以往用戶在使用桌面虛擬化過程中,總感覺效果不是很滿意。借助Splunk分析,就找出了應(yīng)用的瓶頸點,對此進行調(diào)整。如今,用戶對于桌面虛擬化效果感覺滿意,并很快實施了第二階段采購。另外一個案例來自精誠所服務(wù)的電信運營商,他們使用Splunk對于網(wǎng)絡(luò)流量的用戶行為進行分析,例如分析有哪些用戶在使用騰訊微信,研究微信究竟對語音產(chǎn)生了多少分流,帶來了多大損失。據(jù)精誠中國區(qū)事業(yè)發(fā)展部總監(jiān)張文獻介紹,Splunk對網(wǎng)絡(luò)流量的分析與以往有所不同,以往流量分析只是了解性能瓶頸點,并不對流量所代表的行為進行分析。實際上,借助Splunk分析,運營商就可以清楚了解新的電信業(yè)務(wù),例如各種套餐,其用戶的實時接納程度。
銀行也是Splunk用戶。據(jù)Netis(上海天旦網(wǎng)絡(luò))介紹,銀行用Splunk對網(wǎng)上銀行進行分析,例如對網(wǎng)銀響應(yīng)時間進行分析。以往手段也可以掌握相應(yīng)時段的響應(yīng)時間,但要對整個過程進行分析,如果響應(yīng)時間長,問題究竟是出現(xiàn)在數(shù)據(jù)庫、中間件,還是應(yīng)用服務(wù)器?還是出現(xiàn)在網(wǎng)絡(luò)、存儲的響應(yīng)環(huán)節(jié),通過大數(shù)據(jù)分析,找出問題,提供用戶滿意度。張文獻指出,BI和數(shù)據(jù)挖掘更多是基于成功交易所獲得的數(shù)據(jù),“啤酒與尿布”即是如此。但他們無法實現(xiàn)實時分析,也沒有辦法針對不成功、半途放棄的用戶數(shù)據(jù)進行分析。大數(shù)據(jù)應(yīng)用恰恰彌補了以往的不足。
如此看來,既然分析什么、怎么分析、有什么效果,這些問題解決了,大數(shù)據(jù)應(yīng)用落地也就簡單了,管他定義是什么,只要這個東西有用,就足矣了。
![]() |
戶外廣告機 |
落地式廣告機 |
高清廣告機 |
分屏廣告機 |
藍牙廣告機 |
網(wǎng)絡(luò)廣告機 |
數(shù)字標(biāo)牌播放器 |
廣告機方案 |
多媒體信息發(fā)布系統(tǒng) |
觸控一體機 |
高清機頂盒 鏡面廣告機 | 多媒體廣告機 | 觸摸廣告機 | 網(wǎng)絡(luò)廣告機 | 液晶廣告機 | 車載廣告機 | 互動式廣告載體 | 樓宇廣告機 | 流媒體實時發(fā)布系統(tǒng) | 廣告機外殼 | 戶外大屏幕 廣告機報價 | 數(shù)字標(biāo)牌軟件 | 電子看板 | 商業(yè)顯示 | 嵌入式主板 | 觸控一體機 | 數(shù)字標(biāo)牌顯示器 | 嵌入式流媒體服務(wù)器 立式廣告機 | |