隨著互聯(lián)網(wǎng)的不斷發(fā)展,大數(shù)據(jù)正在成為一股熱潮,且業(yè)界對(duì)大數(shù)據(jù)的討論已達(dá)到一個(gè)前所未有的高峰。車(chē)聯(lián)網(wǎng)作為移動(dòng)互聯(lián)網(wǎng)大背景下誕生的一個(gè)產(chǎn)物,不管是車(chē)輛的接入、服務(wù)內(nèi)容的選擇還是服務(wù)的精準(zhǔn)性,都離不開(kāi)大數(shù)據(jù)。
車(chē)輛上傳的每一組數(shù)據(jù)都帶有位置信息和時(shí)間,并且很容易形成海量數(shù)據(jù)。一方面,如果說(shuō)大數(shù)據(jù)的特征是完整和混雜,而車(chē)聯(lián)網(wǎng)與車(chē)有關(guān)的大數(shù)據(jù)特征是完整加精準(zhǔn)。如某些與車(chē)輛本身有關(guān)的數(shù)據(jù),都有明確的一個(gè)ID,根據(jù)這個(gè)ID可以關(guān)聯(lián)到相應(yīng)的車(chē)主信息,并且這些信息還是精準(zhǔn)的。另一方面,我們可以看到車(chē)聯(lián)網(wǎng)與駕駛?cè)说南M(fèi)習(xí)慣、興趣愛(ài)好等大數(shù)據(jù)特征是完整和部分精確。因此,研究車(chē)聯(lián)網(wǎng)的大數(shù)據(jù)更有意義。
● 大數(shù)據(jù)的定義和特征
大數(shù)據(jù)(big data),或稱(chēng)巨量資料,指的是所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理、并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。
我們從權(quán)威的定義可以看到,大數(shù)據(jù)的特征有四點(diǎn),分別為:數(shù)據(jù)體量巨大。從TB級(jí)別,躍升到PB級(jí)別;數(shù)據(jù)類(lèi)型繁多。提到的網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等等。價(jià)值密度低,商業(yè)價(jià)值高。以視頻為例,連續(xù)不間斷監(jiān)控過(guò)程中,可能有用的數(shù)據(jù)僅僅有一兩秒。處理速度快。1秒定律。
車(chē)聯(lián)網(wǎng)的大數(shù)據(jù)在預(yù)測(cè)方面可以發(fā)揮到極致。如,預(yù)測(cè)交通堵塞的地段,實(shí)時(shí)交通信息,主動(dòng)安全,公交的排班。駕駛者駕駛行為分析。
大數(shù)據(jù)的核心在于預(yù)測(cè),這在車(chē)聯(lián)網(wǎng)行業(yè)非常有用,例如,對(duì)于交通流量的預(yù)測(cè),就非常需要大數(shù)據(jù)。對(duì)于交通流量,目前我們的仿真系統(tǒng)更加重視交通流量大,擁堵的原因,而大數(shù)據(jù)時(shí)代,不再在乎因果關(guān)系,而重視相關(guān)性,也就是不去分析產(chǎn)生擁堵的原因,但確實(shí)某個(gè)時(shí)段某個(gè)路段會(huì)發(fā)生擁堵。也可以根據(jù)車(chē)聯(lián)網(wǎng)的大數(shù)據(jù)對(duì)車(chē)友的興趣進(jìn)行分析。