從兩個數(shù)據(jù)看微博活躍度
活躍用戶數(shù)是衡量互聯(lián)網(wǎng)公司價值最重要的標(biāo)準(zhǔn)之一。微博在這幾年的發(fā)展中,其活躍度一直是數(shù)據(jù)研究機構(gòu)的研究對象,最近香港大學(xué)公布了一份關(guān)于微博用戶數(shù)據(jù)的報告,這份報告對微博注冊用戶判定以及后續(xù)媒體的解讀與我們通過微博官方授權(quán)接口抓取的數(shù)據(jù)有比較大的差異。根據(jù)我們的數(shù)據(jù),這份報告至少存在兩處嚴(yán)重的缺陷:
首先,微博自從2年前就不公布注冊用戶數(shù),因為注冊用戶中存在僵尸和垃圾用戶,雖然我們也不能拿到全部信息,但是根據(jù)我們獲得的授權(quán)數(shù)據(jù)測算,微博的總注冊用戶早已超過10億,其中新浪凍結(jié)的垃圾粉就有幾億(新浪凍結(jié)垃圾用戶,但是并不刪除賬號),港大教授用的連續(xù)用戶ID遍歷的抓站方式,會導(dǎo)致抓到的很多是新浪已經(jīng)凍結(jié)(不能登錄,不能發(fā)言)的賬號,但官方數(shù)據(jù)接口會告知我們這些合作伙伴用戶屬性(是真實用戶,還是凍結(jié)用戶,還是實名用戶)——也就是只有官方合作伙伴,才知道哪些用戶是有價值值得分析的用戶哪些不是,也才能進行更科學(xué)的數(shù)據(jù)分析。
其次,香港大學(xué)那份報告公布的原創(chuàng)和轉(zhuǎn)發(fā)用戶的比例是1:20,這個數(shù)據(jù)明顯失準(zhǔn)。根據(jù)我們從官方數(shù)據(jù)接口獲得的數(shù)據(jù)統(tǒng)計,原創(chuàng)和轉(zhuǎn)發(fā)的比例在不同月份會有所不同,但過去半年內(nèi)從來沒有低于1:3。
之所以得出不準(zhǔn)確的結(jié)論,是因為通過抓站獲取的數(shù)據(jù)本身就有問題,首先這些抓站用戶不排垃圾,另外更重要的一點,為了防止抓取核心用戶數(shù)據(jù),對于識別的第三方抓站行為,站方會送一些混淆數(shù)據(jù)出去。因此港大很有可能是他們通過抓站方式獲取的數(shù)據(jù)中,獲取的數(shù)據(jù)從一開始就是不精確的。
博瑞創(chuàng)科通過對微博官方授權(quán)數(shù)據(jù)接口獲得的數(shù)據(jù)進行分析,針對以上兩個數(shù)據(jù)得出了以下結(jié)論。
每月發(fā)布微博用戶人數(shù)約在4500萬—5500萬。2014年3月我們監(jiān)測到的數(shù)據(jù)中,在月活躍用戶中發(fā)布原創(chuàng)微博的用戶比例在35–40%左右,以此折算大約在4500萬–5500萬用戶每月發(fā)布過原創(chuàng)微博。社交平臺的用戶行為通常都遵循“二八定律”,即20%的人產(chǎn)生內(nèi)容,80%的人閱讀、消費信息。即使是Twitter這樣的平臺,其大部分內(nèi)容(75%)也是被5%的活躍用戶產(chǎn)生,從這個數(shù)據(jù)來看,微博的原創(chuàng)用戶比例要遠高于Twitter。3月微博的原創(chuàng)用戶占比明顯高于行業(yè)平均水平,這與馬航事件、文章出軌等熱點事件的刺激不無關(guān)系。
29%的原創(chuàng)用戶發(fā)布的微博被轉(zhuǎn)發(fā)、57%的原創(chuàng)用戶發(fā)布的微博被評論。文章發(fā)表聲明的單條微博互動量超過400萬,大家覺得微博的互動量是很高的,但是數(shù)據(jù)告訴我們并非如此。我們的監(jiān)測結(jié)果表明,只有29%的原創(chuàng)用戶發(fā)布的微博被轉(zhuǎn)發(fā)、57%的原創(chuàng)用戶發(fā)布的微博被評論。與文章的聲明形成強烈一個強大的反差,這說明微博傳播一直存在金字塔效應(yīng),大量的互動都集中在“塔尖”的明星名人、意見領(lǐng)袖,數(shù)量巨大的“塔腰”和“塔基”用戶發(fā)布的微博,互動量與“塔尖”用戶存在比較明顯的差距。這既是微博傳播的優(yōu)勢,同時也是問題。要想進一步提高微博的活躍度,需要為“塔腰”和“塔基”用戶帶來更高的互動量,才能刺激他們發(fā)布高質(zhì)量的原創(chuàng)微博。
我們也注意到,微博也在做出一些改變,正在通過扶植中小V計劃對“塔腰”的用戶做出一系列的扶植計劃,同時推薦機制的形成也將對“塔基”部分的用戶在信息生產(chǎn)和傳播產(chǎn)生催化作用。針對這個話題,我們會過一段時間發(fā)布專門的研究報告。
作為微博官方的數(shù)據(jù)合作伙伴,一些第三方發(fā)布的微博用戶數(shù)據(jù)經(jīng)常會對我們的客戶甚至是整個行業(yè)造成困擾。如上所述,微博一直在對各種抓站行為進行限制,甚至對識別出的抓站行為故意提供錯誤數(shù)據(jù),以便保證數(shù)據(jù)的權(quán)威性并保護合作伙伴的利益。在國外,對網(wǎng)站的數(shù)據(jù)分析也需要首先與官方簽署合作協(xié)議,通過官方提供的數(shù)據(jù)接口獲取數(shù)據(jù),我們看到的關(guān)于twitter、Facebook等社交網(wǎng)站的用戶數(shù)據(jù)信息,都是通過這種方式進行研究得出的。
來源:微博風(fēng)云
原創(chuàng)文章,作者:王琪,如若轉(zhuǎn)載,請注明出處:http://qyysmy.cn/blog/archives/8326