審查互聯網行業數據造假,還互聯網行業一片晴空
發布時間:2019-08-06 來源:原數據
信息化時代,新(xīn)的科(kē)技(jì )給人們帶來便利的同時,信息紛繁複雜,也存在一些不良現象,良莠不齊,魚目混珠,甚至造假手段更是層出不窮,手段五花(huā)八門,面對反造假,更是道高一尺魔高一丈。
原數據團隊主要面向投資機構和監管機構提供信息數據盡職調查服務(wù),針對互聯網行業普遍存在的數據造假現象,究其原因,拆其伎倆,防止各投資機構中(zhōng)招。
一、 數據造假的利益鏈
天下熙熙皆為(wèi)利來,天下攘攘皆為(wèi)利往。任何經濟行為(wèi),背後都有(yǒu)利益邏輯在。對于互聯網産(chǎn)品,我們可(kě)以從投資方、運營方、用(yòng)戶三方,分(fēn)析各自的利益,你會發現,數據造假之所能(néng)存在,是有(yǒu)利益鏈條在裏邊的。而且在不同時期,各方追求的利益關系不同,甚至會從對立變為(wèi)統一。
在運營方融資前,為(wèi)了吸引用(yòng)戶來關注、注冊和使用(yòng)産(chǎn)品或平台,通常會采用(yòng),注冊、邀請獎勵、贈送會員、優惠券等手段,這其實是一種買粉的形式。甚至為(wèi)了順利拿(ná)到較多(duō)融資,也會常用(yòng)一些非常手段,比如,自動用(yòng)戶注冊,自動評論等軟件添加虛假數據,給投資方一種用(yòng)戶多(duō)而或活躍的感覺,從而提高企業估值。
還有(yǒu)為(wèi)用(yòng)戶引流的一些廣告服務(wù)商(shāng),按流量收費,也會存在虛假點擊的現象,給廣告投放用(yòng)戶帶來經濟損失,這是直接傷害用(yòng)戶的欺詐行為(wèi)。
因此,在投資或并購(gòu)過程中(zhōng),作(zuò)為(wèi)投資機構,如果隻是查看運營方的提供的數據和報表,難免陷入“誤區(qū)”,尋求專業的數據盡職調查團隊的幫助,是至關重要的。
二、 數據造假的方式手段
互聯網經濟是眼球經濟,用(yòng)戶為(wèi)王,這也是為(wèi)什麽很(hěn)多(duō)新(xīn)創公(gōng)司,不惜燒錢,用(yòng)免費、優惠手段,來吸引用(yòng)戶。從用(yòng)戶活躍度角度,包括用(yòng)戶量、用(yòng)戶活動量(點擊量、閱讀量、發帖量、回複量)、用(yòng)戶價值(充值、訂單量、訂單額)等運營KPI。不惜一切代價來提高這些數據的原因隻有(yǒu)一個:吸引投資機構,并給予較好的估值和條件
除了因為(wèi)注冊、邀請獎勵,等帶來的一些新(xīn)用(yòng)戶,經過一段時間自然形成的僵屍用(yòng)戶,更多(duō)大量虛假的僵屍用(yòng)戶,是由自動化注冊軟件帶來的,用(yòng)戶信息是按照一定的規則,随機組合生成,再短時間内快速插入,成本極低。技(jì )術手段較高的,可(kě)能(néng)會使用(yòng)動态ip、設置時間間隔來注冊,以掩人耳目。甚至,有(yǒu)些軟件推廣者,通過插件的方式在,用(yòng)戶不注意的情況下,在用(yòng)戶電(diàn)腦上默認勾選,自動安(ān)裝(zhuāng),不是木(mù)馬也算流氓軟件。
直銷電(diàn)商(shāng)運營者也通過刷單、退貨(或返現),充值、退錢,充斥着虛假的訂單和評論。在電(diàn)商(shāng)平台運營早期,平台為(wèi)了吸引商(shāng)家入駐,不收取平台服務(wù)費和銷售額的分(fēn)成,有(yǒu)些商(shāng)家為(wèi)了周轉資金,創建虛假訂單,用(yòng)信用(yòng)卡支付套現。電(diàn)商(shāng)消費,信用(yòng)卡支付占據了最高的比例,即使很(hěn)小(xiǎo)套現比例,總量也是不小(xiǎo)。
在2018 年“馬蜂窩事件”中(zhōng),備受質(zhì)疑的一個數據造假“套路”是,不少用(yòng)戶在其他(tā)平台的旅行攻略、點評内容,通過爬蟲程序,被搬運到馬蜂窩上。實際上,此類做法并不新(xīn)鮮。生活社區(qū)小(xiǎo)紅書通過官方微博指責大衆點評大量抄襲其用(yòng)戶的内容。具(jù)體(tǐ)做法是批量建立虛假賬号,抄襲及搬運用(yòng)戶在小(xiǎo)紅書發布的原創内容。據小(xiǎo)紅書估計,抄襲的數量在百萬條量級。
2015年,有(yǒu)業内技(jì )術人員在知名(míng)社區(qū)“知乎”上爆料,通過反向編譯蜻蜓FM安(ān)卓版本軟件,他(tā)發現蜻蜓FM軟件中(zhōng)隐藏有(yǒu)名(míng)為(wèi)“普羅米修斯”和“宙斯”的強行自啓代碼。前者可(kě)以在用(yòng)戶不知情的情況下,在手機後台啓動無窗口透明界面,後者則可(kě)以自主觸發廣告商(shāng)的廣告,并回傳給第三方數據公(gōng)司,從而完成“用(yòng)戶自主點擊廣告”的操作(zuò)。
因為(wèi)安(ān)卓系統的開放性,破解系統權限後,一台平闆電(diàn)腦設備上甚至可(kě)以裝(zhuāng)十多(duō)個同樣的App,配合不需實名(míng)制的虛拟運營商(shāng)電(diàn)話卡,可(kě)以形成十多(duō)個看似真實、獨立,實則批量化虛假的用(yòng)戶。而且,由于虛拟運營商(shāng)的手機号可(kě)以包月使用(yòng),這樣的造假手法成本得以進一步降低。
三、 數據造假的分(fēn)析和判讀
如果你關注互聯網行業的投資機會,你很(hěn)可(kě)能(néng)對此深惡痛絕但束手無策。原數據團隊分(fēn)享以下幾點數據造假判别方法,希望能(néng)對你有(yǒu)所幫助。
首要的是,我們要建立綜合考察互聯網公(gōng)司的運營指标體(tǐ)系,不能(néng)隻用(yòng)單一的指标來衡量。比如,從用(yòng)戶量,我們不能(néng)隻重視用(yòng)戶量,還要分(fēn)析活躍用(yòng)戶、高價值用(yòng)戶比例。從現金價值角度,不能(néng)隻看訂單金額,還要關注單用(yòng)戶消費額,看是否超出數值常理(lǐ)範圍,營業額也可(kě)以結合第三方支付平台和稅收來驗證。
其次,我們不能(néng)隻關注數據結果,還要審查追蹤數據。比如,現有(yǒu)用(yòng)戶量,用(yòng)了多(duō)久發展起來的,快速增長(cháng)期的速度如何。充值類賬戶,是否有(yǒu)大量退款現象。商(shāng)品消費類訂單,物(wù)流信息是否都真實存在。
具(jù)體(tǐ)從技(jì )術層面,作(zuò)為(wèi)投資機構,可(kě)以要求取得目标公(gōng)司的一定數據權限,通過數據庫的安(ān)裝(zhuāng)、運行、數據日志(zhì)上的信息,可(kě)以初步确定數據庫是否異常改動現象。對用(yòng)于用(yòng)戶注冊信息,我們可(kě)以通過分(fēn)析是否存在注冊ip集中(zhōng)、注冊時間集中(zhōng),賬号、賬戶名(míng)(昵稱)存在異常,是否存在大量注冊虛拟手機号,ip和手機号地域信息不匹配的情況。訂單、充值附近時間是否有(yǒu)登陸、浏覽記錄等。
基于以上三點,雖然能(néng)夠判别出一些造假信息,但是需要專業數據盡調團隊撰寫多(duō)種算法和模型,進行驗證,才能(néng)給出相對準确的結論。
要杜絕解決互聯網行業數據造假現象,需要行業從業者、投資機構、用(yòng)戶、市場監管機構等多(duō)方共同努力,從轉變觀念開始,建立誠信為(wèi)本、健康可(kě)持續的發展觀,相關部門也會制訂出台相應的法規,并推行如區(qū)塊鏈、第三方數字認證等防數據篡改技(jì )術應用(yòng),相信未來會形成健康的互聯網産(chǎn)業環境。(原數據團隊,微信Robot_Volke)