虎嗅注:本周比較大的、有爭(zhēng)議的一個(gè)話題是Uber被微信“系統(tǒng)抖動(dòng)”了,并且官方也聲明這次抖動(dòng)一抖就是三個(gè)月。但是何為“系統(tǒng)抖動(dòng)”迄今沒(méi)有一個(gè)確切的定義和解釋。盡管騰訊微信團(tuán)隊(duì)表示在解決,但是此事甚有蹊蹺,本著不惡意揣測(cè)、不可以相信的態(tài)度,我們來(lái)看看這篇《誰(shuí)抖動(dòng)了微信的系統(tǒng)》一文,本文系轉(zhuǎn)載自微信公眾號(hào):歪理邪說(shuō)。
這幾天最有趣的消息莫過(guò)于Uber相關(guān)關(guān)鍵字被微信屏蔽的事。騰訊的回應(yīng)說(shuō)“系統(tǒng)抖動(dòng)”造成的這次屏蔽,結(jié)果引起了更多爭(zhēng)議,有人表示相信,有人表示不信。馮大輝在小道消息里面說(shuō)他相信這個(gè)解釋,而我,則是半信半疑,我相信這件事一定有技術(shù)因素,但我同樣相信背后有非技術(shù)因素影響,故為半信。
虎嗅有一篇文章大概是從百度百科抄來(lái)一個(gè)“系統(tǒng)抖動(dòng)”定義,那個(gè)解釋跟這件事完全沒(méi)關(guān)系。所以,我們先猜測(cè)下系統(tǒng)抖動(dòng)到底是什么,會(huì)造成什么影響。
在互聯(lián)網(wǎng)以及計(jì)算機(jī)行業(yè),系統(tǒng)抖動(dòng)本來(lái)也不是一個(gè)嚴(yán)謹(jǐn)?shù)墓こ堂~,不同的系統(tǒng)設(shè)計(jì)和架構(gòu),會(huì)出現(xiàn)完全不同的狀況。如果非要概括一下,微信所指的應(yīng)該是指因?yàn)榉植际较到y(tǒng)數(shù)據(jù)同步的差異,從而造成的系統(tǒng)表現(xiàn)出來(lái)的不一致?tīng)顟B(tài)。中國(guó)用戶比較容易體會(huì)到類似的系統(tǒng)抖動(dòng),大概有兩個(gè)案例,其一是所謂的Google Dance,就是在Google上時(shí)而搜不到一個(gè)網(wǎng)站,過(guò)幾天又可以搜到了。這是因?yàn)镚oogle在更新巨大的網(wǎng)頁(yè)索引庫(kù)的時(shí)候,不同節(jié)點(diǎn)的索引版本不一樣,導(dǎo)致排序算法暫時(shí)混亂。而過(guò)了一段時(shí)間,數(shù)據(jù)同步了,自然也就好了。如果你從來(lái)沒(méi)注意過(guò)這件事,可能是因?yàn)樵谥袊?guó)一會(huì)能訪問(wèn)Google,一會(huì)又不能訪問(wèn)。這就是其二,偉大的GFW系統(tǒng)封網(wǎng)站的時(shí)候出現(xiàn)了類似問(wèn)題,大多數(shù)情況下會(huì)封掉Google,但某些時(shí)候因?yàn)閿?shù)據(jù)同步和更新的問(wèn)題,又導(dǎo)致Google被解封,用戶就感覺(jué)偶爾能訪問(wèn)一下,但大部分時(shí)間不行。
這兩個(gè)例子說(shuō)明這類技術(shù)問(wèn)題確實(shí)很常見(jiàn),最終用戶也很容易會(huì)感知到它的存在。但這種技術(shù)問(wèn)題的特征應(yīng)該是偶然發(fā)生,持續(xù)時(shí)間不長(zhǎng),并且分布平均。比如Google Dance不可能只針對(duì)一個(gè)網(wǎng)站出現(xiàn),而是機(jī)會(huì)平均被各種網(wǎng)站遇到,如果每次都是騰訊域名下所以頁(yè)面都搜索不到,那就不是系統(tǒng)抖動(dòng)了。而GFW抖動(dòng)造成被封網(wǎng)站突然能用,也不僅僅限于Google,其他網(wǎng)站,比如Facebook、Twitter也時(shí)而會(huì)出現(xiàn)突然能訪問(wèn)的狀況,如果這些都不熟悉,順便說(shuō)一聲,著名的1024網(wǎng)今天突然能訪問(wèn)了…按照這個(gè)特征對(duì)照一下Uber遇到的情況,就會(huì)覺(jué)得這不是常規(guī)意義的“系統(tǒng)抖動(dòng)“。
我自己寫(xiě)不少Uber相關(guān)的文章,對(duì)Uber非常關(guān)注,微信上也有不少在Uber工作的朋友。時(shí)而會(huì)遇到他們說(shuō)自己的官方帳號(hào)不能訪問(wèn)了,或者貼個(gè)圖問(wèn)大家能不能看到。對(duì)Uber的屏蔽一直是逐步升級(jí)的,而且也確實(shí)持續(xù)了三個(gè)月。系統(tǒng)如何抖動(dòng),和架構(gòu)設(shè)計(jì)和原理有很大關(guān)系,但既然叫做抖動(dòng)了,它必須得是在抖才合理。想想抖動(dòng)這個(gè)詞在現(xiàn)實(shí)世界本來(lái)的含義是什么?抖,應(yīng)該是忽然向上、忽然向下,一會(huì)兒正常、一會(huì)兒不正常,這樣才叫抖。Uber是持續(xù)遇到問(wèn)題,一邊倒,這怎么能叫做抖呢?我覺(jué)得叫做“系統(tǒng)傾翻”更符合這種一邊倒情況。
微信的反垃圾攔截系統(tǒng)具體設(shè)計(jì)和算法不得而知,但所有反垃圾系統(tǒng)使用的數(shù)學(xué)方法萬(wàn)變不離其宗。它肯定是一種基于概率的過(guò)濾器算法。我并不打算在這解釋數(shù)學(xué)原理,霍金說(shuō):“一本書(shū)中多一個(gè)數(shù)學(xué)公式就會(huì)減少一半讀者”,所以我就一個(gè)公式也不寫(xiě),只解釋一下大致原理。
以比較常用的貝葉斯過(guò)濾器當(dāng)例子,貝葉斯概率是從一個(gè)主觀假設(shè)開(kāi)始,通過(guò)逐漸補(bǔ)充的數(shù)據(jù)計(jì)算來(lái)修正最初假設(shè)的過(guò)程。在這個(gè)過(guò)程中,主觀假設(shè)是可以隨便設(shè)置的,比如:假設(shè)公眾帳號(hào)發(fā)表的文章中,有30%是違反規(guī)則的垃圾文章。然后用事實(shí)去修正它。所謂修正,就是持續(xù)告訴系統(tǒng)這一篇不是垃圾,那一篇是垃圾的過(guò)程。在這個(gè)模式里面,最早的猜想叫做先驗(yàn)概率,通過(guò)一系列的事實(shí)修正,最終得到的結(jié)果叫做后驗(yàn)概率,后驗(yàn)概率就可以用來(lái)判斷一篇文章是不是違規(guī)了。實(shí)際應(yīng)用系統(tǒng)會(huì)比這個(gè)復(fù)雜的多,但原理應(yīng)該差不多,總是根據(jù)一個(gè)假設(shè)和事實(shí)修正逐漸接近事實(shí)情況的優(yōu)化過(guò)程。在這個(gè)過(guò)程中,四處是可以調(diào)整的參數(shù),并且會(huì)直接影響最終效果。在這類系統(tǒng)中,如果不是專門(mén)為Uber調(diào)整了某些參數(shù),我實(shí)在沒(méi)法從技術(shù)角度理解這種所謂的系統(tǒng)抖動(dòng)是如何發(fā)生的。
退一步說(shuō),就算真是系統(tǒng)自發(fā)的錯(cuò)誤行為,相關(guān)團(tuán)隊(duì)也應(yīng)該早就應(yīng)該通過(guò)優(yōu)化的方式解決這一問(wèn)題,而不至于等到大眾媒體都開(kāi)始關(guān)注才發(fā)現(xiàn)。就說(shuō)誘導(dǎo)分享這件事,整個(gè)微信世界還有比滴滴紅包更頻繁,更廣泛的誘導(dǎo)分享嗎?恐怕找不出第二個(gè)案例來(lái)。但滴滴這樣做就是沒(méi)事,這如果也不是人工優(yōu)化參數(shù)的結(jié)果,我只能認(rèn)為騰訊已經(jīng)孕育出了超越人類智能的人工智能了。據(jù)Uber的官方說(shuō)明,他們此前已經(jīng)多次和騰訊聯(lián)系試圖解決問(wèn)題,結(jié)果就是解決不了。另外一方面,Uber中國(guó)團(tuán)隊(duì)也有不少曾經(jīng)在騰訊工作過(guò)的人。無(wú)論是私下渠道還是公開(kāi)渠道,騰訊應(yīng)該都不會(huì)是這幾天才知道這件事存在吧。這些情況放在一起,就更不是單一技術(shù)問(wèn)題能夠解釋的。
另外,我時(shí)而會(huì)舉報(bào)一些確實(shí)是”誘導(dǎo)分享“的文章,以試圖測(cè)試微信的行為模式。不過(guò)到目前為止無(wú)一成功,都被系統(tǒng)回復(fù)了舉報(bào)失敗。可見(jiàn)這個(gè)誘導(dǎo)分享的判斷門(mén)檻并不低,對(duì)比前一段常見(jiàn)的Uber相關(guān)文章被“多人舉報(bào)”的情況,我不禁對(duì)這位”多人“同學(xué)非常佩服,一舉報(bào)一個(gè)準(zhǔn)。我時(shí)而感嘆世界上最強(qiáng)大的情報(bào)機(jī)關(guān)中,中國(guó)擁有兩個(gè),一個(gè)是”多人“,一個(gè)是”朝陽(yáng)群眾“。
我的“半信半疑“的半疑就來(lái)源于此。到現(xiàn)在為止,技術(shù)上的解釋沒(méi)法讓我相信。當(dāng)然了,技術(shù)上的解釋合理不合理并不重要,從阿里到騰訊,技術(shù)在關(guān)鍵時(shí)刻總是被拿出來(lái)“獨(dú)擋一面“,重要的是將來(lái)會(huì)怎么樣。
所以所謂半信,除了相信存在一些技術(shù)因素,即,確實(shí)和算法有一些關(guān)系,而不是直接屏蔽一個(gè)關(guān)鍵詞之外。我更愿意相信微信把事情做好的愿望。在中國(guó)普遍的職權(quán)不分的情況下,微信能回應(yīng)此事,并且確實(shí)在解決,已經(jīng)不容易了。
對(duì)于未來(lái)我就保持一個(gè)半信的態(tài)度。對(duì)于大企業(yè)內(nèi)部利益的平衡方式,是中國(guó)企業(yè)和美國(guó)企業(yè)最大的區(qū)別,當(dāng)然也可以認(rèn)為是中國(guó)社會(huì)和美國(guó)社會(huì)最大的區(qū)別。每次大家說(shuō)起來(lái)Google的某些團(tuán)隊(duì)竟然要招聘SEO(搜索引擎優(yōu)化)人員,就覺(jué)得是個(gè)笑話,但這恰恰說(shuō)明了Google內(nèi)部有防火墻,可以隔絕各部門(mén)利益。這是成為一個(gè)公平平臺(tái)的關(guān)鍵。這種公平,正是平臺(tái)型公司獲得信賴的關(guān)鍵。在中國(guó),恐怕還沒(méi)有哪家互聯(lián)網(wǎng)公司能做好這件事。
另外,這件事由Uber引發(fā)并不奇怪。Uber是罕見(jiàn)的大規(guī)模沖擊現(xiàn)實(shí)世界的公司,在之前,互聯(lián)網(wǎng)公司里面只有電商企業(yè)真正沖擊了現(xiàn)實(shí)世界。別說(shuō)騰訊這樣一家企業(yè),就算是各國(guó)政府不也正在Uber引發(fā)的浪潮中顛三倒四,做出各種怪事來(lái)嗎?
這里再順便說(shuō)一個(gè)這幾天發(fā)生的好玩事。此前我寫(xiě)過(guò)我們這個(gè)加拿大城市發(fā)生的Uber和市政府對(duì)抗的故事,最近這故事又有了新升級(jí)。本市出租車(chē)聯(lián)盟主席責(zé)怪市長(zhǎng),說(shuō)應(yīng)該讓警方來(lái)按照《安省高速法案》嚴(yán)格執(zhí)法,打擊Uber。我們的市長(zhǎng)竟然真的致電警方,要求警方嚴(yán)格執(zhí)法。對(duì)于一個(gè)三權(quán)分立的國(guó)家,這簡(jiǎn)直是天大的笑話。市民簡(jiǎn)直被震驚了,人們紛紛評(píng)論說(shuō)市長(zhǎng)你是Peace offer,有什么權(quán)利去要求Police Offer按照你的要求執(zhí)法啊?果不其然,幾天之后警方發(fā)言人得體的回復(fù):“夏天是我們最忙的時(shí)候,我們最重要的職責(zé)是保護(hù)市民安全,打擊犯罪,保證交通暢通,其他不重要事務(wù)暫時(shí)沒(méi)人手專門(mén)處理?!?/p>
一個(gè)三權(quán)分立了上百年的國(guó)家,其首都都被攪和到這樣顛三倒四,恨不得和中國(guó)一樣設(shè)立政法委組織聯(lián)合辦公,騰訊做為一家公司稍微有點(diǎn)混亂也不算什么奇怪的事。
對(duì)于Uber這樣一家公司,并不需要給予他們特別的同情,只要給他們不要太不公平的環(huán)境即可。必須要說(shuō),微信在維護(hù)秩序和尊重用戶方面,做的已經(jīng)比其他中國(guó)互聯(lián)網(wǎng)公司好很多了,希望如這樣的抖動(dòng)只是偶然現(xiàn)象。畢竟,用戶還是需要Uber的,這是強(qiáng)大而真實(shí)的需求,任何阻力都很難阻擋它。
順便求(微信)不要把這篇文章也抖沒(méi)了…
晉城龍鼎 - 晉城網(wǎng)站建設(shè)為您解答!