微信里的海量?jī)?nèi)容不會(huì)只在小范圍內(nèi)傳播了,它們都可以在搜狗的微信搜索中找到。是什么決定我們?cè)谒阉魅肟诳吹降膬?nèi)容,這背后有著怎樣的產(chǎn)品邏輯與思考?
微博微信Twitter大家可能會(huì)經(jīng)歷這樣一個(gè)情況,在朋友圈里看到了一篇非常好的文章,當(dāng)時(shí)沒有點(diǎn)收藏,幾個(gè)月之后突然要找那篇文章,翻了很多朋友圈的文章沒有找到。搜狗的微信搜索就是圍繞用戶的這一痛點(diǎn)而建立的搜索平臺(tái)。
用戶需求產(chǎn)生的意義
什么是微信搜索?它既不是搜索微信好友,也不是去搜索朋友圈內(nèi)容的,它主要搜索的是微信公眾帳號(hào)以及公眾帳號(hào)的文章。包括 PC 端和無線端兩個(gè)終端的服務(wù)。
目前搜狗的微信搜索主要提供了公眾號(hào)搜索和文章搜索兩個(gè)功能。在 PC 端搜索上,搜狗搜索為用戶提供了掃碼一鍵關(guān)注的功能。公眾帳號(hào)最近發(fā)表的文章也會(huì)展示在搜索結(jié)果頁上。
當(dāng)用戶點(diǎn)擊這個(gè)公眾帳號(hào)之后,會(huì)進(jìn)入到公眾帳號(hào)的詳情頁,其中除了會(huì)把公眾帳號(hào)認(rèn)證的信息、簡(jiǎn)介的信息呈現(xiàn)之外,還會(huì)把公眾帳號(hào)所有歷史上發(fā)布的文章展示出來。
文章搜索就會(huì)更加簡(jiǎn)單一些,跟網(wǎng)頁搜索和新聞搜索的展現(xiàn)樣式是比較類似的。
在微信公眾號(hào)里,不乏對(duì)各個(gè)專業(yè)、行業(yè),比較專業(yè)的意見領(lǐng)袖或者自媒體人士,使得這些文章會(huì)有很深刻的解讀性和理解。這些對(duì)用戶而言,用戶可以從中獲得更廣泛、更深度、更有觀點(diǎn)性的內(nèi)容。
反過來,搜狗微信搜索對(duì)微信而言,也有一定的意義。首先,搜狗微信搜索的上線,其實(shí)是使微信公眾平臺(tái)從一個(gè)半封閉的生態(tài)圈轉(zhuǎn)向了開放。這意味著意味著微信公眾帳號(hào)以及微信文章的曝光量獲得了極大的提升。
搜狗微信搜索同樣為公眾帳號(hào)打擊盜版、保護(hù)原創(chuàng)提供了一個(gè)工具。由于搜狗平臺(tái)的存在,盜版內(nèi)容的生產(chǎn)者,也不會(huì)再那么明目張膽的抄襲了。
搜索背后的排序
其實(shí)搜索引擎的排序,無非跟相關(guān)性、時(shí)效性、權(quán)威性等等因素相關(guān),公眾帳號(hào)的排序具有搜索引擎網(wǎng)頁通用的指標(biāo),但它也有自己鮮明的特點(diǎn)。
公眾賬號(hào)的排序
首先我們考慮的是文本的相關(guān)性,在公眾號(hào)搜索里面,如果公眾帳號(hào)的名稱和用戶搜索的內(nèi)容精準(zhǔn)匹配我們會(huì)考慮往前排。
同時(shí)我們也會(huì)考慮權(quán)威性,搜狗的微信搜索中認(rèn)證過的帳號(hào)排序肯定會(huì)排在非認(rèn)證帳號(hào)之前。
除了上面兩點(diǎn)之外,還需要考慮一些熱門性的因素,包括公眾號(hào)的粉絲數(shù),公眾帳號(hào)發(fā)表文章的閱讀量、轉(zhuǎn)發(fā)率,這些因素從一定程度上能夠反映出來,這個(gè)公眾帳號(hào)受關(guān)注的程度,以及它的活躍度。上面這些是說,我們目前為止在線上可能用到的一些公眾帳號(hào)排序因素。
后續(xù)我們會(huì)考慮增加另外一些因素,來優(yōu)化排序效果。包括,我們會(huì)計(jì)算這個(gè)公眾帳號(hào)的分類和發(fā)表文章的分類是否對(duì)應(yīng)。再往后,也不排除我們會(huì)針對(duì)不同類別的查詢給出不同排序的策略。
公眾賬號(hào)的顯示
對(duì)于公眾帳號(hào)的搜索結(jié)果在網(wǎng)頁搜索結(jié)果里展示,首先要判斷用戶的查詢是否需要展示公眾號(hào)的結(jié)果,這就涉及到用戶查詢意圖的分析。
然后我們會(huì)根據(jù)微信公眾號(hào)結(jié)果返回的認(rèn)證號(hào)數(shù)目以及精準(zhǔn)匹配的數(shù)量,去確定我們以哪種形式展現(xiàn),是展現(xiàn)多條還是展現(xiàn)單條結(jié)果。確定了如何展現(xiàn)之后,接下來就是展現(xiàn)位置。
首先還是要分析用戶的查詢意圖,看用戶的需求是找一個(gè)機(jī)構(gòu)還是找一個(gè)名人,還是說我其實(shí)是一個(gè)泛類別的需求。
同時(shí),我們也會(huì)參考微信返回的搜索結(jié)果效果,看一下返回結(jié)果里認(rèn)證帳號(hào)的數(shù)目,精準(zhǔn)匹配的數(shù)目,文本的相關(guān)程度等等。網(wǎng)頁搜索里面其它搜索結(jié)果的排序,也會(huì)對(duì)我們公眾號(hào)的排序起到一定的影響作用。
綜合以上這些因素,我們最終確定了一個(gè)公眾帳號(hào)在網(wǎng)頁搜索里初始排序的位置,后續(xù)它還會(huì)參與網(wǎng)頁搜索點(diǎn)擊調(diào)權(quán)的情況。
文章搜索的排序
文章搜索排序,它更類似于搜索引擎網(wǎng)頁搜索的排序。包括我們之前提到的相關(guān)性、權(quán)威性、時(shí)效性、熱門性這些緯度的指標(biāo)。在文章排序里面,會(huì)有一個(gè)指標(biāo)是比較重要的,或者說反映了我們對(duì)微信運(yùn)營(yíng)者尊重的,那就是原創(chuàng)性。
我們目前做這種原創(chuàng)性識(shí)別還是比較簡(jiǎn)單的方式,微信的文章里面會(huì)有這么兩類文章:一類是以文本為主的,對(duì)于這一類文章我們首先會(huì)基于這樣的文章做文章特征的抽取,根據(jù)抽取文章特征做相似度的判斷,然后我們會(huì)把相似度高的文章進(jìn)行聚類,然后去尋找里面發(fā)表時(shí)間最早的那篇。
我們知道,在微信里面并不是都是這種文本的文章,還可以看到這種圖片為主的文章,這類文章文本的信息量非常少,有的可能只是純圖片的,還有很多都是 Gif 圖。
這種情況該怎么解決呢?其實(shí)開始之前的短片里面也介紹了搜狗識(shí)圖技術(shù),那么在這里也會(huì)引入搜狗識(shí)圖搜索圖片的相似度,判斷兩篇文章是否是相似的或者是否是重復(fù)的。
其實(shí),我們線上對(duì)原創(chuàng)的識(shí)別做的還不是很理想,但是原創(chuàng)識(shí)別這塊工作一定會(huì)作為我們未來非常非常重點(diǎn)的工作來開展。其實(shí)不僅僅是原創(chuàng)識(shí)別,文章和公眾帳號(hào)排序的效果,還有待我們持續(xù)的優(yōu)化。
除了這些基礎(chǔ)的搜索品質(zhì)優(yōu)化和改善之外,我們也會(huì)思考,搜狗的微信搜索對(duì)于用戶而言,對(duì)于微信的公眾帳號(hào)或公眾平臺(tái)而言,它的作用到底是什么呢?是不是就是我之前提到的那幾點(diǎn)呢?
用戶希望搜索到什么
對(duì)于公眾帳號(hào)而言,用戶最在意的指標(biāo),無非就是粉絲數(shù)、閱讀量、轉(zhuǎn)發(fā)數(shù)這些很 Kpi 的指標(biāo),其實(shí)這些指標(biāo)說到底就是一個(gè)公眾帳號(hào)的影響力。另外,微信公眾帳號(hào)的運(yùn)營(yíng),需要很好的推廣平臺(tái)。
在真實(shí)的微信搜索里,用戶的真實(shí)需求是什么呢?我們發(fā)現(xiàn),以下三類查詢會(huì)比較突出:首先第一類是和時(shí)令相關(guān)的,像中秋啊、開學(xué)啊、教師節(jié)啊、九月啊、秋季養(yǎng)生這些搜索比例比較高。第二類是和用戶興趣比較相關(guān)的,攝影啊、旅游啊、裝修啊,里面還隱藏著一類有商業(yè)價(jià)值的查詢,這個(gè)量也比較大。
未來,微信搜索的方向,可能會(huì)分成對(duì)用戶和對(duì)微信公眾號(hào)和公眾平臺(tái)兩個(gè)緯度來說。
首先對(duì)用戶,我們會(huì)從這樣基礎(chǔ)體驗(yàn),核心價(jià)值和脫離搜索本身的其他服務(wù)展開。
對(duì)于公眾帳號(hào)也是 3 個(gè)方向:除了基礎(chǔ)體驗(yàn),不斷提升公眾帳號(hào)的影響力,還包括為微信運(yùn)營(yíng)者提供服務(wù)平臺(tái),來幫助這些運(yùn)營(yíng)者更好的做微信公眾帳號(hào)的運(yùn)營(yíng),提升自己品牌的影響力。
本文演講者 韓異凡(搜狗搜索事業(yè)部產(chǎn)品總監(jiān))、整理者 lydiaxin