鬼腳七曾說過,淘寶搜索引擎主要的目的是為了方便用戶搜索,現在的用戶搜索越來越個性化,所以淘寶流量的分配也越來越分散,下面我們就來看看鬼腳七是如何看待個性化購買力和淘寶搜索排序的。
隨著網絡的流行和互聯網信息的爆炸性增長,如何從海量的信息中準確找到自己需要的信息成為了互聯網發展面臨的一大難題。傳統的搜索引擎由于其通用性,對于相同的查詢,所有用戶得到的都是同樣的結果,顯然不能滿足不同背景、不同目的和不同時期用戶的個性化需求。在這個講究個性和以人為本的時代,人性化的搜索引擎已經成為了時代的需求。
在淘寶的環境下,用戶主要的目的就是購物。不同的用戶個體在購物上更是天然就存在著很大的差異,這種差異可以反映在很多方面,有價格偏好、類目偏好、地域偏好、品質偏好等等。而我們要做的就是挖掘,理解用戶的差異和不同需求,做出個性化的搜索體驗,最終能夠幫組用戶在淘寶上購物。
1.為什么需要個性化購買力
前面提到了,每個用戶在很多方面都是有自己獨特的偏好,而購買力就是最明顯的一個方面。高帥富和屌絲對商品的價格和品質有完全不同的需求。同樣是搜索“T恤”,高帥富需要的是面料材質好的品牌貨;而屌絲需要的是100元3件還包郵的大路貨。這種需要的差異就是我們需要做個性化購買力的原因。
2.購買力計算
我們將用戶的購買力劃分到5個檔位上,低,中低,中高,高,超高。我們會計算用戶在多個不同粒度的購買力,從最細的用戶+query粒度到最粗的用戶組粒度,粒度越細,數據越準確,但也越稀疏。
3.用戶+Query,用戶+Query簇
根據用戶在某一個特定query下的行為,計算用戶在單個query下的購買力。由于是單個query,所以數據會非常稀疏,而且能覆蓋的query很也少。將query聚類,計算用戶在Query簇下的購買力會稍微緩解一下數據稀疏的問題。但這樣的話又引入了一下新的問題:query聚類,相似query聚類本身就是一個不小的工作。而且雖然可以通過query聚類能部分提升數據量,但還是不足以達到豐富的程度。而且也沒有必要細化到query粒度,用戶在同一類目的不同query下的購買力還是會比較相似的。
4.用戶+類目,用戶
在類目粒度上計算用戶的購買力,這個類目粒度是從后臺葉子類目到后臺一級類目,都會計算。由于用戶在不同的類目會表現出來不同的購買力(比如IT碼農,手持iphone身穿便宜的T恤),所以我們會計算用戶在多個類目下購買力。用戶+類目粒度的數據相對用戶+query要豐富很多了,一些大的一級類目下一個用戶90天平均有3-5筆左右的成交,已經具備了一定的統計意義。結合用戶在各類目維度維度的購買力,我們還是再計算一個用戶整體的購買力。這個數據相對來說就更豐富一些,一個人90天平均有20筆左右的成交。
5.用戶組+類目,用戶組
對于那些自身行為很少的用戶,我們通過將用戶聚合成用戶組的方式來預測他們的購買力。用戶組的聚合可以主要是從兩個維度:用戶的基本物理信息:a.地域,性別,年齡;b.用戶星級。相識行為:a.購買,收藏;b.點擊瀏覽。從不同維度將用戶分類后,看他們的購買行為是否有一定的相似性(這個可以用那些成交行為豐富的用戶來驗證),如果購買力類似,差異不大,則說明對人的劃分是有效的。 用戶組粒度的購買力數據還在規劃中,目前還沒有實際產出。
6.類目成交價格分布
在不同類目下,不同的價格代表了不同的購買力,比如在200元的T恤是比較高端了,但200元的手機是非常低端的手機,所以我們首先需要計算每個類目下各個購買力檔對應價格區間。將類目下所有寶貝的成交價格從低到高排序,然后按照20%,30%,30%,15,%,5%的比例劃分成5檔,低檔[0 - x1],中低檔[x1–x2),中高檔[x2– x3),高檔[x3 – x4),超高檔[x4 – )。
7.寶貝購買力
對于每個寶貝,查詢上面的類目成交價格分布表,看一下寶貝價格是在哪一檔價格區間中,將這個寶貝打上購買力檔的標簽。
8.用戶購買力
對于用戶的成交寶貝價格和點擊寶貝價格,查詢類目成交價格分布表,將這次成交和點擊行為打上價格檔的標簽。然后分類目統計用戶在不同價格檔上的行為次數,計算得到用戶在不同類目下的購買力。最后得到的購買力格式如下:Key:用戶id +類目id;Value:購買力1檔:置信度|購買力2檔:置信度| …
9.搜索排序上的應用
線上排序中,我們會結合用戶的購買力和商品的購買力,對不同購買力的用戶推薦相應購買力檔的商品。
10.系統架構
和現有架構的區別就是用戶個性化數據存儲交給UPS來負責,QP通過訪問UPS服務來獲取用戶個性化信息。
樂發網超市批發網提供超市貨源信息,超市采購進貨渠道。超市進貨網提供成都食品批發,日用百貨批發信息、微信淘寶網店超市采購信息和超市加盟信息.打造國內超市采購商與批發市場供應廠商搭建網上批發市場平臺,是全國批發市場行業中電子商務權威性網站。
本文來源: 鬼腳七談性化購買力和淘寶搜索排序