平臺背景
Ozon是俄羅斯最早的電子商務公司之一,有時被稱為“俄羅斯的亞馬遜”。Ozon成立于1998年,最初是一家在線書店,到2019年已成為該國三大在線零售平臺之一。它被《福布斯》評為2020年最有價值的俄羅斯互聯網公司第三名。
采集介紹
近年來,美妝行業在全球迎來蓬勃發展,海外美妝市場體量在不斷提升,不少國產美妝也在塑造自身品牌的同時尋求出海機遇。
以前科技并不怎么發達,不僅沒有這么多形形色色的化妝品,也不知道哪些化妝品賣得好? 化妝品的價格分布是怎樣的呢? 什么地方的化妝品銷量最高呢? 簡直有十萬個為什么,希望別人給我們解答。
隨著科技的飛速發展,互聯網溝通了你我他。我們通過Ozon上美妝的銷量,就可以解決我們想要知道的好多問題。基于此,我爬取了平臺上3000多條美妝的銷售數據,為大家展示了一幅漂亮的可視化大屏,解決大家心目中的問題。
數據采集
該平臺采集有個5s盾反爬,我們不做逆向分析,抓不到數據的童鞋們可以通過Selenium自動化腳本抓取數據。
部分代碼展示
with sync_playwright() as p:browser = p.chromium.launch(headless=False, proxy={'server': 'http://127.0.0.1:58889'})context = browser.new_context()cookies = []for p in range(1, 100):try:page = context.new_page()page.route(re.compile(r"(\.png)|(\.jpg)|(\.js)"), cancel_request)context.add_cookies(cookies)print(p)page.goto(f"https://www.ozon.ru/category/makiyazh-6501/?page={p}")web_html = page.content()selector = etree.HTML(web_html)data = selector.xpath('//div[@id="state-searchResultsV2-252189-default-1"]/@data-state')[0]data = json.loads(data)
元數據展示
采集數據量查看
df.shape
國外站點好多都沒有按銷量排序,該網站也不例外!
本次共采集了100頁彩妝的熱門推薦商品,采集商品數量為3211款;
數據清洗
數據清洗很重要,這個對于我們后續做可視化展示,極其重要。因此我們需要根據后面要做的圖形,然后進行對應的進行數據清洗。
元數據整個數據看上去算是比較干凈,但是還是有幾個地方指的我們處理一下。
1、解析返回的元數據,抽出需要的字段;
2、處理價格亂碼,替換盧比標志;
3、匹配店鋪名稱,抽取有用的字符串;
4、將打分人數為空的記錄,替換成0人打分;
5、將標題一樣的做去重;
數據清洗部分代碼如下:
df = df.drop_duplicates('title') df['current_price'] = df['current_price'].apply(lambda x:int(x.replace('\u2009','').replace('?',''))) df['original_price'] = df['original_price'].apply(lambda x:int(x.replace('\u2009','').replace('?',''))) df = df.fillna(0)
現在來看看,清洗后的數據是啥樣的?
本次采集是根據平臺的受歡迎產品來排序采集的,采集結果重復的占比較高,去重后商品為2085款;
數據可視化展示
可視化是整個文章的亮點所在,所謂“字不如表、表不如圖”。整個可視化大屏我們基于以下五個問題開展而來。
- 評價數量Top10的美妝柱形圖;
- 評價數量Top10的店鋪柱形圖;
- 不同價格區間的美妝評價數圓環圖;
- 美妝銷售關鍵字的詞云圖;
1. 評價數量Top10的美妝柱形圖;
from cutecharts.charts import Bar from cutecharts.components import Pagedef bar_base() -> Bar:chart = Bar("評價數量Top10的商品柱形圖",width="1000px",height="800px")chart.set_options(labels=labels, x_label="商品名", y_label="評價人數")chart.add_series("series-A", value)return chartbar_base().render_notebook()
結論:
銷量Top10的美妝,其實對于我們做產品還是挺有指導意義的。從圖中可以看到這個VivienneSabo,在國外賣的還是極其好的,銷量排名前10的產品中,VivienneSabo品牌的產品占據了7個位置。還有一個名字特別熟悉:妮維雅,只知道他家的洗面奶做的好,原來唇膏做的也不錯,所以說品牌效應還是很好的。國產美妝也在塑造自身品牌的同時尋求出海機遇!
2. 評價數量Top10的店鋪柱形圖;
毋庸置疑,ozon自營的產品遙遙領先。可能是因為ozon起初以自營為主,是近幾年采開始轉向跨境電商和第三方平臺的原因。
3. 不同價格區間的美妝圓環圖
from cutecharts.charts import Pie from cutecharts.components import Page bins=[0,200,300,500,1000,2000,10000000] # 按分段離散化數據 segments=pd.cut(df['current_price'],bins,right=False) # 統計各分段人數 counts=pd.value_counts(segments,sort=False) label = ["200盧幣以下","200-300盧幣","300-500盧幣","500-1000盧幣","1000-2000盧幣","2000盧幣以上" ]def pie_base() -> Pie:chart = Pie("不同價格區間的美妝圓環圖")chart.set_options(labels=label)chart.add_series(list(counts.to_dict().values()))return chartpie_base().render_notebook()
當然,價格才是大家關注的焦點。觀察上面的圓環圖可以發現,大多數產品的價格都是處在中間的、能被大家接受的范圍(200-500盧幣),畢竟日?;瘖y護膚的一些產品,適中的價格才能被大家接受,薄利多銷才是王道。
從詞云圖中可以簡單的看出,睫毛、眉毛、化妝筆、眼線筆相關的產品在ozon平臺上比較受歡迎。
EVELINE、Vivienne、LUXVISAGE等品牌名稱出現在標題中占比較重,商品、賣家也比較多。
不同評價分數的產品圓環圖
百分之九十以上的商品評分都在4.5以上,極少數商品在1-3分之間,看來各位商家對客戶維護的都不錯!
產品評分不止是個評分,它能給與客戶那份安全感和信任在平臺直接購買。
如果你也想開店或者做產品,一定要從差評中找到客戶抱怨的點從而優化產品,提升服務,做大做強!
總結
產品分析的用處有很多:
- 可以通過分析競品對象,優化自己的產品或者給新產品提供思路;(產品設計)
- 采集自己店鋪的評價,放大好評中的賣點,優化差評中的缺點;(店鋪運營)
- 做行業監控,為投資決策做參考;
- 分析跨境產品的產地國、發貨地;
- 等等很多…
由于時間精力有限,很多分析都沒有做完:
沒有抓取評論分析該行業的差評吐槽點
沒有分析那個產地的商品賣的好,為什么好
…
<!DOCTYPE html> <html lang="en"> <head><meta charset="UTF-8"><title>私人訂制</title> </head> <body><div>V:</div><div>17610352720</div></body> </html>
樂發網超市批發網提供超市貨源信息,超市采購進貨渠道。超市進貨網提供成都食品批發,日用百貨批發信息、微信淘寶網店超市采購信息和超市加盟信息.打造國內超市采購商與批發市場供應廠商搭建網上批發市場平臺,是全國批發市場行業中電子商務權威性網站。
本文來源: ozon美妝類目怎么樣