一、提出問題
1、客戶轉化率(購買轉化率、加購轉化率、喜歡轉化率)是多少,提出降低客戶流失的建議?
2、客戶最喜歡的商品類別前10名分別是哪些,從該類商品中得出什么信息?
3、客戶每天的活躍時間段分布情況,并根據數據表現給業務部門提出有效信息。
二、理解數據
1、數據集介紹:
本數據集(UserBehavior.csv)包含了2017年11月25日至2017年12月3日之間,有行為的約一百萬隨機用戶的所有行為(行為包括點擊、購買、加購、喜歡)。數據集的組織形式和MovieLens-20M類似,即數據集的每一行表示一條用戶行為,由用戶ID、商品ID、商品類目ID、行為類型和時間戳組成,并以逗號分隔。
2、數據集字段:
注意:用戶行為類型共四種,它們分別是
關于數據集規模的一些說明如下
3、數據來源
阿里巴巴天池
User Behavior Data from Taobao for Recommendation-數據集-阿里云天池?tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1
4、提取數據
使用Navicat在MySQL數據框中創建表userbehavior,然后將100萬條數據導入表中
5、分析維度:客戶(數量及行為)、商品、時間。
三、數據清洗
1、列名重命名
原數據集沒有表頭,在導入數據前先用SQL創建表格,建立表名。
2、數據類型轉換
將字段時間戳數據轉換成日期數據,在SQL中使用函數:
select from_unixtime(時間戳) from userbehavior;
3、更新數據
在原表中更新時間戳數據為日期數據
4、提取日期數據中的小時
四、數據可視化
(1)
(2)
(3)
五、數據可視化得出的結論
1、客戶轉化率(購買轉化率、加購轉化率、喜歡轉化率)是多少,提出降低客戶流失的建議?
市場上電商行業的平均成交轉化率為3%,而該店家的轉化率為2.27%,低于行業平均水平。
根據圓環圖可知,客戶的點擊商品行為占據90%,說明大部分客戶仍停留在激活階段,并沒有產生實際購買行為,應該從網站品牌、商品吸引力、客戶服務、用戶行為、訪問者質量、用戶體驗六方面進行改進。
2、客戶最喜歡的商品類別前10名分別是哪些,從該類商品中得出什么信息?
由圖可知,前十種類型的商品銷售量很好,因此:
(1)在進貨時,要根據歷史每日售量數據表現,針對性該類型商品多進貨物,預防出現供不應求;
(2)多維度研究前十名類型商品的宣傳手法、營銷技巧、商品屬性等因素,給其他售量低的類型商品提供學習與借鑒。
3、客戶每天的活躍時間段分布情況,并根據數據表現給業務部門提出有效信息。
由曲線圖可知,
(1)時間段:0-6(點),客戶活躍數量保持平穩的最低值,因為屬于人們在睡覺休息時間;
(2)時間段:6-10(點),客戶活躍數量持續上升,因為人們睡醒后,陸續開始一天的生活;
(3)時間段:10-18(點),客戶活躍數量基本保持平穩;
(4)時間段:19-22(點),客戶活躍數量開始快速上升,在21-22點到達一天最高值,因為屬于下班自由時間段,刷手機的高峰期;
(5)時間段:22-24(點):客戶活躍數量在22點之后迅速下降,這個時間段人們都開始進入休息。
從中可得出結論,在休息時間段:0-6(點)和22-24(點),不適合進行促銷、新品的廣告推送;在21-22(點),客戶活躍數量最高值期間,適合各種宣傳和商品推送,激活客戶;
樂發網超市批發網提供超市貨源信息,超市采購進貨渠道。超市進貨網提供成都食品批發,日用百貨批發信息、微信淘寶網店超市采購信息和超市加盟信息.打造國內超市采購商與批發市場供應廠商搭建網上批發市場平臺,是全國批發市場行業中電子商務權威性網站。
本文來源: 淘寶店鋪的數據分析