2022全国大学生数据分析大赛A题完整解题教程及代码 医药电商销售数据分析

题目 A:医药电商销售数据分析 完整解题
随着国家政策的逐步开放,越来越多的药品可以在网络上购买, 医药电商平台蒸蒸日上,受新冠疫情的影响,线下药店购买困难,更 让医药电商进入了更多消费者的视野,各大药企也纷纷加大力度布局 医药电商领域。但电商模式与线下零售有所不同,如何更好的经营医 药电商成为药企急需解决的问题。本题采集了天猫维生素类的药品, 请针对维生素药品进行数据的清洗、分析与挖掘,并回答下列问题。

2.1 第一问

对店铺进行分析,一共包含多少家店铺,各店铺的销售额占比如何?给出销售额占比最高的店铺,并分析该店铺的销售情况。

题目分析:统计shop_name字段的店铺去重值以及其个数,计算出销售额,根据店铺进行分组,统计出各店铺的销售额占比。接着进行降序排序,得到销售额占比最高的店铺,给销售额最高的店铺的其他字段情况进行数据汇总分析

2.2. 第二问

对所有药品进行分析,一共包含多少个药品,各药品的销售额占比如何?给出销售额占比最高的 10 个药品,并绘制这 10 个药品每月销售额曲线图。

题目分析:统计id字段的药品去重值以及其个数(不能分析title,因为他有一些商品title一样,但是口味或者其他信息是不同的,我觉得分析id的情况可能比较好),计算出销售额,根据药品进行分组,统计出各药品的销售额占比。接着进行降序排序,统计出销售额占比最高的 10 个药品,并绘制这 10 个药品每月销售额曲线图。

2.3. 第三问

对所有药品品牌进行分析,一共包含多少个品牌,各品牌的销售额占比如何?给出销售额占比最高的 10 个品牌,并分析这 10 个品牌销售较好的原因?

题目分析:统计brand字段的品牌去重值以及其个数,计算出销售额,根据品牌进行分组,统计出各品牌的销售额占比。接着进行降序排序,统计出销售额占比最高的 10 个药品。可以从价格和折扣的对应图表,从而分析销售较好的原因。

2.3. 第四问

预测天猫维生素类药品未来三个月的销售总额并绘制拟合曲线,评估模型性能和误差。

题目分析:首先先筛选出天猫店铺维生素类的对应商品,根据时间进行分组,得到一个时间序列数据,然后就可以进行一个时间序列预测了,可以采用传统的arima模型或者灰色预测模型,可以采用机器学习的xgboost,神经网络,或者采用深度学习的lstm模型,注意这里是拟合,所以可以用mape评估模型性能

2.3. 第五问

一家药企计划将新的维生素品牌进行网络销售,聘请你当企业的顾问,请你设计一份不超过两页纸的电商经营策略。

题目分析:这个可以基于上面第三问的数据进行分析

完整代码自行点击以下获取

详细讲解及视频讲解获取

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码
< <上一篇

)">
下一篇>>