2022全国大学生数据分析大赛B题完整解题教程及代码:餐饮服务评价情感倾向分析

题目 B:餐饮服务评价情感倾向分析 完整解题

餐饮行业被誉为“永不落幕的黄金行业”,一方面是其“民以食 为天”的刚需特性,另一方面是较低的创业门槛,使得行业竞争激烈。 中国餐饮市场经过迅速发展,产业链逐步完善,餐饮外卖市场逐步成 熟,在网络和疫情的影响下,年轻人的线上消费倾向进一步养成,很 大程度上也助推了餐饮行业的线上发展。对餐饮企业来说,结合线上 线下精细化运营,把握好用户评价,才能在竞争中脱颖而出。本题采 集了不同餐饮企业的餐品评论数据,请根据提供的数据进行数据的清 洗、分析与挖掘,并回答下列问题。

2.1 第一问
对数据中的评价内容进行分析,制作词云图,分别给出积极 情绪、消极情绪评价次数最多的 10 个词。

对数据中的评价内容进行分析,制作词云图,分别给出积极 情绪、消极情绪评价次数最多的 10 个词。

题目分析:首先先根据消极跟积极进行分组,对文本进行分词,可以采用结巴分词器,然后各自统计出消极跟积极评价词语出现次数最多的十个词

2.2. 第二问

分析数据中用户评价的积极情绪、消极情绪与评价时间是否 存在关系,请说明理由。

题目分析:时间数据需要处理一下,可以处理出月,日,小时,三个分组,然后对时间进行分组,统计出这三个时频的消极跟积极情绪的文本个数,然后采用方差分析进行差异性分析

2.3. 第三问

积极情绪最多的是哪个商家,并总结这个商家的优点有哪些。

题目分析:对商家进行分组,统计出积极情绪的文本个数,然后进行降序排序得到积极情绪最多的那个商家,可以对其文本进行lda主题词分析,挖掘其用户反馈的优点。

2.4. 第四问

消极情绪最多的是哪个商家,并提出相关改进策略,提高顾 客的积极情绪。

题目分析:对商家进行分组,统计出消极情绪的文本个数,然后进行降序排序得到消极情绪最多的那个商家,可以对其文本进行lda主题词分析,挖掘其用户反馈的缺点,然后对症下药

2.5. 第五问

建立餐饮服务评论的情感倾向模型,并对模型的性能和误差 进行评估。基于模型对附件中的测试数据 test.xlsx 进行评测,将评 测结果补充到第一列中,并将此文件一起上传到竞赛平台。

题目分析:搞个文本分类模型即可,需要训练词向量,建议使用机器学习,针对这种二分类的短文本分类有奇效。

完整代码及详细讲解视频自行点击以下获取

详细讲解及视频讲解获取

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
THE END
分享
二维码

)">
< <上一篇
下一篇>>