码农创造了AI，但开发AI不再需要码农了

admin • 2022-06-10 13:17 • 5G

马上就要到一年一度的618大促，卖萌酱在添加购物车时，选择困难症又犯了。

如今的电商评论区，大量刷单行为淹没了重要的产品评价，有的被淹没在了追评区，有的平台甚至已经不分好评/中评/差评区了，而是“一眼望去好评如潮”。

比如某净水器的评论区，看似只有200条差评，但1.3w条追评、10w条好评中其实隐藏着数不清的差评，这些差评往往可信度极高（毕竟卖家和同行都不会雇水军去好评区写差评）。

但如果想从追评和好评区找出这些差评，能找到你眼瞎。

于是卖萌酱心生一计，既然评论数量这么多，为啥不自己训练个AI模型来从动辄10万+评论的评论区里自动挖掘差评呢？

毕竟人眼一秒看不了10条评论，但AI模型一秒看100条甚至1000条评论也不成问题（只要你有好显卡部署服务）。

说！干！就！干！

首先卖萌酱将这个“找差评”的问题抽象成NLP中的“情感极性分类”问题，进而我们的任务就变成了四步：

富集评论情感极性分类数据集 —> 训练调优情感分类模型 —> 部署模型得到API —> 调用API解决问题

富集评论情感极性数据还好说，中文社区有不少公开数据集。但AI模型的训练和部署就麻烦多了。如果基于传统的深度学习框架从头折腾，无论代码量还是调试调优成本都不低。

这对于只想快速实现情感挖掘功能的我来说无疑效率太低了。

这时大佬给卖萌酱推荐了一个高效低成本的平台——EasyDL，不到一天就能完成从数据集到部署API。

半信半疑的卖萌酱开始了试用之路…

打开EasyDL官网后，首先要选择你要做什么任务：

好家伙，我开始以为是个high-level深度学习框架，看到上图才意识到原来这是个更上层的AI应用开发平台，涵盖了图像、文本、语音、视频、结构化数据等各种任务场景和数据场景。

这里我们关注的是里面的EasyDL-文本任务。针对本次的任务目标，我们可以选择文本分类-单标签，但卖萌酱发现还有更加具体的“情感倾向分析”任务，于是直接选择了后者（上图红框部分）。

完成任务选择后，平台给到了开发任务的流程提示：

这个流程对于一个久经沙场的算法工程师来说已经非常熟悉了，于是卖萌酱跳过指导，开始了开发。

…

随着开发的进行，卖萌酱慢慢发现不对劲了。

数据载入处理完了，我没写代码？

模型训练&效果调优完了，我依然没写代码？

部署完成，服务的远端API我也拿到了，我最终一行代码都没写？？

甚至，就连调用API的client端脚本，平台都给出来了，也不用自己写。。

卖萌酱进而将某商品评论区爬下来的数万条评论存到文件comments.txt中，调用我们已经部署完成的API来挖掘负面评论：

负面评论被源源不断的挖掘出来了！

最后发现某净水器商品的差评区尽管只有200条差评，但通过我们的脚本过全部的数万条评论，却挖掘出来了3300多条差评。

此时卖萌酱陷入了深深的思考——

“做了这么多年的AI算法工程师，到头来，却发现AI的训练和部署已经不需要写代码了？”

虽然码农创造了AI技术，但从技术应用的角度，开发AI已经越来越不需要码农了…

需要注意的是，卖萌酱全程没有任何人指导，甚至也没看官方的指导手册，此前也从未用过EasyDL。初次跑通以上全流程，卖萌酱只用了3小时，而且其中还包括了1个多小时的模型训练与自动调优的时间。

放在以前，3小时对AI算法工程师来说能做什么？

从0开始一个任务的话，3小时，大概模型训练代码还没写完吧。。。

在初次听说EasyDL之前，卖萌酱以为这只是个API封装怪，但真正试用下来，却发现这是个颠覆性的AI开发平台。

本着把3天开发时间降低到1天的心态试用，结果没想到3小时就解决了，而且没有写一行代码。EasyDL的易用性和使用门槛，就连非专业的算法工程师，也绝对可以应付的来了。

想体验零代码NLP开发全流程的小伙伴们，EasyDL官方会于6月9号晚20点组织一场直播，传送门：

百度飞桨EasyDL文本能力详解与实战

戳完报名后，记得定好闹钟！届时会有诸多学习干货、实战体验和大礼包相送哦~

另外，卖萌酱还有一点不解，从最终的负面评论挖掘效果来看，是非常精准、惊艳的。但是卖萌酱却只丢了1万条标注样本给平台，是什么撑起来了模型效果呢？

卖萌酱在配置模型训练环节时，注意到了EasyDL平台有这么一个选项：

意思是说，如果训练阶段是选择了高精度，那就会调用文心大模型作为backbone并完成参数热启。

关注NLP预训练进展的小伙伴对文心大模型“ERNIE”一定不陌生了。

2019年12月，ERNIE 2.0登顶GLUE：

2021年7月，百亿参数规模的ERNIE 3.0霸榜SuperGLUE：

在中文任务上，ERNIE 3.0更是实现了全面屠榜：

而在EasyDL·文本任务中就内置了包含ERNIE 3.0在内的30+预训练大模型，除了通用大模型外，还包括了抽取、匹配等专属任务模型和金融、法律、医疗等领域模型。正是文心大模型的赋能，EasyDL·文本才得以在实现极简易用性的同时，做到超高精度的模型产出。

毫不夸张的说，这个写了0行代码、花了3个小时部署得到的评论极性判别的API，可能比许多专业的算法工程师折腾数天搞出来的API都好用。

至此，作为一个AI算法工程师，卖萌酱深深的感慨：

我们开发了AI，但AI开发可能不再需要我们了。

最后，想体验零代码NLP开发全流程的小伙伴们，EasyDL官方会于6月9号晚20点组织一场直播，传送门：

百度飞桨EasyDL文本能力详解与实战

戳完报名后，记得定好闹钟！届时会有诸多学习干货、实战体验和大礼包相送哦~

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

人工智能文本挖掘自然语言处理

二维码

【JAVA·面试题】面试官这么问你回答的上来吗？

< <上一篇

MyBatis总结

下一篇>>

搜索内容

码农创造了AI，但开发AI不再需要码农了

最新文章

分类

标签云