ChatGPT 模型上基本上和之前 GPT-3 都没有太大变化，主要变化的是训练策略变了，用上了强化学习。
几年前，alpha GO 击败了柯洁，几乎可以说明，强化学习如果在适合的条件下，完全可以打败人类，逼近完美的极限。
强化学习非常像生物进化，模型在给定的环境中，不断地根据环境的惩罚和奖励（reward），拟合到一个最适应环境的状态。

这里重点是第二步中，如何构建一个 reward 函数，在alpha go 里，这个reward 函数就是下完一盘围棋之后判断谁输谁赢，只需要一个程序函数即可完成。
而在ChatGPT里，具体就是让那40名外包人员不断地从模型的输出结果中筛选，判断哪些句子是好的，哪些是低质量的，这样就可以训练得到一个 reward 模型。

一个语言文字训练的人工智能程序

存在问题：

仅限于语言标注
仅限于以前输入到系统中，训练的数据库，如果有新的数据还需要重新添加并训练
存在编程过程中，答案正确率较低的现象

（2）MATLAB科研图像处理——基于ChatGPT编程

MATLAB科研图像处理——基于ChatGPT编程

MATLAB科研图像处理——基于ChatGPT编程 - 知乎

ChatGPT是一个非常强大的语言模型，但它并不是万能的

（3）ChatGPT发展历程、原理、技术架构详解和产业未来（收录于先进AI技术深度解读）

ChatGPT发展历程、原理、技术架构详解和产业未来（收录于先进AI技术深度解读）

ChatGPT发展历程、原理、技术架构详解和产业未来（收录于GPT-4/ChatGPT技术与产业分析） - 知乎

ChatGPT 是一种专注于对话生成的语言模型。它能够根据用户的文本输入，产生相应的智能回答。这个回答可以是简短的词语，也可以是长篇大论。
其中GPT是Generative Pre-trained Transformer（生成型预训练变换模型）的缩写。

目标是开发造福全人类的AI技术。

每一代GPT模型的参数量都爆炸式增长，堪称“越大越好”。2019年2月发布的GPT-2参数量为15亿，而2020年5月的GPT-3，参数量达到了1750亿。

ChatGPT 是基于GPT-3.5（Generative Pre-trained Transformer 3.5）架构开发的对话AI模型，是InstructGPT 的兄弟模型。ChatGPT很可能是OpenAI 在GPT-4 正式推出之前的演练，或用于收集大量对话数据。

因此它只能基于2021年所拥有的数据集进行回答
ChatGPT 通过算法屏蔽，减少有害和欺骗性的训练输入。

（4）程序员浅用ChatGPT：替代还很远

程序员浅用ChatGPT：替代还很远

程序员浅用ChatGPT：替代还很远|源代码|应用程序|编程语言_网易订阅

李智认为，ChatGPT并不能编写程序员角度的代码，而是从互联网收集庞大信息库并使用它来生成代码，解决问题还是要靠人。
对于软件程序，ChatGPT目前只有通用底层的能力，涉及电商、云服务等业务层面的能力尚有欠缺。比如要写一个小程序，是可以借用ChatGPT来找算法、写代码、写脚本

考虑到会侵犯知识产权。

（5）用ChatGPT 做硬件设计？

用ChatGPT 做硬件设计？

用ChatGPT 做硬件设计？ - 知乎

（6）chatGPT 的 49 种应用场景介绍，各开发语言接入 chatGPT 参考指南

chatGPT 的 49 种应用场景介绍，各开发语言接入 chatGPT 参考指南

chatGPT的49种应用场景介绍，各开发语言接入chatGPT参考指南_Java_非喵鱼_InfoQ写作社区

分析了存在的问题：

慢
错
广度待提升

api 注册使用流程
直接用 chatGPT 去创建一个程序要用的秘钥，
就可以使用 http 接口调用了。

程序接入到 chatGPT，所调用的接口，都是收费接口，不过还好的是每一个新注册的账号头 3 个月免费使用，总消费额度不超过 18 美元即可。另外下图 4 个方块就是 nlp 的模型，左边 ada 速度最快，右边达芬奇功能最强大。

转载于：杨杰

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

chatgpt 人工智能学习

二维码

explain都不懂？搞什么数据库优化，快进来学习了

< <上一篇

9:00面试，9:03就出来了，问的实在是太变态了···

下一篇>>

搜索内容

ChatGPT学习研究总结