包含标签:语言模型 的文章
-
Recommender Systems in the Era of Large Language Models (LLMs)
本文是LLM系列文章,针对《Recommender Systems in the Era of Large Language Models (LLMs)》的翻译。 大语言模型时代的推荐系统 摘要 1 引言 2 相关工…… -
LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER
本文是LLM系列文章,针对《LARGE LANGUAGE MODEL AS AUTONOMOUS DECISION MAKER》的翻译。 作为自主决策者的大语言模型 摘要 1 引言 2 前言 3 任务形式化 …… -
论文《LoRA: Low-Rank Adaptation of Large Language Models》阅读
论文《LoRA: Low-Rank Adaptation of Large Language Models》阅读 Background Introduciton Problem Statement Methodology Δ …… -
ChatGLM2-6B、ChatGLM-6B 模型介绍及训练自己数据集实战
介绍 ChatGLM-6B是开源的文本生成式对话模型,基于General Language Model(GLM)框架,具有62亿参数,结合模型蒸馏技术,实测在2080ti显卡训练中上(INT4)显存占用…… -
开源语言模型的历史和重要性;Edge浏览器将推出Bing AI重写文本功能
🦉 AI新闻 🚀 微软即将推出桌面版Microsoft Edge浏览器的Bing AI重写文本功能 摘要:微软最近在桌面版Microsoft Edge浏览器中引入了一个新功能,允许用户使…… -
向量数据库:使用Elasticsearch实现向量数据存储与搜索
向量数据库:使用Elasticsearch实现向量数据存储与搜索 向量数据库:使用Elasticsearch实现向量数据存储与搜索 一、简介 二、实验前准备 2.1 创建索引…… -
-
LangChain大型语言模型(LLM)应用开发(二):Conversation & Memory
LangChain是一个基于大语言模型(如ChatGPT)用于构建端到端语言模型应用的 Python 框架。它提供了一套工具、组件和接口,可简化创建由大型语言模型 (LLM) …… -
训练自己的ChatGPT 语言模型(一).md
0x00 Background 为什么研究这个? ChatGPT在国内外都受到了广泛关注,很多高校、研究机构和企业都计划推出类似的模型。然而,ChatGPT并没有开源,且复现难…… -
模型并行 | 大规模语言模型架构 Megatron
随着AI模型的规模越来越大,分布式训练技术越来越被广泛使用。现行的分布式训练方法主要包含两个部分:数据并行(Data Parallel)和模型并行(Model Parallel……