文心一言
文心一言(英文名:ERNIE Bot)是百度创造的人工智能大型语言模型。具有跨模式、跨语言的深度语义理解和生成能力,可用于文学创作、商务文案、数理逻辑计算、数据分析、代码生成等场景。
2023年2月7日,百度正式宣布“文易欣颜”项目。2023年3月16日,文心一言正式发布,主要功能展示完毕。2023年8月31日,文心一言向全社会全面开放。2023年11月1日,文心一言专业版正式上线,成为国内首个采用会员制模式,面向C端收费的大型型号产品。
自项目正式公布以来,已有多家公司与百度达成合作。在其正式发布之前,已有600多家公司宣布加入文心一言生态。到2023年11月21日,文心一言用户量达到7000万,覆盖4300个场景。
发展历史
早期建设
2009年8月,百度CEO李彦宏提出“框计算”战略,尝试将NLP和知识图谱技术应用于搜索。2010年初,百度重新规划NLP,成立自然语言处理部。公司不断布局语音、图片等技术领域,制定了知识图谱技术的长期投资策略。
2012年,百度启动了深度机器学习的研究工作。2013年1月,百度成立了国内首个深度学习实验室,并推出了自主研发的深度学习平台PaddlePaddle的前身。2014年,李彦宏提到了百度的内部项目“百度大脑”。这个项目的主要目的是利用计算机、人工智能和深度学习技术来模拟人脑的思维。同年,百度研究院成立,包括深度学习实验室(IDL)、大数据实验室(BDL)和硅谷人工智能实验室(SVAIL)。2016年9月1日,百度宣布了百度人工智能的两大开放平台:百度深度学习平台PaddlePaddle和百度大脑开放平台ai.baidu.com。2017年3月,百度明确将人工智能作为公司发展战略,成立了AI技术平台体系(AIG)。同年,经中国国家发展和改革委员会批准,百度率先建立了中国首个深度学习技术及应用国家工程实验室。
技术发展
2019年3月,百度正式发布了在中文任务上全面超越BERT的NLP模型ERNIE,引起了业界的广泛关注和讨论。2019年4月23日,百度公布了PaddlePaddle的全景图和中文名“飞桨”。2019年7月23日,百度发布了持续学习的语义理解框架ERNIE 2.0,以及基于该框架的ERNIE 2.0预训练模型。在这次升级中,厄尼在英语任务上取得了突破,实现了SOTA。2020年7月9日,在2020世界人工智能大会(WAIC)上,ERNIE以中文名“文心”首次亮相,获得赛尔奖(超级AI领袖)。2021年9月,百度发布了全球首个拥有百亿级参数的中英对话预训练生成模型PLATO-XL。2021年12月8日,鹏程实验室与百度联合发布鹏程-百度文心(模型版本号:ERNIE 3.0 Titan),全球首个联合开发的千亿知识增强模型,参数规模达到2600亿。
正式发布
2022年12月底,李彦宏在一次面向百度全体员工的内部直播中表示,“AIGC(AI生成内容)和ChatGPT都是AI技术发展到一定程度后的新机遇”。2023年2月7日,百度官方公布了“文颜”项目,显示是的新版本产品,搭载百度语言大模型技术(LLM)。2023年2月17日,在2023 AI+产业互联网高峰论坛上,百度AI云宣布文心一言将通过百度AI云对外提供服务,首先将应用于内容和信息相关的行业和场景。
2023年3月16日,百度在北京总部召开发布会,正式宣布启动百度大语言模型文心一言的邀请测试。通过现场演示,文心一言展示了自己在文学创作、商业文案创作、数学计算、中文理解、多模态生成等方面的能力。从2023年2月7日到2023年3月16日,超过600家企业宣布加入文心一言生态。
后续升级
2023年4月,百度CTO王海峰在做客央视财经频道《中国经济大讲堂》时,展示了文心一言的能力和技术,并解释了他名字的由来:“文”是语言,“信”是用心的理解,“文信”指的是致力于理解和运用语言的自然语言理解模式,也与“文心雕龙”相呼应,意为精雕细琢语言。“一言”不仅有“一言为定,一言为定”的含义,还有对人机顺畅沟通的殷切期待。“一字”一出,可以是“二、二、三、一生三字。”
2023年6月17日,文心一言发布了官方插件百度搜索和聊天文件。2023年6月26日,文心大模型升级至3.5版本,创建、问答、推理、代码等能力全面升级,安全性显著提升,训练和推理速度大幅提升。此外,文新模式增加了插件机制,其默认内置的插件百度搜索,使文心一言能够生成实时、准确的信息;ChatFile,一个长文本摘要和问答插件,支持长文本输入。2023年8月16日,百度发布了文心一言的五个原生插件:百度搜索、文档浏览、电子易图、插画和绘画、一面流动的镜子。文心一言支持一次使用三个插件。
全面开放
2023年8月31日,文心一言向全社会全面开放,用户可以在文心一言APP和官网使用。此时的文心一言已经掌握了200多个创作体裁,内容丰富度是发表初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖面是初期的8.3倍。到2023年10月,文心一言的用户量已经达到4500万,开发者54000人,场景4300个,应用825个,插件500多个。
2023年10月17日,文心大模型4.0发布,开始邀请测试。与文心大模型3.5相比,文心大模型4.0的四项能力都得到了提升,其中理解和生成能力的提升是差不多的,而逻辑和记忆能力的提升是显著的,其中逻辑的提升是理解和记忆的近三倍,是后者的两倍多。
2023年11月1日,基于文心大模型4.0的文心一言专业版正式上线,并推出会员服务。会员月订费49.9元,月购费59.9元,成为国内首个采用会员制模式,面向C端收费的大型号产品。与基础版相比,该版本具有更强的建模能力和图像生成能力;拥有更高级的功能,如语音输入、自然语言生成、文本摘要、智能回复等。提供更多的定制服务,如个性化推荐、私有化部署等。文心大模3.5对应的文心一言基础版依然可以免费使用。到2023年11月21日,文心一言用户量达到7000万,覆盖4300个场景。
技术基础
基于摇橹深度学习平台和文心知识增强大规模模型,文心一言从海量数据和大规模知识中不断学习,因此具备知识增强、检索增强和对话增强的技术特性。
数据:文心一言模型的训练数据覆盖了海量的信息资源,包括万亿级的网页数据、数十亿的搜索数据和图片数据、数百亿的语音日常通话数据、5500亿的事实知识图谱。基于上述数据,文心一言通过融合学习得到预训练模型。
飞桨:PaddlePaddle是百度开发的一款全面开源、技术领先、功能齐全的工业级深度学习平台。它的中文名字来自朱的两句诗,“我听说飞桨,我下到天津”。基于百度多年的深度学习技术研究和业务应用,整合了深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台。
PaddlePaddle:是基于Python的高性能分布式深度学习平台,支持动态图和静态图两种编程模式。它提供了丰富的API和工具,如自动混合精度训练、模型压缩、量化等。
螺旋桨基本模型库(PaddleNLP,PaddleCV,PaddleClas等。):这是基于propeller核心框架开发的一系列高质量的预训练模型和领域方案,涵盖自然语言处理、计算机视觉、推荐系统、视频理解等多个领域。,并能帮助用户快速实现各种AI应用。
用于推进器的端到端开发套件(PaddleOCR、PaddleDetection、PaddleSeg等。):提供了数据处理、模型训练、模型评估、模型部署等完整流程。它是基于propeller基础模型库开发的一系列端到端AI解决方案,可以帮助用户快速构建和优化自己的AI系统。
PaddleHub、PaddleX、PaddleSlim等。:这是基于桨飞核心框架开发的一系列工具和组件,提供模型管理、模型转换、模型优化、模型服务等功能。,并能帮助用户提高AI开发的效率和质量。
划桨服务平台(AI Studio、EasyDL、BML等。):这是一系列基于paddle架构的云服务平台,包括在线编程、模型训练、模型推理、模型部署等服务,帮助用户降低AI开发的门槛和成本。
文心大模型:文心大模型是百度发布的全球首个千亿级知识增强模型。文心一词出自中国南朝文学家刘勰的《文心雕龙序》。原意是用雕龙图案的细致功夫去研究文字的内涵和神韵,百度借此表达用心做语义理解的决心。文心一言是文心大模型的应用之一。
模型培训:文心大模型3.0的语料库是在文心大模型2.0的基础上建立的。数据来源包括百度搜索(包括百家号、知道、贴吧、体验)、网文、问答、诗词楹联、百度知识图谱以及医疗、法律、金融等特定领域的数据。
文心大模型3.0的通用表示模块和具体任务表示模块都采用多层Transformer-XL结构作为主干。Transformer XL类似于Transformer,但是引入了辅助递归内存模块,方便对长文本进行建模。文新大模型3.0使用的激活函数是GeLU,使用的优化器是Adam。
在基础模型训练中,文心大模型3.5采用了自适应混合并行训练技术和混合精度计算策略,采用多种策略优化数据源和数据分布,加快了模型迭代速度,显著提高了模型效果和安全性。同时,百度R&D团队创新的监督微调、多层次多粒度奖励模型、多损失函数混合优化策略、结合双飞轮的模型优化等多类型多阶段技术,提高了模型效果和场景适应能力。
文心大模型3.5在知识增强和检索增强的基础上,提出了“知识点增强技术”,使模型能够更好地利用精细知识点提高理解和生成能力,进而增强对世界知识的掌握和应用。在推理方面,大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合和符号神经网络技术提高了模型的逻辑推理、数学计算和代码生成能力。
主要组成
文心NLP大模型:面向语言理解、语言生成等NLP场景,拥有超强的语言理解能力、对话生成能力和文学创作能力。将大数据的前期训练与多源丰富的知识相结合,通过不断学习技术,不断吸收海量文本数据中词汇、结构、语义的新知识,实现模型效果的不断进化。
文心CV Grand Model:基于领先的可视化技术,利用海量图像、视频等数据,为企业和开发者提供强大的visual basic模型和一套可视化任务定制和应用能力。
文新跨模态宏模型:基于知识增强的跨模态语义理解关键技术,可实现跨模态检索、图形生成、图片文档信息提取等应用的快速构建,实现工业智能转型的AI辅助。
文新行业大模型:与各行业企业联合研发,在通用大模型基础上学习行业特色数据和知识,建设行业AI基础设施。
文新生物计算宏模型:融合了自我监控和多任务学习,将生物领域研究对象的特性融入模型中。为化合物分子和蛋白质分子构建生物计算领域的预训练模型,为生物医药行业赋能。
产品特性
作为百度自主研发的知识增强语言模型,文心一言的关键技术包括监督微调、带人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是所有大型语言模型都会采用的技术;后三项是百度现有技术优势的再创新。
知识增长:文心一言的知识增长主要是通过知识内化和知识外化。知识内化是基于语义单元学习,用知识构造训练数据,从大规模知识和未标注数据中学习知识成为模型参数;知识的外部利用就是引入外部多源异构知识,做知识推理,提示构造等等。
检索增强:文心一言的检索增强来自以语义理解和语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。
对话增强:基于对话技术和应用的积累,文心一言具备记忆机制、语境理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。
功能介绍
基本功能
文心一言提供基于文心大模型技术的人工智能问答服务。用户需要在对话框中输入文本信息,文心一言会根据用户的输入输出相应的内容作为响应,包括文本、表格、代码和图片。
文学作品:在文学创作的场景中,文心一言根据对话的问题概括了著名科幻小说《三体》的核心内容,并提出续写《三体》的建议角度,体现了对话问答、总结分析、内容创作的综合能力。
商业文案创作:在商业文案场景中,文心一言完成了公司命名、写广告语、写新闻稿等创意任务,展现了自己的理解能力和表达能力。
数学计算:在进行数学计算时,文心一言纠正了“鸡和兔子在同一个笼子里”的错题,并提供了正确的步骤和答案,显示了他的思维能力,能够学习数学推导和逻辑推理等相对复杂的任务。
汉语理解:文心一言在中文领域拥有先进的自然语言处理能力,在汉语和中国文化方面有更好的表现。文心一言正确地解释了成语“洛阳纸贵”的含义和相应的经济理论。
多模态生成:在多模态生成方面,文心一言具有生成文本、图片和音频的能力,甚至可以生成方言语音。
代码功能:文心一言具有代码解释、代码重写、代码注释、代码生成等能力。比如复制粘贴一段代码,文心一言可以逐行解释代码的功能,并在最后总结整个代码的功能,还可以重写代码。
插件功能:2013年8月16日,文心一言推出了百度搜索、文档浏览、电子易图、插画绘画、一镜流五大原生插件,实现了模型生成实时准资讯、长文汇总问答、数据洞察与图表制作、图片创作与问答、文艺视频。但由于视频生成能力占用的计算能力较大,镜像流截至2023年12月仍未向公众开放。2023年12月9日,百度文心一言插件商城上线。该插件涵盖办公效率提升、多模态内容理解与生成、专业信息查询等实用场景。用户一键安装插件后,通过简单的指令即可使用。
百度搜索:文心一言有能力产生实时和准确的信息。默认情况下,它处于启用状态,无法关闭。
浏览文档:原ChatFile可以完成摘要、问答、创建等任务。基于文档,并且只支持10MB以内的文档,不支持扫描文档。
东宜颜图:基于Apache Echarts,提供数据洞察和图表制作,支持柱状图、折线图、饼状图、雷达图、散点图、漏斗图和思维导图(树形图)。
比如绘画:根据图片写单词,回答问题。截至2023年12月,仅支持10MB以内的图片。
一面镜子在流动:AI文转视频,从主题词、句子、段落等文本描述内容,一键创作生成视频。
其他功能
商业信息查询:爱奇艺提供商业信息检索能力,可以用来查询企业的商业/上市信息,老板的从业/投资情况。
树形图:AI人工智能mindmanager提供制作智能思维导图的工具和模板,支持脑图、逻辑图、树形图、鱼骨图、组织结构图、时间轴、时间线等多种格式。
AI视频助手:AI视频学习助手,加快视频内容的信息提取,输入哔哩哔哩、小红书,摇一摇音视频链接,动态总结视频内容,只持一个创意视频分析。
ppt助手:输入PPT主题,AI智能生成PPT模板。
栗子看板:帮助用户规划和拆解任务,自动生成可视化任务看板。
知犀AI思维导图:一键生成思维导图,还可以选择任意主题无限拓展AI灵感,支持在线生成、编辑、导出。
职场密码AI智能简历:根据个人信息和工作名称生成求职信、求职信、简历模板、中英文简历范本、考研简历。还可以在线编辑排版简历,一键换模板,AI智能诊断。
网页阅读:能提炼总结用户提供的网站链接内容。仅支持2000字以内的网页内容阅读,不支持PDF和图像识别。
AiPPT.cn:一句话10秒智能生成完整PPT,支持在线编辑、演示、下载。