知名百科 >> 文心一言 >> 历史版本
编辑时间历史版本内容长度图片数目录数修改原因
2024-05-08 14:15 最新历史版本 17420 1 7
  返回词条

文心一言

文心一言(英文名:ERNIE Bot)是百度创造的人工智能大型语言模型。具有跨模式、跨语言的深度语义理解和生成能力,可用于文学创作、商务文案、数理逻辑计算、数据分析、代码生成等场景。

2023年2月7日,百度正式宣布“文易欣颜”项目。2023年3月16日,文心一言正式发布,主要功能展示完毕。2023年8月31日,文心一言向全社会全面开放。2023年11月1日,文心一言专业版正式上线,成为国内首个采用会员制模式,面向C端收费的大型型号产品。

自项目正式公布以来,已有多家公司与百度达成合作。在其正式发布之前,已有600多家公司宣布加入文心一言生态。到2023年11月21日,文心一言用户量达到7000万,覆盖4300个场景。

目录

发展历史

早期建设

2009年8月,百度CEO李彦宏提出“框计算”战略,尝试将NLP和知识图谱技术应用于搜索。2010年初,百度重新规划NLP,成立自然语言处理部。公司不断布局语音、图片等技术领域,制定了知识图谱技术的长期投资策略。

2012年,百度启动了深度机器学习的研究工作。2013年1月,百度成立了国内首个深度学习实验室,并推出了自主研发的深度学习平台PaddlePaddle的前身。2014年,李彦宏提到了百度的内部项目“百度大脑”。这个项目的主要目的是利用计算机、人工智能和深度学习技术来模拟人脑的思维。同年,百度研究院成立,包括深度学习实验室(IDL)、大数据实验室(BDL)和硅谷人工智能实验室(SVAIL)。2016年9月1日,百度宣布了百度人工智能的两大开放平台:百度深度学习平台PaddlePaddle和百度大脑开放平台ai.baidu.com。2017年3月,百度明确将人工智能作为公司发展战略,成立了AI技术平台体系(AIG)。同年,经中国国家发展和改革委员会批准,百度率先建立了中国首个深度学习技术及应用国家工程实验室。

技术发展

2019年3月,百度正式发布了在中文任务上全面超越BERT的NLP模型ERNIE,引起了业界的广泛关注和讨论。2019年4月23日,百度公布了PaddlePaddle的全景图和中文名“飞桨”。2019年7月23日,百度发布了持续学习的语义理解框架ERNIE 2.0,以及基于该框架的ERNIE 2.0预训练模型。在这次升级中,厄尼在英语任务上取得了突破,实现了SOTA。2020年7月9日,在2020世界人工智能大会(WAIC)上,ERNIE以中文名“文心”首次亮相,获得赛尔奖(超级AI领袖)。2021年9月,百度发布了全球首个拥有百亿级参数的中英对话预训练生成模型PLATO-XL。2021年12月8日,鹏程实验室与百度联合发布鹏程-百度文心(模型版本号:ERNIE 3.0 Titan),全球首个联合开发的千亿知识增强模型,参数规模达到2600亿。

正式发布

2022年12月底,李彦宏在一次面向百度全体员工的内部直播中表示,“AIGC(AI生成内容)和ChatGPT都是AI技术发展到一定程度后的新机遇”。2023年2月7日,百度官方公布了“文颜”项目,显示是的新版本产品,搭载百度语言大模型技术(LLM)。2023年2月17日,在2023 AI+产业互联网高峰论坛上,百度AI云宣布文心一言将通过百度AI云对外提供服务,首先将应用于内容和信息相关的行业和场景。

2023年3月16日,百度在北京总部召开发布会,正式宣布启动百度大语言模型文心一言的邀请测试。通过现场演示,文心一言展示了自己在文学创作、商业文案创作、数学计算、中文理解、多模态生成等方面的能力。从2023年2月7日到2023年3月16日,超过600家企业宣布加入文心一言生态。

后续升级

2023年4月,百度CTO王海峰在做客央视财经频道《中国经济大讲堂》时,展示了文心一言的能力和技术,并解释了他名字的由来:“文”是语言,“信”是用心的理解,“文信”指的是致力于理解和运用语言的自然语言理解模式,也与“文心雕龙”相呼应,意为精雕细琢语言。“一言”不仅有“一言为定,一言为定”的含义,还有对人机顺畅沟通的殷切期待。“一字”一出,可以是“二、二、三、一生三字。”

2023年6月17日,文心一言发布了官方插件百度搜索和聊天文件。2023年6月26日,文心大模型升级至3.5版本,创建、问答、推理、代码等能力全面升级,安全性显著提升,训练和推理速度大幅提升。此外,文新模式增加了插件机制,其默认内置的插件百度搜索,使文心一言能够生成实时、准确的信息;ChatFile,一个长文本摘要和问答插件,支持长文本输入。2023年8月16日,百度发布了文心一言的五个原生插件:百度搜索、文档浏览、电子易图、插画和绘画、一面流动的镜子。文心一言支持一次使用三个插件。

全面开放

2023年8月31日,文心一言向全社会全面开放,用户可以在文心一言APP和官网使用。此时的文心一言已经掌握了200多个创作体裁,内容丰富度是发表初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖面是初期的8.3倍。到2023年10月,文心一言的用户量已经达到4500万,开发者54000人,场景4300个,应用825个,插件500多个。

2023年10月17日,文心大模型4.0发布,开始邀请测试。与文心大模型3.5相比,文心大模型4.0的四项能力都得到了提升,其中理解和生成能力的提升是差不多的,而逻辑和记忆能力的提升是显著的,其中逻辑的提升是理解和记忆的近三倍,是后者的两倍多。

2023年11月1日,基于文心大模型4.0的文心一言专业版正式上线,并推出会员服务。会员月订费49.9元,月购费59.9元,成为国内首个采用会员制模式,面向C端收费的大型号产品。与基础版相比,该版本具有更强的建模能力和图像生成能力;拥有更高级的功能,如语音输入、自然语言生成、文本摘要、智能回复等。提供更多的定制服务,如个性化推荐、私有化部署等。文心大模3.5对应的文心一言基础版依然可以免费使用。到2023年11月21日,文心一言用户量达到7000万,覆盖4300个场景。

技术基础

基于摇橹深度学习平台和文心知识增强大规模模型,文心一言从海量数据和大规模知识中不断学习,因此具备知识增强、检索增强和对话增强的技术特性。

数据:文心一言模型的训练数据覆盖了海量的信息资源,包括万亿级的网页数据、数十亿的搜索数据和图片数据、数百亿的语音日常通话数据、5500亿的事实知识图谱。基于上述数据,文心一言通过融合学习得到预训练模型。

飞桨:PaddlePaddle是百度开发的一款全面开源、技术领先、功能齐全的工业级深度学习平台。它的中文名字来自朱的两句诗,“我听说飞桨,我下到天津”。基于百度多年的深度学习技术研究和业务应用,整合了深度学习核心框架、基础模型库、端到端开发套件、工具组件和服务平台。

PaddlePaddle:是基于Python的高性能分布式深度学习平台,支持动态图和静态图两种编程模式。它提供了丰富的API和工具,如自动混合精度训练、模型压缩、量化等。

螺旋桨基本模型库(PaddleNLP,PaddleCV,PaddleClas等。):这是基于propeller核心框架开发的一系列高质量的预训练模型和领域方案,涵盖自然语言处理、计算机视觉、推荐系统、视频理解等多个领域。,并能帮助用户快速实现各种AI应用。

用于推进器的端到端开发套件(PaddleOCR、PaddleDetection、PaddleSeg等。):提供了数据处理、模型训练、模型评估、模型部署等完整流程。它是基于propeller基础模型库开发的一系列端到端AI解决方案,可以帮助用户快速构建和优化自己的AI系统。

PaddleHub、PaddleX、PaddleSlim等。:这是基于桨飞核心框架开发的一系列工具和组件,提供模型管理、模型转换、模型优化、模型服务等功能。,并能帮助用户提高AI开发的效率和质量。

文心一言文心一言

划桨服务平台(AI Studio、EasyDL、BML等。):这是一系列基于paddle架构的云服务平台,包括在线编程、模型训练、模型推理、模型部署等服务,帮助用户降低AI开发的门槛和成本。

文心大模型:文心大模型是百度发布的全球首个千亿级知识增强模型。文心一词出自中国南朝文学家刘勰的《文心雕龙序》。原意是用雕龙图案的细致功夫去研究文字的内涵和神韵,百度借此表达用心做语义理解的决心。文心一言是文心大模型的应用之一。

模型培训:文心大模型3.0的语料库是在文心大模型2.0的基础上建立的。数据来源包括百度搜索(包括百家号、知道、贴吧、体验)、网文、问答、诗词楹联、百度知识图谱以及医疗、法律、金融等特定领域的数据。

文心大模型3.0的通用表示模块和具体任务表示模块都采用多层Transformer-XL结构作为主干。Transformer XL类似于Transformer,但是引入了辅助递归内存模块,方便对长文本进行建模。文新大模型3.0使用的激活函数是GeLU,使用的优化器是Adam。

在基础模型训练中,文心大模型3.5采用了自适应混合并行训练技术和混合精度计算策略,采用多种策略优化数据源和数据分布,加快了模型迭代速度,显著提高了模型效果和安全性。同时,百度R&D团队创新的监督微调、多层次多粒度奖励模型、多损失函数混合优化策略、结合双飞轮的模型优化等多类型多阶段技术,提高了模型效果和场景适应能力。

文心大模型3.5在知识增强和检索增强的基础上,提出了“知识点增强技术”,使模型能够更好地利用精细知识点提高理解和生成能力,进而增强对世界知识的掌握和应用。在推理方面,大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合和符号神经网络技术提高了模型的逻辑推理、数学计算和代码生成能力。

主要组成

文心NLP大模型:面向语言理解、语言生成等NLP场景,拥有超强的语言理解能力、对话生成能力和文学创作能力。将大数据的前期训练与多源丰富的知识相结合,通过不断学习技术,不断吸收海量文本数据中词汇、结构、语义的新知识,实现模型效果的不断进化。

文心CV Grand Model:基于领先的可视化技术,利用海量图像、视频等数据,为企业和开发者提供强大的visual basic模型和一套可视化任务定制和应用能力。

文新跨模态宏模型:基于知识增强的跨模态语义理解关键技术,可实现跨模态检索、图形生成、图片文档信息提取等应用的快速构建,实现工业智能转型的AI辅助。

文新行业大模型:与各行业企业联合研发,在通用大模型基础上学习行业特色数据和知识,建设行业AI基础设施。

文新生物计算宏模型:融合了自我监控和多任务学习,将生物领域研究对象的特性融入模型中。为化合物分子和蛋白质分子构建生物计算领域的预训练模型,为生物医药行业赋能。

产品特性

作为百度自主研发的知识增强语言模型,文心一言的关键技术包括监督微调、带人类反馈的强化学习、提示、知识增强、检索增强和对话增强。前三项是所有大型语言模型都会采用的技术;后三项是百度现有技术优势的再创新。

知识增长:文心一言的知识增长主要是通过知识内化和知识外化。知识内化是基于语义单元学习,用知识构造训练数据,从大规模知识和未标注数据中学习知识成为模型参数;知识的外部利用就是引入外部多源异构知识,做知识推理,提示构造等等。

检索增强:文心一言的检索增强来自以语义理解和语义匹配为核心技术的新一代搜索架构。通过引入搜索结果,可以为大模型提供时效性强、准确率高的参考信息,更好地满足用户需求。

对话增强:基于对话技术和应用的积累,文心一言具备记忆机制、语境理解和对话规划能力,实现更好的对话连贯性、合理性和逻辑性。

功能介绍

基本功能

文心一言提供基于文心大模型技术的人工智能问答服务。用户需要在对话框中输入文本信息,文心一言会根据用户的输入输出相应的内容作为响应,包括文本、表格、代码和图片。

文学作品:在文学创作的场景中,文心一言根据对话的问题概括了著名科幻小说《三体》的核心内容,并提出续写《三体》的建议角度,体现了对话问答、总结分析、内容创作的综合能力。

商业文案创作:在商业文案场景中,文心一言完成了公司命名、写广告语、写新闻稿等创意任务,展现了自己的理解能力和表达能力。

数学计算:在进行数学计算时,文心一言纠正了“鸡和兔子在同一个笼子里”的错题,并提供了正确的步骤和答案,显示了他的思维能力,能够学习数学推导和逻辑推理等相对复杂的任务。

汉语理解:文心一言在中文领域拥有先进的自然语言处理能力,在汉语和中国文化方面有更好的表现。文心一言正确地解释了成语“洛阳纸贵”的含义和相应的经济理论。

多模态生成:在多模态生成方面,文心一言具有生成文本、图片和音频的能力,甚至可以生成方言语音。

代码功能:文心一言具有代码解释、代码重写、代码注释、代码生成等能力。比如复制粘贴一段代码,文心一言可以逐行解释代码的功能,并在最后总结整个代码的功能,还可以重写代码。

插件功能:2013年8月16日,文心一言推出了百度搜索、文档浏览、电子易图、插画绘画、一镜流五大原生插件,实现了模型生成实时准资讯、长文汇总问答、数据洞察与图表制作、图片创作与问答、文艺视频。但由于视频生成能力占用的计算能力较大,镜像流截至2023年12月仍未向公众开放。2023年12月9日,百度文心一言插件商城上线。该插件涵盖办公效率提升、多模态内容理解与生成、专业信息查询等实用场景。用户一键安装插件后,通过简单的指令即可使用。

百度搜索:文心一言有能力产生实时和准确的信息。默认情况下,它处于启用状态,无法关闭。

浏览文档:原ChatFile可以完成摘要、问答、创建等任务。基于文档,并且只支持10MB以内的文档,不支持扫描文档。

东宜颜图:基于Apache Echarts,提供数据洞察和图表制作,支持柱状图、折线图、饼状图、雷达图、散点图、漏斗图和思维导图(树形图)。

比如绘画:根据图片写单词,回答问题。截至2023年12月,仅支持10MB以内的图片。

一面镜子在流动:AI文转视频,从主题词、句子、段落等文本描述内容,一键创作生成视频。

其他功能

商业信息查询:爱奇艺提供商业信息检索能力,可以用来查询企业的商业/上市信息,老板的从业/投资情况。

树形图:AI人工智能mindmanager提供制作智能思维导图的工具和模板,支持脑图、逻辑图、树形图、鱼骨图、组织结构图、时间轴、时间线等多种格式。

AI视频助手:AI视频学习助手,加快视频内容的信息提取,输入哔哩哔哩、小红书,摇一摇音视频链接,动态总结视频内容,只持一个创意视频分析。

ppt助手:输入PPT主题,AI智能生成PPT模板。

栗子看板:帮助用户规划和拆解任务,自动生成可视化任务看板。

知犀AI思维导图:一键生成思维导图,还可以选择任意主题无限拓展AI灵感,支持在线生成、编辑、导出。

职场密码AI智能简历:根据个人信息和工作名称生成求职信、求职信、简历模板、中英文简历范本、考研简历。还可以在线编辑排版简历,一键换模板,AI智能诊断。

网页阅读:能提炼总结用户提供的网站链接内容。仅支持2000字以内的网页内容阅读,不支持PDF和图像识别。

AiPPT.cn:一句话10秒智能生成完整PPT,支持在线编辑、演示、下载。

各界合作

2023年2月14日,新浪金融,体验文心一言的综合能力,并在内容生态中构建全方位的人工智能产品和服务。
2023年2月14日,澎湃新闻,体验文心一言的综合能力,打造内容生态人工智能的所有产品和服务。
2023年2月14日,钛媒体,充分体验和接触文心一言的能力。
2023年2月15日,蓝色宇宙,充分体验和接入文心一言的能力,将智能对话技术应用于AIGC营销场景,包括以“苏小妹”为代表的虚拟人驱动和实时对话能力的升级,以及蓝标智播、avatar、MEME等其他商业解决方案产品的生产和创作能力的提升。
2023年2月15日,土巴兔,首家与文心一言合作的家装平台企业,旨在提升用户的装修体验和装修公司的装修效率。
2023年2月15日,爱奇艺,AIGC技术应用于爱奇艺内容搜索、内容公告、内容创作工具、小说创作等业务。
2023年2月15日,火狐,火狐浏览器和火狐主页的搜索部分相继连接到文心一言。
2023年2月16日,南方都市报,访问文心一言并将其智能对话技术成果应用于新闻制作和智库研究领域。
2023年2月16日,邮政储蓄银行,通过“邮政大脑”获取和应用文心一言的能力
2023年2月16日,明源云,接入文心一言,将智能对话技术的成果应用于房地产数字营销领域。
2023年2月17日,长虹,将智能对话技术成果应用于8K视频等领域。
2023年2月17日,海信视像,将智能对话技术的成果应用于包括海信电视在内的大型显示面板。
2023年2月17日,东风日产,东风日产启辰通过百度Apollo整合文心一言的综合能力,共同打造基于智能汽车场景的大规模人工智能交互。
2023年2月17日,凡拓数创,将百智对话技术成果应用于虚拟数字智能人和数字智能展厅相关业务。
2023年2月18日,孩子王网,获得文心一言将其智能对话技术成果应用于育儿场景的能力
2023年2月20日,海马汽车,通过百度Apollo访问人工智能产品文心一言。
2023年2月20日,汇博云通(上海)软件科技有限公司,通过百度人工智能云全面体验和访问文心一言的能力。
2023年2月21日,汉水襄阳新闻客户端,整合文心一言的技术能力,深化与百度在产品研发、标准制定等领域的合作。
2023年2月21日,襄阳广播电视台,整合文心一言的技术能力,深化与百度在产品研发、标准制定等领域的合作。
2023年2月22日,兴业银行,与百度推进前沿人机对话AI技术在金融场景的应用
2023年2月22日,创梦天地,将百度的智能对话技术成果应用于精品游戏体验和Fanbook社区用户服务。
2023年2月23日,诚迈科技,通过百度Apollo,我们可以整合文心一言的综合能力,共同打造基于智能汽车场景的大规模人工智能交互。
2023年2月23日,利欧股份,将智能对话技术的成果应用于数字营销的所有领域,包括创意内容服务、搜索优化服务和程序化广告产品。
2023年2月24日,中青旅,借助百度的对话式语言模型技术,推动人工智能在CYTS旅游产业的全链条运营、应用接入和体验提升。
2023年2月24日,度小满,基于自身金融场景积累的海量对话和解决方案数据,我们将整合文心一言的综合能力,打造全新的智能客服、智能营销和智能风控服务。
2023年2月26日,江苏银行,通过百度AI云全面体验和访问文心一言。
2023年2月27日,隆基绿色能源,通过百度人工智能云全面体验和访问文心一言的能力。
2023年2月28日,绿地金创栖霞绿地数字科技有限公司,通过百度人工智能云全面体验和访问文心一言的能力。
2023年2月28日,网顺科技,将其应用于汪顺服务的电子竞技领域,以促进电子竞技领域的数字智能发展并改善用户体验。
2023年3月2日,尚美数智科技集团,通过百度接入文心一言的能力,我们将构建“AI+酒店”的智慧空间管理系统。
2023年3月2日,蒙娜·丽莎,蒙娜丽莎瓷砖终端店通过百度营销充分体验并进入文心一言。
2023年3月3日,神州细胞,应用文心一言在智能对话技术方面的成果,构建生物技术和制药行业的人工智能整体服务
2023年3月4日,台铃集团,通过百度对文心一言的营销接入,其智能对话技术成果应用于技术创新与产品研发、消费者需求创造与用户深度互动、台铃品牌及数字代言人爱铃的营销推广等领域。
2023年3月6日,凌志软件,通过百度AI Cloud全面体验和接入文心一言的能力,其智能对话技术成果应用于金融科技领域。
2023年3月8日,汇添富基金,通过探索大语言模型并将其融入金融应用场景。
2023年3月9日,汇金科技,通过百度人工智能云全面体验和访问文心一言的能力。
2023年3月9日,微盟集团,通过AIGC科技,我们将深化微盟在营销AI创意内容制作、智能营销、智能客户服务和智能管理方面的布局。
2023年3月9日,用友网络,用友BIP完全连接到百度文心一言,优先考虑文心一言的内部测试并整合文心一言的技术能力。
2023年3月10日,分贝通,通过百度AI Cloud接入文心一言的能力,我们将在智能商务旅行、智能费用控制和智能客户服务方面深化合作。
2023年3月13日,百纳千成,通过技术共享、培训赋能和联合营销加强竞争力。
2023年3月14日,亚信科技,将百度领先的智能对话技术成果与亚信的人工智能技术和产品体系相融合,带来更多数字化智能产品和解决方案。
2023年3月15日,中银基金,将百度领先的智能对话技术成果应用于智能营销、智能服务、智能运营等领域。
2023年3月15日,科创信息,通过整合百度文心一言的能力,我们将继续深化“平台+(业务)应用+AI”的核心竞争力。
2023年3月15日,二三四五,优先内部测试适用于文心一言。
2023年3月15日,元隆雅图,以AIGC技术为基础,构建全方位的技术营销服务体系。
2023年3月16日,长安汽车,将百度的AI技术成果应用于汽车领域,为用户带来人工智能时代的全新出行体验。
2023年3月17日,德邦证券,在投资者教育和智能用户响应领域应用百度领先的智能对话技术成果。
2023年3月17日,财达证券有限责任公司,将百度领先的智能对话技术成果应用于财富管理和机构业务。
2023年3月22日,鼎捷软件,通过技术共享、培训赋能和联合营销加强竞争力。
2023年3月31日,胶东在线网站,整合文心一言的技术能力并结合自身优势,为用户提供更丰富的内容和更多样的体验。
2023年4月7日,智度股份,将百度领先的AI技术能力和成果应用于公司的数字营销业务。
2023年4月7日,华策影视,AIGC技术应用于内容创意、内容制作、内容宣发等影视制作全环节。
2023年4月,Soul,Soul是第一个连接文心一言的社交平台。通过合作,加速AIGC技术能力在社交场景的深度融合,进一步推动平台在辅助创作、智能对话等方向的落地。
2023年4月,艾融软件,在百度技术团队的协助下,我们将通过技术共享、培训和授权以及联合营销来创建联合解决方案并加强我们的竞争力。

获得荣誉

2023年11月8日,2023年世界互联网大会乌镇峰会开幕,主题为“构建包容、普惠、韧性的数字世界——携手构建网络空间命运共同体”。文心一言在这次会议上获得了“世界互联网大会领先科技奖”。

标签