讯飞星火认知大模型
“讯飞星火认知大模型”是科大讯飞于2023年5月6日发布的产品。它具有文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力和多模态能力等七个能力维度,其中在文本生成、知识问答和数学能力方面取得了不错的成绩。截至2023年8月,该产品已在教育、办公、汽车、数字化员工四大领域发布相关应用成果。
“讯飞星火”APP是搭载讯飞星火认知大模型核心基础能力的“超级助手”应用。它不仅具有跨学科的知识和语言理解能力,而且可以理解和执行基于自然对话的任务。截至2023年11月24日,科大讯飞星火APP用户数已突破1200万,其助手功能涉及“职场、营销、出行、生活、公文、客服”等多个场景。
2023年5月9日,中国通用大模型综合评测基准SuperCLUE发布,科大讯飞研发的Spark认知大模型排名全球第三、国内第一。
发展历史
2022年12月,科大讯飞启动“1+N”大型模型技术攻关。其中,“1”是指通用认知智能大模型算法研发和高效训练方案的基础平台,“n”是指认知智能大模型技术在教育、医疗、人机交互、办公、翻译等行业领域的应用。
2023年4月24日,科大讯飞星火认知模型官网正式上线,并开展了需求调研。一些用户还进行了内部测试。在研究页面上,科大讯飞星火认知模型依托用户个人信息,更好地匹配用户需求。同时,在行业应用场景中,该模型给予用户“办公、客服、营销、金融、媒体、汽车、教育和医疗”等重点领域的选择。
2023年5月6日,科大讯飞科大讯飞火花认知模型V1.0发布。作为一个以中文为核心的认知智能模型,它可以在多领域、多任务中实现基于自然语言对话的用户需求理解和任务执行。科大讯飞Spark认知模型不仅可以为用户提供文本、语言理解、知识问答、逻辑推理、数学思维、代码理解等多种能力。在与人对话互动的过程中,还能不断从海量数据和大规模知识中学习和进化。与此同时,讯飞星火认知大模型一经发布,科大讯飞就为2023年定下了三个目标:6月9日,开放问答和多轮对话能力显著提升,数学能力再次升级;8月15日,代码能力和多模态交互能力升级。10月24日通用模型对标ChatGPT,中文能力超越ChatGPT,英文能力与ChatGPT相当。
2023年5月9日,中国通用大型车型综合评价基准SuperCLUE正式发布。本次基准测试主要关注三大问题,包括中国大型模型在不同任务中的性能、与国际代表性模型的性能对比程度以及中国大型模型与人类的性能对比。在本次测试中,科大讯飞开发的Spark认知模型在全球总榜中排名第三,在国内排名第一。
2023年6月9日,科大讯飞星火认知模型V1.5正式发布。与此同时,讯飞星火在开放知识问答方面取得突破,多轮对话能力、逻辑能力和数字化能力也实现升级。科大讯飞总裁吴小如认为,“大模型的真正优势在于以自然语言理解为核心,并结合课堂搜索等插件功能来解决更复杂的问题。”通过结合大模型的语言理解能力、通用表达能力和相似搜索插件,增强了科大讯飞Spark认知模型的开放知识问答能力。同时,多轮对话能力的提升也让对话体验更接近真人,比如模拟面试官,通过多轮对话和提问为用户提供模拟面试场景。借助长链思维推理和数理逻辑推理能力,讯飞星火认知大模型可以将各种数学方法综合应用于各种数理逻辑问题,并给出用户答案,如农夫、狼、羊和蔬菜过河、穿越直线、概率问题等。
2023年6月20日,科大讯飞星火认知模型及C端智能硬件在新加坡成功举办产品发布会暨科大讯飞Aitech Day新加坡站。
2023年6月28日,科大讯飞Aitech Day无锡站暨科技生活成果分享会成功举办。分享会上,科大讯飞开放平台R&D部总监桂政指出,在AI工程技术面临“智能涌现”等新挑战的背景下,科大讯飞推出了科大模型R&D服务一体化平台——科大福林平台和科大认知大模型,并提到星火认知大模型已实现PC、H5、APP和小程序全覆盖,新打造的提示“应用开发”场景可与用户共创星火助手。
2023年7月6日,高级副总裁、认知智能国家重点实验室主任胡郭萍在盛腾人工智能产业高峰论坛上宣布了科大讯飞与华为的合作。胡郭萍指出,“中国大模型安全和发展的关键是基于硬件和软件自主创新的大模型生态的快速进步。”中国大规模模型的研发高度依赖高端AI芯片、集群和生态。然而,单个AI芯片的进步速度已经跟不上大规模模型对大算力的需求。因此,为打造中国通用智能新基地,确保大规模模型算力安全可控,科大讯飞一方面以升腾AI为核心,软硬件协同优化,另一方面基于训练与推理一体化设计,实现大规模模型稀疏化、低精度量化的技术突破,高效适配升腾AI,打造算力集中、供给稳定、数据安全的大规模模型训练集群。同时,讯飞星火形成了立体化的‘内容安全’保障机制,解决了内容安全问题。
2023年8月12日,新华社研究院中国企业发展研究中心发布的《人工智能大模型体验报告2.0》显示,科大讯飞在报告选取的8款大模型产品中以总分1013分排名第一,其AI大模型智商指数和AI大模型效率指数均排名第一。
2023年8月15日,科大讯飞科大讯飞星火认知模型V2.0正式发布。同时,发布并升级了许多搭载科大讯飞Spark认知模型V2.0能力的应用和产品,如“代码生成、图片生成、视频生成、Spark插件”等新功能。此外,该车型还升级了代码发布能力和多模态能力。科大讯飞董事长刘庆峰指出:“科大讯飞Spark V2.0的代码能力有了很大提升。从行业参考测试集上的效果对比来看,基于Python和C++的Spark V2.0的代码编写能力已经与ChatGPT高度接近,差距仅为1%和2%。”从Python语言的代码生成、补全、纠错、解释和单元测试生成中,我们可以看到科大讯飞Spark V2.0在代码生成和补全方面已经超过了聊天GPT,其他几项能力也在快速追赶。其中,在科大讯飞Spark认知模型2.0版本中,文本生成能力、语言理解能力、知识问答能力、逻辑推理能力和数学能力分别提升了72%、78%、70%、60%和72%。
2023年8月17日,在中国发表于《麻省理工科技评论》的大规模模型评估报告中,科大讯飞Spark认知模型V2.0凭借其在自然语言处理、语音识别和图像识别等领域的强大处理能力,以81.5的总分位列评估第一。本次测评使用的测试集包含600个问题,涵盖八个一级类别:语文专项、数学专项、理科综合、文科综合、逻辑思维、编程能力、综合知识和安全。
2023年9月5日凌晨,科大讯飞Spark认知模型正式面向全民开放,Spark API、Spark助手、Spark插件全面开放。用户可通过各大应用商店下载“讯飞星火”APP或在“讯飞星火”官网注册后直接使用。科大讯飞星火认知模型上线之初,与1万多家企业合作,诞生了超过1.2万个AI助手应用,涵盖了营销、创作、编程、聊天、学习和推理等多种应用场景。除了软件之外,C端软硬件也得到了应用,如科大讯飞AI学习机、科大讯飞智慧办公、科大讯飞听力、星火语言伙伴等。
2023年10月24日,科大讯飞Spark认知模型V3.0在第六届世界声音博览会暨2023科大讯飞全球1024开发者节上正式发布。科大讯飞董事长刘庆峰认为“大模特要赋能民生,需要从多轮对话、主动对话到启发式对话的跨越”,并指出“大模特不仅要有专业知识,还要有个性化的AI人才设计”。因此,在应用场景方面,讯飞星火认知大模型针对不同受众推出了星火科研助手、AI心理伴侣、讯飞星火医疗模型以及首款集“大模型与体智能”于一体的人形机器人。此外,科大讯飞星火认知模型V3.0新增了虚拟人格功能,用户可以赋予其人格,使模型具有个性化的表达风格和情感。此外,科大讯飞星火认知模型V3.0可导入特定历史知识和历史聊天记录,使模型形成个性化记忆。
2023年11月13日,据相关报道,科大讯飞进一步升级了科大讯飞Spark认知模型V3.0,如自动数学抽取、小样本学习、代码项目级理解、多模态指令跟随和细节表达等能力。然而,与GPT-4相比,讯飞星火认知大模型V3.0在复杂知识推理、小样本快速学习和长文本处理方面仍落后于它。同时,为了在2024年上半年对GPT-4进行基准测试,科大讯飞正式启动了更大参数的大规模Spark模型的训练,并与盛腾生态联合发布了“邢飞-1”大规模模型计算平台。
2023年11月20日,根据新华社研究院中国企业发展研究中心发布的第三期《大模型年度测评报告——人工智能大模型体验报告3.0》测评结果,科大讯飞研发的科大讯飞星火认知大模型在人工智能大模型测评中获得最高分1775分,在基础能力指数、智商指数和工具效率指数三项测评指标中均获得第一名。本次测评中,主流大模3.0综合指数以“技术实力”和“发展潜力”为标准,评选出包括讯飞星火在内的10款最新国产主流大模产品。值得一提的是,在同年8月的《人工智能大模型体验报告2.0》中,讯飞星火获得了总分、智商指数和工具效率指数的第一名。
功能服务
核心功能
多模式交互:多模态交互涉及四个功能:多模态理解、视觉问答、多模态生成和虚拟人视频。用户上传图片素材后,大模型对其进行识别和理解,然后返回图片的准确描述,从而实现多模式理解。同时,视觉问答可以围绕上传的图片素材,对用户提出的问题进行响应和回答。多模式生成和虚拟人视频根据用户的描述生成合成音频和视频,用户可以描述所需的视频内容,集成AI虚拟人,并快速生成匹配的视频。
编码能力:代码能力包括代码生成、代码解释、代码解释和单元测试。科大讯飞Spark认知模型可根据注释和函数名智能生成单行和函数级代码建议或自动生成代码。如果用户需要准确解释代码,科大讯飞Spark认知模型的代码解释功能可以逐一解释类、函数及其功能,并支持逐行代码注释。如果用户需要检查漏码,科大讯飞Spark认知模型可以准确定位拼写、语法和逻辑错误,并支持新旧代码对比和一键修改,实现代码纠错功能。如果用户想要对代码进行单元测试,他们只需要选择代码,就可以一键生成单个测试用例、多个主流单元测试框架和智能生成单元测试数据。
文本生成:科大讯飞Spark认知模型可以生成各种文本,包括商业文案、营销计划、英文写作和新闻发布。例如,根据用户的要求,我们可以创建各种丰富的商业文案和营销方案,还可以根据新闻元素创建严谨而详细的新闻稿,并且我们可以使用英语实现多种风格和任务的长期写作任务。
数字能力:科大讯飞Spark认知模型具有多题分析的数学能力,能够综合应用各种数学方法解决不同类型的数学问题,包括方程求解、几何问题、微积分和概率统计等。
语言理解:科大讯飞Spark认知模型可以实现多层次的跨语言理解,包括机器翻译、文本摘要、语法检查和情感分析。机器翻译支持多种常用语言的翻译,包括中文、英文和法文。文本摘要是根据文本内容提取简洁准确的摘要,帮助用户快速理解文章的核心思想。语法检查功能可以检查文本的语法错误,并为用户提供正确的语法建议。情感分析是指分析文本中的情感色彩,如积极、消极或中性,从而帮助用户更好地理解文章内容的观点和态度。
知识测验:科大讯飞星火认知模型的知识问答涵盖了用户需要了解的日常生活知识、工作技能、医学知识和历史人文模块,可以为用户提供关于日常生活和工作的知识、基本保健知识、疾病预防和诊断治疗的建议以及关于历史事件、文化传承、名人故事、名言警句的文案。
逻辑推理:科大讯飞Spark认知模型的逻辑推理包括思维推理、科学推理和常识推理。思维推理是指通过分析问题的前提条件和假设,推理出答案或解决方案,并给出新的想法和观点;科学推理是指利用现有数据和信息进行推断、预测和验证等科学研究中的基本任务;常识推理是指在对话和交流中利用已有的常识知识来分析、解释和回应用户的问题或需求。
其他功能
火花助手:星火助手包括数千个智能助手,如PPT大纲助手、标题大师、模拟面试助手、市场分析师、每周助手、文本扩展助手、小说合成助手、代码工程师等。它具有强大的文本生成能力,深入各种场景解决用户的刚需问题。用户可以在Spark assistant中找到合适的场景并寻求帮助。
语音输入和广播功能:用户可以通过点击大模型对话框底部的“播放按钮”自动阅读文本内容,同时通过语音输入向大模型发出指令。此外,在设置选项中,用户还可以切换和调整中英文扬声器和语速,安卓端用户也可以通过输入“#spark talking”命令启动纯语音对话模式。
指令模板推荐功能:用户可以使用指令模板推荐功能快速制定指令并驱动大型模型以获得准确和高质量的答案。系统将根据用户在科大讯飞Spark认知模型对话框中输入的“/”符号为用户推荐指令模板,并将更准确的模板与用户输入的关键词进行匹配。该功能提高了用户与模型之间的交互效率。
图像输入功能:大模型将识别、翻译和理解用户发送的图片内容,用户可以与大模型进行对话并就图片信息进行提问。
虚拟人格功能:虚拟人格功能可以根据人格模拟、情感理解和表达风格形成初始人格设计,并结合特定知识学习和对话记忆学习形成更个性化的AI人格设计。虚拟个性应用程序“火花伴侣”已经推出,用户可以通过陪伴创造自己的个性。
实时搜索:实时搜索功能大大提高了对当前热点事件的回答能力,可以根据用户输入的相应搜索热词提供准确答案。紧跟事实的功能大大提高了讯飞星火的可玩性和实用性。
基本服务
Spark API访问:Spark API接入服务具有高效处理、持续演进、个性化定制、安全可靠等特点。一方面,Spark API采用流式接口设计,首帧响应最快可达毫秒级。另一方面,在高效算法和架构的帮助下,它可以在很短的时间内处理大量的用户请求。Spark API具有多样化的功能,并且可以从海量数据和知识中不断学习和发展。个性化定制是指Spark API可以提供丰富的参数设置,从而实现个性化的模型体验和专属的模型解决方案。之所以安全可靠,是因为Spark API采用了千亿流量的公有云架构,并结合数据加密、访问控制等多重手段确保用户隐私,使得云服务达到了三等同等保护的标准。
插件市场:插件市场可以实现与讯飞星火认知模型其他业务系统的交互,并极大地扩展模型的功能和应用范围,包括扩展模型的应用场景、帮助模型获取最新信息以及为企业提供定制化需求。扩展模型的应用场景意味着插件可以使科大讯飞星火认知模型适应更多的场景和需求,如实时天气查询、电影票预订等。,这样用户就可以在不离开聊天窗口的情况下完成这些任务。帮助模型获得最新信息意味着对于一些可能过时的信息,插件可以帮助大模型访问互联网并获得特定领域的最新咨询。为企业提供定制化需求,意味着插件可以使大模型为企业提供定制化解决方案,并为私有化提供插件,以确保大模型内部信息查询的安全性和隐私性,从而更好地服务于特定行业和用户。
应用领域
营销行业:科大讯飞Spark认知模型可以通过对大量营销数据的分析和挖掘,为营销策略制定提供有力支持,最终实现精准营销。此外,该车型还将结合智能语音和语言理解技术,以提高客户服务效率和用户体验。其内容生成和语言理解能力可以帮助实现智能营销文案创作和创意生成,同时将为营销领域提供更高效、更智能的运营管理。
文化旅游产业:科大讯飞Spark认知模型通过将其语义理解和自然语言生成能力与语音和虚拟人等技术相结合,可以为游客提供语音交互和对话服务,以满足游客的各种需求。同时,该模型还可以为用户提供天气、路线和景点等实时信息,以及餐饮和住宿等服务推荐,还可以提供个性化的旅行建议,以丰富他们的旅行体验。
航空工业:在航空行业,科大讯飞Spark认知模型可将飞行安全与飞机运维知识库相结合,实现飞行安全监控、机场运行优化、航班调度、旅客服务等功能,从而提高飞行安全,实现智能机场和客舱服务,提升航空系统运行效率。
运输行业:科大讯飞Spark认知模型可以通过对物流运输数据和信息的深度学习以及自然语言处理技术,对物流运输数据进行智能分析和预测,并对货主和司机进行智能匹配和调度,为物流企业提供决策支持和智能服务。
教学培训行业:科大讯飞Spark认知模型可以帮助解决员工在实际工作中遇到的问题,丰富企业的学习资源和课程内容,并结合企业内部系统实现个性化推荐,从而帮助员工提高学习效率和学习体验。
金融行业:科大讯飞Spark认知模型应用于金融领域的风险控制、投资管理、客户服务、产品设计、欺诈监测等环节。在这些环节中,该模型通过风险评估、投资建议和流程自动化等功能,帮助金融机构更准确地评估风险并及时做出更明智的业务决策,同时可以为用户提供更个性化的服务。
汽车工业:在汽车行业,科大讯飞为数千辆汽车提供行业领先的智能语音交互服务,提供多轮、多人、多区域、多模态的语音交互。截至2023年8月,科大讯飞已累计服务用户超过4610万,在中国汽车智能语音应用市场排名第一。2023年11月14日,据相关报道,科大讯飞星火已与奇瑞、广汽、长城、长安等数十家车企及合作伙伴建立了合作关系,包括构建汽车AI星火生态、共同推动中国汽车产业智能化创新等,并将继续实施大车型在汽车领域的深度应用。这也标志着科大讯飞星火在汽车行业取得了有效进展。