知名百科 >> 讯飞语音输入法 >> 历史版本
编辑时间历史版本内容长度图片数目录数修改原因
2024-05-09 10:07 最新历史版本 14256 1 4
  返回词条

讯飞语音输入法

讯飞语音输入法泛指科大讯飞有限公司开发的科大讯飞输入法(英文:科大讯飞输入法),于2010年10月28日推出,支持语音输入、照片输入、手写输入、方言输入等多种输入方式。科大讯飞的输入法率先推广语音输入。截至2023年10月17日,已完成对四川话、东北话、上海话、山东话、武汉话等26种方言的语音识别支持,还支持英语、韩语、日语、波斯语、泰米尔语、土耳其语、乌克兰语、波兰语等30种外语和5种民族语言的语音输入,使用场景进一步拓展。截至2023年10月17日,科大讯飞输入法官网提供iOS、Android、Windows、macOS、Linux和OpenHarmony等平台的软件下载,覆盖所有平台设备。

科大讯飞输入法是业内领先的语音输入解决方案,一分钟可输入400个单词,识别准确率可达98%。截至2020年10月,科大讯飞输入法日语音交互量突破10亿次,语音输入累计服务设备超过5亿台,语音用户占比超过70%。

截至2023年10月,科大讯飞输入法已实现方言免切换、面对面即时翻译、照片OCR识别、无障碍语音和文字表情输入、AI批改等多项领先技术。并且基于其创新的语音模型,科大讯飞输入法在不同场景下的效率和准确率都得到了提升。

目录

发展历史

公司成立上市(2010年前)

20世纪90年代,世界智能语音产业萌芽。1997年,IBM推出了第一款多语言连续听写产品IBM Viavoice,并向时任中国国家主席的江泽民展示了其中文普通话系统。当时中国的语音市场几乎完全被跨国公司控制,中国培养的语音领域人才也相继流出。当时,正在中国科学技术大学学习的刘庆峰在他的第五年成为“人机语音通信实验室”研究团队的领导者;在1998年的“国家高技术研究发展计划”中,刘庆峰率先将语音合成技术投入实用。

1999年12月30日,拒绝了微软数万美元奖学金的刘庆峰组建了一个18人的创业团队,并在合肥正式成立了科大讯飞有限公司,主要从事智能语音、自然语言理解和计算机视觉等人工智能技术研究。

2008年,科大讯飞在深交所中小板上市(股票代码:002230),成为中国第一家创业成功的公司,也是当时中国语音行业唯一一家上市公司。

技术突破阶段(2010-2014年)

2010年10月28日,基于互联网和移动互联网的语音识别和语音合成引擎——科大讯飞语音云正式发布。科大讯飞输入法诞生,HMM(隐马尔可夫模型)应用于语音识别系统,集成了语音、手写、拼音等多种输入法,极大地方便了手机输入的使用,提高了输入效率。

大约在20世纪10年代,人类开始尝试复制人脑听和处理人类语音的方式,DNN(深度神经网络)在语音识别中的应用取得了革命性的突破。在此背景下,科大讯飞开始研究DNN语音识别,并于2012年推出了全球首个中文语音识别DNN系统,应用于科大讯飞输入法,使识别率提高了35%,准确率提高到80%。

同时,科大讯飞输入法也在探索和尝试PC输入法。2013年7月10日,科大讯飞输入法PC版正式发布。它集成了语音、手写和拼音输入,具有强大的语音识别能力和创新的触摸板手写输入法。

此后,SDT-DNN(序列判别训练深度神经网络)、VAD(语音活动检测、语音端点检测)、UB-LSTM(单向和双向长短期记忆)等关键技术相继应用于科大讯飞输入法,不仅提高了语音识别的准确率,还实现了一系列重要功能。2013年,初步实现离线语音识别;2014年,科大讯飞输入法的语音识别率达到95%。

由于时空和地域因素,汉语方言识别一直是语音识别领域的一个难题。基于云计算、大数据、方言口音自适应、深度神经网络等技术手段,科大讯飞于2014年1月成功研发出具有自动纠错能力和智能联想能力的方言语音识别引擎。同时,科大讯飞与中国国家语委达成合作,收集各地方言语音数据用于模型训练。2014年2月27日,科大讯飞正式推出四川话语音识别技术,并率先应用于科大讯飞输入法,识别准确率超过85%。同年,河南话(包括晋语和中原官话的汉芯电影)、东北话(东北口音普通话、沈阳话、长春话和哈尔滨话)、天津话、湖南话(长沙话)、山东话、武汉话、合肥话、陕西话和南京话的语音识别功能相继上线。

人工智能战略1.0:应用探索期(2015-2018年)

科大讯飞输入法一直在方言语音识别领域深耕,并取得了一系列成果。2015年后,科大讯飞输入法先后实现了贵州方言、客家话等多种方言的语音识别功能,开始探索民族语言的语音识别领域。

2017年,科大讯飞输入法联合中国声谷启动“方言保护计划”,建立“中国方言数据库”,通过智能语音推动方言融入普通生活,解决了地域使用少、采集难的问题,致力于长期保护和保存方言的公益活动,也为其语音识别技术积累了海量方言数据。同年,得益于基于缓存的快速适配技术,科大讯飞输入法推出了“语音智能适配”功能,该功能基于用户对识别结果的修正,即时优化用户的个性化语言模型,避免再次输入时出现相同错误,旨在解决重复修改的痛点。

截至2018年底,科大讯飞输入法已支持23种方言以及部分民族语言和外语的语音识别。

人工智能战略2.0:红利赎回期(2019年至今)

在AI战略2.0阶段,科大讯飞输入法实现了业务快速扩张。

2019年5月21日,科大讯飞输入法9.0上线。该版本搭载了基于注意力机制的Encode-de code模型,引入了中英文免切换、普通话和粤语免切换等功能,初步实现了不同语言的混合输入。同年11月,科大讯飞输入法Linux版正式发布,实现了与Deepin的无缝对接,并适配龙芯、飞腾等国产处理器。

此外,在2021年11月发布的科大讯飞输入法11.0中,前沿AI技术的全面赋能将AI助手的智能水平提升到了一个新的高度。新版本引入了适配多场景的助手功能,覆盖“整句预测”、“AI校对”、“AI聊天”等使用场景,为用户带来更强大的输入功能和更智能的输入体验。在2022年11月发布的科大讯飞输入法12.0中,基于全新的AI智能输入引擎,内置的AI助手内置了22项AI功能,涵盖聊天、发布、搜索、评论、评价、个性表达六大输入场景。

2023年5月6日,科大讯飞推出科大讯飞星火认知模型;8月15日,科大讯飞输入法推出基于Spark模型的“AI创作助手”,成为国内首个支持大模型的输入法产品。

截至2023年9月22日,为科大讯飞输入法“方言保护计划”投稿的人数超过85万,收集的方言数量近170万。

产品功能 

文字输入方式

多方言和多语言语音识别:自2014年2月推出四川话语音识别技术以来,科大讯飞输入法已先后推出河南话(含韩信片晋语、中原官话)、东北话(东北口音普通话、沈阳话、长春话、哈尔滨话)、天津话、湖南话(长沙话)、山东话、武汉话等26种方言和藏语、维吾尔语、彝语等5种民族语言以及英语、彝语。用户可以通过长按输入法键盘上的空格键来选择一种方言或语言开始语音输入,也可以通过App中的“AI输入-语音面板”进行沉浸式语音输入。

2017年,科大讯飞输入法iOS 7.0.1726正式上架App Store,实现了iOS中首个第三方语音输入免跳转,大大提高了用户在语音输入方面的效率。

无方言切换:2019年5月21日,科大讯飞输入法9.0推出中英文免切换功能,普通话和粤语免切换功能,初步实现了不同语言的混合输入;在2022年上线的12.0版本中,科大讯飞输入法正式引入了“方言免切换”语音识别模式,实现了多种方言的识别,无需频繁切换,大大提高了输入效率。点击语音输入面板中的语言选择,您可以在“方言”下选择“方言自由切换”模式。

讯飞语音输入法讯飞语音输入法

智能照片输入:2021年,科大讯飞输入法发布“智能照片输入”功能,开创了除拼音、语音、手写之外的全新交互输入方式,完成各类复杂信息的输入。到2023年10月9日,支持中、英、日、韩、德文字识别、英、日照片翻译、数学公式一键屏幕录入、数学作业智能批改、拍照便捷生成办公电子文档等功能。用户可以直接点击科大讯飞输入法菜单面板上的“照片输入”进入照片输入模式。

无障碍输入:为满足视障群体对个性化、多样化无障碍输入的功能需求,科大讯飞输入引入了无障碍输入模式。通过在系统设置中启动TalkBack服务,用户可以收到科大讯飞输入法提供的实时语音反馈,为视障人士无障碍使用电子设备提供了解决方案。2021年12月,小米MIUI团队与科大讯飞输入法联合打造的无障碍输入法上线。

离线输入:离线输入功能于2021年7月上线,包括完全离线的拼音、语音和手写输入。用户无法在离线输入模式下使用拼音云、语音、翻译、涂鸦等云输入服务,但仍支持语义联想、错别字纠正等功能。并且基于其内置的AI离线识别引擎,识别速度和准确率都能达到可用水平。截至2023年10月17日,离线语音仅支持普通话。

表情包:用户可以点击输入法键盘上的“表情”按钮,并在表情输入面板中选择“表情包”来浏览和下载许多表情包,包括漫画、电影、动画、游戏和综艺节目。

斗图:科大讯飞输入法在表情输入面板的“斗图”部分提供了许多网络上活跃的表情包供用户选择和发送,包括可爱的宠物、沙雕、表情符号、动画、卡通、萌娃、爆发、小表情和精神状态分类。

人工智能助手

闲谈:当用户处于“聊天”界面时,科大讯飞输入法会利用AI技术根据当前输入框中的内容进行内容推荐和替换,使表达方式更加多样化。用户可以在不同的使用场景中使用提示(如“生日快乐”和“谢谢”)来获得AI助手的推荐句子。如果他们不满意,可以点击“更改”进行更换。

BiuBiu有趣的聊天:BiuBiu聊天可以对用户输入的文本进行修改和处理,实现多种聊天形式的切换。截至2023年10月,BiuBiu Fun Chat支持单字刷屏模式、三次发言模式、咆哮模式、中英文装X模式、表情符号模式、乱序模式、逆序模式、火星文模式、密语模式、成语接龙模式和拆词模式。

A.一。校对:基于AI技术,科大讯飞输入法实现了对中文文本中拼写、语法、标点符号等诸多问题的纠错校对,提示错误位置并返回修改建议。截至2023年10月17日,已支持政法、教育行业专业词汇智能校对。当用户完成输入后,点击“A.I校对”显示错别字并更正结果,然后点击“纠错”完成替换。

其他功能

皮肤DIY:科大讯飞输入法提供了大量的键盘皮肤供用户选择,并支持用户上传自己的图片进行皮肤DIY。用户可以在科大讯飞输入法App首页看到皮肤商城和皮肤DIY的入口。

语音注释:科大讯飞输入法在App中提供了“语音笔记”功能,用户在需要时可以直接在输入法中记录信息,无需切换应用程序即可记录灵感,这在一定程度上避免了遗忘和出错。用户可以在App中的“AI输入-语音笔记”中使用该功能。

面对面翻译:2018年6月,科大讯飞输入法推出“面对面翻译”功能,支持中英、中俄、中日、中韩四种对话翻译模式,并配有真人发音。用户可在App内的“AI输入-面对面翻译”中使用该功能,实现翻译文本结果同步同屏显示、语音播报等便捷功能。

相关合作

合作腾讯皇家安全

2017年3月,科大讯飞输入法与腾讯御安全展开深度合作,致力于共同为手机用户打造无忧移动安全体验,构建网络安全新生态。

基于其漏洞扫描引擎,腾讯御安全协助科大讯飞输入法扫描修复安全漏洞,通过代码级加壳、混淆、插花等多种防逆向、防篡改、防动态调试功能,进一步提升科大讯飞输入法的安全性。

在此次合作中,腾讯御安全整合了腾讯手机管家在安全领域积累的诸多经验,为科大讯飞输入法提供漏洞扫描和加固服务,对科大讯飞输入法的应用层、so文件和SDK库进行全面防护,从而保护应用本身和用户的信息安全,防止信息泄露。

合肥万象城“科大讯飞人工智能互动体验中心”

2019年8月31日,科大讯飞输入法与合肥万象城携手打造“科大讯飞人工智能交互体验中心”。双方跨界合作致力于打造购物中心场景体验新主题,为消费者带来全新的线下体验。

科大讯飞输入法“声音实验室”位于一个开放式实验室内,由你的声音实验区、人工智能创作体验区和人工智能互动大屏三部分组成。在“声音实验室”的中间是一个大型互动屏幕,公众可以通过它全面了解尖端的人工智能产品和服务。

人工智能互动大屏右侧区域为“你的声音实验区”,包括“人工智能变声体验区”和“人工智能音色识别区”:当你对着“人工智能变声体验区”内的变声盒说话时,就能听到由科大讯飞“实时变声”技术实现的变声复读;在“A.I。音色识别区”,a。I。可以从多个维度提取说话人的语音特征,判断说话人的性别/青春/情感等。,并提供14种不同的语音识别结果。

A.I。互动大屏左侧是注重用户体验的“a。I。创作体验区”:用户可以玩覆盖全球近200个国家和地区的可翻译语言的科大讯飞翻译机3。0,配备10。3英寸新一代E-ink柔性屏、具有录音、手写和阅读功能的科大讯飞智能办公本、五分钟一小时的科大讯飞智能录音笔,实现用户。

访问iFLYOS

2019年10月,科大讯飞输入法在“2019科大讯飞全球1024开发者节”上宣布与iFLYOS达成技术合作,致力于将科大讯飞输入法打造成实时语音助手。

IFLYOS语义服务于2019年11月在科大讯飞输入法上线,涵盖输入法编辑文字、搜索表情、搜索皮肤、开启辅助、个性化设置五大核心功能。语义服务将通过语音密码访问,或者语音密码将通过使用“肖飞·肖飞”唤醒来澄清。此外,在iFLYOS蓝牙协议的加持下,未来的科大讯飞输入法可以取代手机上蓝牙设备的客户端,无需下载App即可快速为蓝牙设备赋能。用户可以通过输入法的语音入口快速控制蓝牙设备。IFLYOS将逐步为科大讯飞输入法定制丰富的语音技能,为十亿用户提供对话式语音体验。同时,通过基于输入文本的语义处理深度优化,实现智能回复和写作辅助。

基于此次合作,科大讯飞输入法和科大讯飞将形成统一的用户体系,实现多端数据共享和统一画像,进一步提升科大讯飞产品群的优质用户体验,形成更加完整的科大讯飞生态链。

联合AAC技术-用户自定义振动输入法

2021年9月26日,科大讯飞输入法联合瑞声科技推出全球首个用户自定义振动输入法,向用户开放振动调节模块,让每一个与体验息息相关的细节都能由用户决定。

新版科大讯飞输入法安卓版适配手机的线性马达,用户可以自定义个人触控方式,不仅是振动强度,还可以微调振动的锐度。安卓阵营高品质机型的用户可以率先体验自定义震动。此外,瑞声科技(AAC Technologies)旗下的RichTap触觉反馈方案为科大讯飞输入法用户精心设计定制了清脆、弹性、柔韧、深邃四种触感,让键盘打字体验更进一步。

截至2023年10月17日,科大讯飞输入法iOS终端不支持自定义震动。

携手小米打造“无障碍模式”

2021年12月3日,科大讯飞输入法与小米MIUI联合打造的“无障碍模式”上线,旨在改善残障人士的输入体验。无障碍输入法实现了打字面板和功能面板的操作震动反馈,同时具有语音提示,为视障群体提供听觉反馈。为了进一步改善视障人士的打字体验,丰富他们的表情,除了基本的无障碍输入外,科大讯飞输入法还适配了表情符号表情的无障碍发送功能。当点击表情符号时,科大讯飞输入法可以播报表情的名称和位置,以便对方能够充分理解文字之外的情绪。此外,“无障碍模式”内置了方言识别,方便有口音或方言的视障人士使用,进一步降低了语音输入的门槛。

用户在系统设置中启动TalkBack服务,即可收到科大讯飞输入法提供的实时语音反馈。

公益活动

“方言保护计划”

2017年,科大讯飞输入法联合中国声谷启动“方言保护计划”,助力建立“中国方言数据库”。

2019年4月23日,科大讯飞输入法与新华书店在广州思源书店成立“方言保护计划公益联合店”,旨在推动“方言保护计划”深入粤语方言区。

2020年5月18日,第44个国际博物馆日,科大讯飞输入法联合苏州博物馆开展“用姑苏软语传承千年文化”活动,探索方言保护新形式。同年10月,科大讯飞输入法联合我的人民我的家园影业开展“声音的100个故乡”大型线上活动,稳步大力推进“方言保护计划”。

2021年4月22日,科大讯飞输入法携手中国方言研究所,聚焦方言文化数字化采集项目,共同推进“方言保护计划”,共同建立浙江方言文化影视采集,深度探索方言文化传承机制;同年11月12日,科大讯飞输入法与中国方言研究院在浙江省金林慈善基金会、红石慈善基金会的支持下,共同发起童话乡村口音暨少儿浙江方言文化传承公益活动;12月21日,科大讯飞输入法和科大讯飞苏州研究院联合中国文化IP海市蜃楼推出《姑苏笔记》方言文化短片,用AI留下多彩乡音。

2022年4月23日,在第27个世界读书日,科大讯飞输入法联合海南民生广播在“方言保护计划官网”推出视频《海南方言课堂》,旨在传播方言文化,关注方言保护。同年6月23日,科大讯飞输入法与中国蓝TV联合推进“AI+公益”方言保护计划,发起“寻找杭州话发音人”活动,探索新时代文化传承路径。9月21日,科大讯飞输入法与总台中国之声特别策划了文化音频特别节目《声音里的中国》,共同推进“方言保护计划”。

“方言保护计划”通过智能语音推动方言融入普通生活,解决地域使用少、采集难等问题,致力于方言长期保护保存的公益活动,也为其语音识别技术积累了海量方言数据。截至2023年10月17日,为科大讯飞输入法方言保护计划贡献力量的人数超过85万人,收集的方言数量近170万种。

无障碍服务

作为国内最早具备无障碍功能的app之一、中国盲人协会认证的首个输入法产品,科大讯飞输入法将行业领先的AI技术应用于无障碍模式,依托无障碍语音输入、表情输入等功能,为视障人士铺设了一条通往互联网世界的“盲道”,满足了1700多万视障人士对无障碍输入的个性化、多样化功能需求。此外,自2019年以来,科大讯飞输入法已连续三年在10月15日国际盲人日携手黄子韬、林永健、李乃文等明星,并与中国盲人协会共同发起“和我一起看”公益活动,致力于关注视障群体,倡导信息无障碍。