最前线|「启英泰伦」推出第三代智能语音芯片,实现端侧自然语言处理,覆盖端云融合语音应用

作者|韦世玮

**

7月28日下午,人工智能(AI)语音芯片公司「启英泰伦」发布第三代智能语音芯片,包罗CI130X和CI230X两大系列,内置第三代自研技术平台BNPU(脑神经网络处理器),广泛覆盖高性能、低成本端侧语音和端云融合语音等应用。

BNPU作为启英泰伦构建智能语音芯片产品的底层核心,如今已升级到第三代,除了延续其在二代语音识别ASR、声纹识别等方面的技术优势外,还支持单麦深度学习降噪技术、命令词自学习2.0版本。

更重要的是,它实现了两大核心技术突破,一是增加了离线自然语言语义处理,支持离线NLP;二是增加双麦深度人声分离技术,无需记住任何命令词,同时具备识别能力和理解能力,支持用户以自然的方式随心和设备交互。

启英泰伦的产品+技术演进路线

与上一代产品比拟,第三代芯片拥有更高算力、高度集成、性能新高三大特点。

  • 算力方面,CI130X系列芯片采用BNPU 3.0和支持DSP指令扩展的RISC CPU双核架构,主频为240MHz,拥有更灵活的计算性能、更强的可编程性,支持高并行向量运算,同时还有640KB系统SRAM。
  • 集成度方面,该系列芯片集成了双路ADC、两路MIC接口、三路LDO以及常见的MCU通用接口等,可满足各类语音识别应用。
  • 性能方面,第三代芯片几乎可以装载所有前端信号处理算法,支持端侧TTS(从文本到语音)。

CI1306芯片框图及应用

启英泰伦创始人兼CEO何云鹏谈道,语音设备的应用环节和场景十分复杂,不同设备工作的分贝强度也有所差异,既要遍及适应不同环境,也要适应不同用户的个性化表达方式和表达特点。

因此,第三代芯片按照不同应用和客户需求,将CI130X和CI230X两大系列进行了系列化封装。

在语音处理能力上,CI1301、CI1302、CI1303系列支持离线远场语音识别,准确率超98%,支持更强的噪声适应和口音泛化能力,并支持语音降噪、深度学习降噪、回声消除、本地自学习等算法;CI1303和CI1306则在声源定位、波束成形、盲源分离等传统算法上增加了端侧NLP;CI2305和CI2306的语音处理能力别离与CI1302、CI1306相同,其中CI2306支持离线语音+在线语音+AIoT功能。

整体来看,第三代芯片解决方案不管是针对厨房烟机、扫地机器人等70dB以上的高噪环境,还是客厅电视类人声、会场、卖场等多人场景,都能实现良好的识别和适应性。

启英泰伦的第三代智能语音芯片特点

除此之外,启英泰伦为了帮手客户实现敏捷开发,加速产品落地,还推出了新一代语音AI平台,拥有在线开发、在线支持、在线资、算法API接口四大模块,支持零代码开发、即时生成NLP模型、本地语音合成/开发等功能,并支持10000个用户同时开发。

启英泰伦语音AI平台框架

从2015年成立至今,启英泰伦直接或者间接办事的B端客户已超过5000家,平台开发者超过1万名,在校AI学院超过10万名,离线语音方案的年装机量则超过2000万,呈快速增长之势。

何云鹏提到,启英泰伦的发展战略分为三个阶段。在第一个阶段,首先解决自然的人机交互,“这是机器人发展的前提条件和基础,语音语言是最自然直接的交互方式。”他说,公司通过第一阶段努力,要让所有设备得到语音交互的升级,在设备终端就进行十分便捷的自然交互,让设备听得清、听得懂。

在第二阶段,则是让所有终端设备高度智能化,更好地为人们提供办事,其主要技术特征在于具备多模态感知交互,以及能够在端侧进行理解和决策,甚至还能自我成长学习。

随着机器人在人们生活中普及,也将进入到更高级的阶段,何云鹏将其称之为“守护精灵”。其技术特点是将智能语音从所有智能设备中抽象出来,成为人们日常生活的全方位管家、百科老师、健康卫士,甚至是知心伴侣。“我们的终极目标是打造跨设备、跨时空,打破虚拟世界和现实世界壁垒的产品。”他说。

未经允许不得转载:迪欧吧_技术交流_资源分享_热点资讯_免费VPS空间 » 最前线|「启英泰伦」推出第三代智能语音芯片,实现端侧自然语言处理,覆盖端云融合语音应用