跳转至

CI13XX 系列芯片SDK

目前CI13XX系列芯片的SDK根据不同应用场景有如下版本分类:

1. 离线语音识别SDK :CI-SDK-ASR-Offline

注意

SDK发布版本格式:CI13XX_SDK_ASR_Offline_Vx.x.x

主要针对纯离线简单应用场景,例如智能家居等,支持的音频前端算法有:

  • ASR (语音识别-单麦克风)
  • CWSL(离线命令词自学习功能)
  • AEC (回声消除)

2. 离线语音算法SDK :CI-SDK-ASR-ALG

注意

SDK发布版本格式:CI13XX_SDK_ASR_ALG_Vx.x.x

CI13XX系列芯片集成第三代BNPU具备较强的神经网络及向量并行运算能力,以及充足的RAM,能够完成一些常见的语音处理算法。主要包含了以下算法功能。使用者可以根据不同产品需求进行合适的选择。

  • ASR(语音识别-单麦克风,固定词条或者自然说)
  • CWSL(离线命令词自学习功能)
  • AEC(回声消除)
  • 声纹识别:包含 VPR(基于特定人的声纹识别)、 WMAN_VPR(男女声纹检测功能) 等;
  • 声音事件检测: SED_CRY(哭声检测功能)、 SED_SNORE(鼾声检测功能)、咳嗽声 等;
  • DENOISE_NN(基于神经网络的深度降噪功能)
  • DOA(双麦声源定位功能)
  • DERVERB(双麦降混响)
  • BF(双麦深度分离)
  • PWK(声音能量值值计算,区分目标声音距离)
  • ALC(自动增益控制)
  • TTS(文本转语音(只支持中文、数字、字母,不支持英文))

其中ASR功能可以和以上除TTS功能以外的其他功能进行1+1组合,如需多个算法组合请参照☞《算法SDK开发流程》


3. 语音通话降噪SDK :CI-SDK-NN-ENC

注意

SDK发布版本格式:CI13XX_SDK_NN_ENC_Vx.x.x

完善中…


4. 离在线大模型对话SDK :CI-SDK-LLM-AIOT

注意

SDK发布版本格式:CI13XX_SDK_LLM_AIOT_Vx.x.x

完善中…


备注

各版本SDK可以到 ☞启英泰伦语音AI平台 开发资料板块中进行下载使用。