摘要:在CSDN 2024中国开发者影响力年度评选中,声网的Conversational AI Agents凭借其卓越的创新性脱颖而出,荣获创新产品与解决方案奖项。不仅如此,在大模型之家2024年度奖项评选中,该解决方案同样备受瞩目,成功跻身优秀应用方案榜单。
在CSDN 2024中国开发者影响力年度评选中,声网的Conversational AI Agents凭借其卓越的创新性脱颖而出,荣获创新产品与解决方案奖项。不仅如此,在大模型之家2024年度奖项评选中,该解决方案同样备受瞩目,成功跻身优秀应用方案榜单。
声网的这套Conversational AI Agents解决方案还获得了业界的进一步认可,成功入选《2024年度软件和信息技术创新服务案例集》。该案例集由中国电子信息产业研究院旗下的赛迪网与《数字经济》杂志共同发起,彰显了声网在AI领域的深厚实力。
声网的Conversational AI Agents是一套功能强大的实时多模态对话式AI解决方案,它以语音为核心,并支持视频扩展,能够实现文本、音频、图像、视频等多种形式的组合输入输出。该方案凭借500ms的超低延时、自然拟真的对话体验以及灵活可扩展的框架,助力开发者与企业快速构建符合自身业务需求的AI实时语音对话服务。
在实时性方面,声网的这套解决方案展现了显著优势。通过客户端的低延迟音频采集和播放,结合声网自研的SD-RTN™实时传输网络,实现了全球范围内的低延时RTC传输,语音对话延迟低至500ms。同时,通过更快速的LLM推理首字耗时、低延迟流式TTS以及同机部署等技术手段,确保了对话的实时性和流畅性,使对话体验接近人与人之间的日常交流。
声网的AI VAD技术使得AI对话过程中能够随时打断,这成为衡量大模型智能化的重要标准之一。该技术能够适应人类对话的停顿、语气和节奏,确保AI在对话过程中能够灵活应对用户的打断和提问。
在音频处理方面,声网的解决方案同样表现出色。它具备业界领先的音频3A能力,即使在嘈杂的环境中,也能通过AI噪声抑制、背景人声过滤、音乐检测/过滤等算法,确保人与AI的对话不受干扰,始终保持顺畅。这使得AI能够更清晰地听到并理解人的话语。
声网的解决方案还采用了灵活可扩展的AI Agent架构,兼容市场主流的ASR、LLM和TTS技术。这一架构具备工作流编排能力,帮助开发者与企业根据特定需求定制和扩展AI驱动的实时互动体验。同时,该方案支持API快速调用,提供开箱即用的场景化Demo,最快3小时即可实现方案验证。它还提供了端到端SDK,适用于针对目标场景化业务开发的客户。
目前,声网已与国内外多家AI厂商展开合作,借助Conversational AI Agents帮助客户在智能助手、虚拟陪伴、口语陪练、语音客服、同声传译、智能硬件等多个场景中实现了对话式AI的落地应用。
来源:ITBear科技资讯