英伟达新ASR模型:1秒转录60分钟音频,字错率低至6.05% 英伟达近期震撼发布了其最新的自动语音识别(ASR)开源力作——Parakeet TDT 0.6B模型。这款模型在处理效率上实现了前所未有的飞跃,仅需短短1秒,便能轻松应对长达60分钟的音频文件,其速度较当前主流开源ASR模型快了整整50倍。 英伟达 音频 转录 asr asr模型 2025-05-07 20:32 3