摘要:近日,出门问问(股票代码:02438.HK)宣布其语音大模型“序列猴子”成功获得上海市生成式人工智能服务备案认证,这一成就标志着该公司在多模态大模型领域的又一重要里程碑。
近日,出门问问(股票代码:02438.HK)宣布其语音大模型“序列猴子”成功获得上海市生成式人工智能服务备案认证,这一成就标志着该公司在多模态大模型领域的又一重要里程碑。
“序列猴子”语音大模型以出门问问自主研发的“序列猴子”大模型为基础,结合了第六代TTS引擎MeetVoice Pro和语音合成标记语言(SSML)技术,旨在提供多样化的文本与语音应用功能。该模型不仅具备将文字迅速转换为自然流畅的语音的能力,还包含了声音克隆、发音校正以及智能文案创作等创新功能。
其中,声音克隆功能通过深度学习训练语音样本,生成极具自然感和表现力的合成声音;发音校正功能则确保了语音合成的准确性,特别是对于发音不准或多音字的处理;智能文案创作功能则能够为用户提供多样化的文案改写建议,极大地提升了文案创作的效率。
出门问问旗下的“魔音工坊”(海外版为DupDub)是“序列猴子”语音大模型的重要应用之一。作为一款集文案、配音、剪辑于一体的AI软件,“魔音工坊”在国内外拥有超过800万注册用户,付费用户超过60万。该软件不仅具备软件配音、文字转语音、真人配音等传统功能,还引入了声音商店、效率工具、声音克隆及视频编辑等创新功能,并拥有声音克隆、声音搜索、情感合成/角色迁移以及声音合成等先进技术。
“魔音工坊”依托“序列猴子”大模型,仅需3-10秒的短音频即可实现声音克隆,并支持跨语言迁移和情感语气生成。其海外版DupDub还支持多语言生成,包括英语、法语、日语、西班牙语、葡萄牙语、泰语等多种语言。
出门问问自成立以来,一直专注于生成式AI和语音交互技术的研发,为全球多个国家和地区提供AI智能硬件、AI政企服务以及面向创作者的AIGC产品。该公司以“让AGI触手可及,让AI成为每个人的副驾驶”为愿景,致力于打造国际领先的通用大模型,并通过AI技术、产品及商业化的三位一体发展,成为全球AI CoPilot的引领者。
在内容创作者领域,出门问问通过AIGC技术赋能内容创作,构建了丰富的AIGC CoPilot产品矩阵。除了“魔音工坊”及其海外版“DupDub”外,还包括AI数字分身“奇妙元”及海外版“LivGen”、企业AI交互式数字员工生成平台“奇妙问”以及可一键成片的AI短视频生成平台“元创岛”等。这些产品共同打造了一站式内容创作平台,帮助创作者实现高效的内容生成。
在应用和大模型的垂直整合下,出门问问形成了独特的AIGC商业模式。相较于传统的ToB和ToC模式,AIGC公司可以形成服务SMB(中小企业)或Professional Consumer(专业消费者)的新商业模式。这种商业模式既避免了传统ToB的项目制模式,也避免了与ToC互联网巨头的流量竞争。
在“产模结合”战略和ToSMB/ToPC商业模式的指引下,出门问问的AIGC产品已经累计服务了超过1500万用户,注册用户数量超过1000万,其中付费用户数量达到约86.5万。公司成功地从传统的AI项目制模式转型为可持续增长的AIGC业务模式。
来源:ITBear科技资讯