摘要:这是摄影师在2024数字科技生态大会展览现场捕捉的瞬间。照片里是中国电信人工智能研究院(TeleAI)展示的智能人形机器人,它正从花瓶中拿起一支鲜花,准备赠送给面前的观众。
赠人玫瑰,手留余香。
这是摄影师在2024数字科技生态大会展览现场捕捉的瞬间。照片里是中国电信人工智能研究院(TeleAI)展示的智能人形机器人,它正从花瓶中拿起一支鲜花,准备赠送给面前的观众。
在本次展会的“人工智能生态展区”,有许多来自 TeleAI 的前沿创新技术:
有从科幻小说里走出来的机器人、机器狗;有分钟级生成、栩栩如生的数字人分身;有一键生成短剧的视频生成大模型、全自动流水线开发软件的软件工厂;还有戴上就能听懂指令的 AI 眼镜......
打开赛博空间的大门
初进 TeleAI 的展台,仿佛来到了科幻的世界:穿着黑衣的人形机器人、蹦蹦跳跳的四足机器狗、一只疯狂抓瓶子的机械臂,还有一个萌萌的会给小朋友金币的“星小辰”。
智能人形机器人
穿着黑衣的是 TeleAI 面向家庭场景打造的智能人形机器人,通过自然语言描述给出指令,它可以挥手、打拳、敬礼,进行一系列运动控制。
还能倒水、浇花、拿纸巾、擦桌子、把水瓶放进篮子、把网球装进球桶等等,通过双手进行一系列家务操作。文章开头的“赠花”就是出自它的“双手”。
在 TeleAI 人形机器人的背后,是以大语言模型为基础对指令进行理解,并通过动作扩散模型生成运动数据,通过动作评价模型进行保真度约束,使其掌握多样的行为技能。
TeleAI 自行搭建的跨平台遥操作系统还能通过手臂外骨骼运动学解算,捕捉手腕位姿,利用相机进行高精度手势识别,实现人形机器人精确控制。
智能服务机器人
机器人的应用空间非常广泛,TeleAI 还研发了一个萌萌的智能服务接待机器人,名字叫做“星小辰”。
依托星辰语音、语义大模型的基础能力,星小辰可以与现场观众自由对话和交互,准确识别用户的意图,从而触发纪念币发放、AIGC 等特色体验功能。
智能机械臂
在展台的另一侧,一只灵巧的机械臂正在抓取各种不同的饮料,并递给面前的观众。
这是 TeleAI 面向无人售货场景研发的智能系统,融合了语音识别、语义理解、视觉识别等多种大模型能力,能够准确理解用户意图,并进行高效沟通和全自动定位抓取商品。
智能机械臂的应用场景非常广泛,除了无人售货,还能进行远程医疗、流水线装配、物流递送等各种复杂操作。
智能机器狗
在机械臂展示区的旁边,有一个备受关注的“小家伙”。它时而蹦蹦跳跳,时而追着面前的观众,时而挥挥前爪,时而趴下打个盹。
这个小家伙就是 TeleAI 专为视障人士设计的智能导盲机器狗,它能够识别并感知周围环境,同时提供导航服务,确保用户顺利到达目的地。
同时,TeleAI 的智能机器狗还配备了语音模块,能够与用户实时交互,通过语音清晰地反馈相应信息,提升沟通效率。
有意义的是,一位视障来宾牵着一条现实世界的导盲犬与 TeleAI 的智能导盲机器狗同框,它们似乎在“交流”如何更好地服务有需要帮助的人类。
摄影师捕捉的这一幕画面,仿佛打开了赛博空间的大门,让虚拟与现实,科幻与未来,离我们越来越近了。
智能眼镜
当虚拟与现实被连通,还需要一个载体可以让人们与之交互。TeleAI 在此次展会上秀出了最新的智能眼镜研发成果。它采用了多种尖端技术,将语音助手、高清摄像头与多模态大模型集成其中,并与手机无缝连接。
戴上这款智能眼镜,用户无须掏出手机,只要呼唤“小辰,小辰”,就能通过语音与之方便自然地交互,直接用眼镜打电话、发短信、查天气、放音乐、做翻译、拍照片、录视频......
基于星辰大模型的基础能力,“小辰”还可以帮用户识别和讲解面前的物体或场景,比如博物馆中看到的有趣展品、旅游途中经过的名胜古迹。
数字人
进入虚拟世界,我们还需要一个专属的数字分身,不仅能够复刻形象,还能复刻声音。TeleAI 的展台上还有一个“迷你录影棚”,现场观众在此录制一段10秒的视频和5秒的音频,就可以快速复刻出自己专属的数字人。
随后,复刻出的数字人形象还可以通过现场的大屏进行实时交互。TeleAI 的数字人技术支持 2K 超高清呈现,动作自然流畅,面部表情准确自然,音色高度还原。
大模型基础保障
这些智能应用的背后离不开 TeleAI 星辰大模型的强大技术能力。就在12月3日举办的 TeleAI 开发者大会上,TeleAI 正式发布首个由央企全自研的视频生成大模型,并为开发者带来三座开放平台。
在数字科技生态大会的“人工智能生态展区”,这些创新的大模型基础能力和开发平台也与现场观众正式见面。
星辰大模型体系
就在数字人的大屏幕上,TeleAI 展示了全自研的星辰大模型体系,包括语义、语音、视觉、多模态等各项能力。
TeleAI 的视频生成大模型原创打造了 VAST 二阶段视频生成技术,先画分镜,再生成视频,能够显著提升短剧创作过程的可控性。
在展台现场,TeleAI 就播放了这段在发布会上的演示视频,吸引众多观众驻足围观,极具电影大片的震撼感。
TeleAI 视频生成大模型在权威视频生成评测榜单 VBench 中排名第一,大幅领先第二名。
视频生成大模型的发布,标志着星辰大模型体系进一步完成了全模态能力的构建。
三座开放平台
星海 AI 中台、天翼 AI 开放平台、智能体平台是 TeleAI 为广大开发者们打造的利器,也是链接现实世界与数字世界的桥梁。
展区现场,也分别展示了各个平台的核心能力。
今天,数字科技生态大会落下了帷幕,但是 TeleAI 的创新还在继续。
正如中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授在 TeleAI 开发者大会2024 所讲的:
“希望留在大家心里的不仅是产品的特色、数据的突破、平台的生态,最重要的是想象的创造,和背后是我们共同的信念。这个信念,是‘携手合作,美美与共’的同心同行,是‘不破楼兰终不还’的发展决心,是‘千磨万击还坚劲’的勇往直前。”
数字科技生态大会,明年见!
来源:TeleAI