TeleAI 李学龙:当梦想照进现实,AI 正当时

摘要:昨日,“TeleAI 开发者大会2024”在广州成功举办,汇集了从个人到企业、高校、科研院所等各领域的开发者,齐聚一堂,共话人工智能的发展趋势和探索方向。

昨日,“TeleAI 开发者大会2024”在广州成功举办,汇集了从个人到企业、高校、科研院所等各领域的开发者,齐聚一堂,共话人工智能的发展趋势和探索方向。

中国电信集团 CTO、首席科学家、人工智能研究院(TeleAI)院长李学龙教授以“当梦想照进现实”为主题,为现场及线上观众带来了一场精彩的 AI 创新前沿分享。

开场白

“人人有梦想,企业有追求,国家有希望,我们发展人工智能,将三者的梦想串联。”—— 李学龙

TeleAI 开发者大会2024 不仅是中国电信人工智能研究院携手中电信人工智能科技有限公司第一次举办的开发者大会,也是央企首次举办的人工智能开发者大会。

李学龙教授谈到,提起开发者,能够感受到一种魔力,一种身份的认同,因为开发者是科技时代的使用者和创造者,它背后是一种想象,一种创造,也是一种表达。

有了想象,可以把想法付诸于现实、开始创造和技术落地。因为创造,“从前车马慢”的年代到现在的“万物智联”,这百年通信的变迁背后无一不是人类想象力的推动。 作为央企先锋,中国电信决心把人工智能发展融入未来业务,在人工智能的舞台上继续书写属于自己的“创造”。

有了大胆的想象、务实的创造,还需要有表达。TeleAI 的每一项研究、每一个产品、每一支团队,都有属于自己表达。

TeleAI 的身上既有责任,又有使命。而今天的开发者大会,是关于开发者的表达,是 TeleAI 的表达,也是中国电信的表达。

01 人猿揖别

“从智人、到机器、到智能,每一次进化,每一次重构,都是挑战和发展。”—— 李学龙

在人类历史的漫长变迁中,经历了从人猿时代到农业革命、工业革命,再到如今的 AI 时代。

智人在早期磨石头,也是有意识地在进行生产工具的开发和改造。弹指千年,人类靠着探究本源、预测未来、明辨虚实走到了现在。如今,创新的范式也在发生根本性变化。

李学龙教授就 AI 的本源、发展、价值和安全,与观众提出了三个窥探 AI 如何影响人们未来发展的“灵魂之问”。

Q1:AI 有生命力吗?它是否能够像人一样感知现实世界,进而改变人类的理解和交互方式?

认知计算是一个70年代在心理学就被提出的概念,而现在几乎所有多模态的工作都在讨论认知计算。其实早在2003年,李学龙教授就第一次把心理学的概念引入信息领域,让“认知计算”(Cognitive Computing)在信息领域开始扎根。

2022年7月,他的一篇论文《多模态认知计算》被《中国科学:信息科学》接收,探讨了如何让机器像人类一样智能地感知周围环境并做出决策。在 ChatGPT 爆发前,这篇工作预测了多模态认知领域发展会有无限延展性,必将带来巨大的想象力。

Q2:在 AI 世界里,眼见为实吗?在我们着眼“去噪”的时候,噪声都是有害的吗?

在视觉方面,视觉图像作为非常重要的领域被业内一直关注。而李学龙教授的另一项工作——正激励噪声(Pi-Noise)则让“非好即坏”的定义变得模糊。

他介绍,在信息处理中,有些“噪声”在不同的场景下能发挥积极作用,在对图像加入适量的噪声时,识别准确率不降反增,图像分类准确率随图像含噪率的变大“先增后减”。

这一现象启发了他和团队重新审视对待噪声的方式。AI 技术的发展也是如此,需要辩证的眼光、批判的思维,才能获得意想不到的收获。

Q3:AI 可信任吗?为什么 Prompt 是一样,生成的结果却可能千差万别?

当讨论 AI 的感知和对视觉的处理,最重要的一点就是要了解它的运作原理。就如同人类模仿飞鸟发明了飞机,但飞机为什么不用扇动翅膀?大模型不知道自己怎么做才是对的,那该如何量化这种边界?或应该由谁来量化?

李学龙教授和团队进行了思考,并发表了题为《人工智能伦理计算》的一篇文章,尝试建立 AI 伦理的定量计算框架,也希望能够引发更多关于人工智能伦理的思考。 他表示,不管是认知、生成、还是 AI 安全,在 AI 领域,还有太多值得我们关注和讨论的问题,我们还处于对 AI 的观察、归纳和探索,AI 的发展还不可预测。AI 不是行业,也不是模型,更不是单一产品,它是千行百业的赋能者,是未来十年技术发展的底层逻辑。

02 星火燎原

“一家企业的力量是有限的,我们需要更多开发者伙伴共生共建,众人划桨开大船。”—— 李学龙

依托中国电信强大的央企平台和资源优势,TeleAI 充分发挥在人工智能领域的主力军作用,结合在全球的生态网络布局,把科技创新融刻在企业基因,发挥央企科技力量。

在实践层面,中国电信把握人工智能发展方向,已完成“1+1+1+M+N”的人工智能总体布局,既包括坚实的数据与算力基础,也涵盖通用大模型与行业特定大模型的多元发展。

为了更好地归纳在不同领域中 AI 驱动经济发展的形式,李学龙教授提出了 AI 驱动的“三大空间经济”宏伟蓝图,基本囊括了人类活动的全路径。

赛博空间:和人们的生活息息相关,聚焦于智能基础、网络服务,及家庭和个人生产生活。

临地空间:从地表与海平面以下100米到地面以上1000米的核心区域,纵横交通、低空经济、城市安防都在这里展开。

广域空间:包含深空、深海、应急等诸多领域,可极大拓展人类生存与生产活动的边界。

中国电信强大的天翼云、骨干网和卫星通信技术,正是三大空间经济不可或缺的强力载体。而在不同空间里,每一项领域的应用和技术发展都少不了人才的支撑。

目前,TeleAI 已形成稳定的人才三角布局,包括围绕产学研生态的内层小三角,连接亚太区的中三角,和着眼于国际化的大三角,互相支撑,保持稳定。

TeleAI 还打造了“三级四类”创新型人才组织,并探索单聘、双聘灵活用人制度,构建了 AI 人才的海内外双循环体系,既能把人“引进来”,也能“走出去”。

李学龙教授指出,“我们需要想的深、看的多、走的远,只有真正有多元视野和实践的人才,才会在一次次历练中飞快成长,真正做到聚天下英才而用之。

03 问苍茫大地

“大地是基础,是根本,是底座。合抱之木,生于毫末;九层之台,起于累土。”—— 李学龙

“三全”大模型体系

就在 TeleAI 开发者大会当天,TeleAI 正式发布首个由央企全自研的视频生成大模型,标志着星辰大模型体系进一步完成了全模态能力构建。

全模态:提供全模态大模型基座,包括语义、语音、视觉、多模态全方位能力。

全尺寸:作为央企唯一开源的大模型,实现十亿级、百亿级、千亿级参数模型的全尺寸覆盖。

全国产:完成全国产化万卡万参大模型训练;从底层架构到上层应用全面国产化,为开发者们提供安全可靠的研发环境。

“三座”AI 开放平台

星海 AI 中台:TeleAI 为开发者们精心打磨的一把“利器”。

基于星辰大模型体系的全模态基座能力,星海 AI 中台能为开发者带来从数据标注、模型训练、模型调优、模型加速和按需部署的一站式端到端模型开发体验。同时,平台还提供了零代码建模工具,让开发者能够轻松搭建起自己的 AI 模型,大大降低开发门槛。

天翼 AI 开放平台:开发者利器在数字世界里留下的深刻“痕迹”。

为了给开发者们提供便捷的能力上架和调用服务,天翼 AI 开放平台将自研能力和通过 AI 台研发的能力一键式快速上架,同时也提供弹性扩缩容机制,可根据服务调用量为开发者提供稳定的服务。

“党建公文大模型”通过多种安全策略,能够保障公文写作的表达正确、常识正确和意识形态正确无误。

“超大表格分析和理解通用引擎”可对50个长达一百万行的表格进行全局理解并高效生成报告,目前已在中国电信各省公司推广应用。

“软件工厂”构建了软件开发的全自动流水线,只需简单撰写产品文档,甚至画一张草图,就可以自动生成代码,并在软件工厂内一键部署上线,让人人都能开发自己的 APP。

“语音理解和生成”支持40种方言自由混说,让每一种乡音都能在数字世界中自由流淌,被听见、被理解、被铭记。

“TeleSearch 2.0”是基于知识驱动的万物布控技术,支持上百个专业动态知识挂载和行业事件认知,实现跨模态复杂语义准确理解及超万种目标精准检索。

“视频生成技术”首创二阶段生成架构 VAST(Video As Storyboard from Text),为短剧和影视创作者提供一站式服务,一键生成剧本,通过输入一本小说就能生成一部电影。

星辰智能体平台:连接现实与数字世界的“桥梁”。

智能的未来不应仅停留在软件层面,而是应该深入到人们生活的每一个角落。TeleAI 自主研发的星辰智能体平台,能够实现一站式智能体的开发、应用和运营,还能进行海量信息的定制化自动获取与交互。

“三智”前瞻布局

从人形机器人的灵巧操作,到四足机器人的稳健步伐,从双臂机器人的精细协作,到水下机器人的深潜探索。每一个智能体,都是我们与世界对话的使者,它们将智慧的光芒洒向每一个角落。

同时,TeleAI 也在推进 AI 眼镜的研发,通过语音交互,可以拍照、录制视频、播放音乐、拨打电话等等。

而这一切,都得益于可穿戴 AI 设备与智能光电技术软硬件的完美结合。这些技术不再只是代码和复杂的算法,已经融入我们的日常生活,成为我们身体的一部分。 在光动无人机方面,通过高能激光器为远距离无人机提供能量补充,将光能转化为电能,使无人机能够长时间作业。

在大模型异构智能体领域,能够跨平台、跨领域协同工作,实现信息的无缝整合与智能决策。

四足机器人平台也是智能光电的重要的实践和应用场景。

无论是机械臂、机器狗,或是无人机,每个硬件都可以携带一个端侧大模型,但到底需要多大能力的大模型,并没有确切答案。

好比一支智能导盲犬,当它来到人群密集环境复杂的场景,导致其端侧大模型能力无法满足处理需求时,就需要从其他地方获取更强或能解决当前问题的智能能力。

算力可以像自来水一样流动,打开水龙头即可获取,但是智能不行。当端侧需要请求一种更强的智能能力时,就需要一项更前瞻的技术——智传网(AI Flow),这也是 TeleAI 正在布局的重要研究方向之一。

智传网,就是在人工智能时代,让智能穿梭于各个场景与用户之间,使智能不被特定的设备或平台所限制。

对于智传网,李学龙教授强调了三个概念:

第一,大小模型协同。智传网需要一系列具有同源性、家族式的模型体系,而非简单的一堆大小模型的组合。这些模型之间能够实现相互的向上与向下兼容,以协作的方式共同完成任务。

第二,模型之间的连接与涌现。智传网中的模型通过连接与交互,能够产生出超越单一模型能力的智能涌现。这种涌现,不仅仅是数据的涌现,而且是智能的涌现,更是连接的涌现。数据可以堆出智能涌现,连接和交互也可以堆出智能涌现。

第三,大模型可以复刻。通过蒸馏等技术,将一个参数量庞大的大模型剔除一些无效参数,就能复刻出一个更加精炼、与之同源、且不断成长的另一个大模型。

当智能可以通过连接实现更大的涌现,网络就变得至关重要。这正是中国电信作为运营商,发展智传网的最大优势所在。

李学龙教授表示,智传网将为 AI 的发展注入强劲的动力、无限的空间、无限的想象,为未来网络基建和利用开辟新的道路。

结束语

“也许我们不知道现在的研究会在未来带来什么价值,但科学发展是连续的,科学技术突破的接力需要一代一代的科学家、开发者、创造者,来传承科学探索的精神和意志。”——李学龙

人工智能不仅是一项技术、一个产品、一个生态,它也是科技发展和人文关怀,更是一个国家、一个社会实现快速发展所需的新基石、新视野和新边界。

TeleAI 在做的是核心小事、战略大事,深知还有很多技术要攻关,很多产品要迭代,很多进程要追赶,正如"路漫漫而其修远兮,吾将上下而求索"。

李学龙教授表示,今天是中国电信集团的第一次 AI 开发者大会,希望留在大家心里的不仅是产品的特色、数据的突破、平台的生态,最重要的是想象的创造,和背后是我们共同的信念!

这个信念,是“携手合作,美美与共”的同心同行,是“不破楼兰终不还”的发展决心,是“千磨万击还坚劲”的勇往直前。

来源:TeleAI

相关推荐