腾讯研究院AI速递 20241216

摘要:ChatGPT Projects是OpenAI推出的多功能协作平台,支持文件上传、对话管理、实时协作等高效工具;

生成式AI

一、 OpenAI Day7:发布ChatGPT Projects,万能工具箱上线

1. ChatGPT Projects是OpenAI推出的多功能协作平台,支持文件上传、对话管理、实时协作等高效工具;

2. 用户可自定义指令和集成网络搜索、Canvas等工具,增强工作效率和个性化需求;

3. 长期目标是发展为企业级应用,提供ERP和CRM等管理功能,扩展至企业用户。

二、 OpenAI Day6:OpenAI版「Her」满血上线,实时视频对话

1. OpenAI版「Her」全量上线,新增视频聊天、屏幕共享及圣诞限定圣诞老人语音;

2. 高级语音模式支持多模态交互,提供自然对话节奏和多语言情感表达,可用于教学与协作;

3. 然而,谷歌Gemini 2.0的实时AI功能被认为更先进,OpenAI在竞争中面临挑战。

三、 微软推出最新小模型Phi-4,训练新范式引热议:midtraining

1. 微软推出Phi-4小模型,参数仅14B,数学和编程能力上超过Llama 3.3和GPT-4o等大型模型;

2. Phi-4采用新的训练范式“midtraining”,提升了长文本处理能力,窗口长度可达16K;

3. 微软的midtraining通过引入长文本数据和对比学习方法,可显著提升模型推理、知识和编程能力。

四、 Pika 2.0 上线,核心亮点是图像到视频转换,实现多主体一致

1. Pika 2.0推出图像到视频转换功能,可根据图片和提示词生成无缝视频场景;

2. 模型特别适用于电商场景,能将服装、产品等照片与特定环境结合,生成高质量视频;

3. Pika 2.0提供模板功能,用户可轻松生成创意视频,但需要订阅PRO版才能使用。

五、 Google的NotebookLM大更新,新增互动功能,可中途打断

1. NotebookLM新增实时对话功能,用户可与AI主持人互动,提升学习体验;

2. 引入新的界面设计,包含来源面板、聊天面板和工作室面板,优化内容组织;

3. 推出NotebookLM Plus订阅和Agentspace平台,增强功能并支持企业级定制AI代理。

六、 谷歌首款MR眼镜:AI加持、比苹果眼镜轻、FOV更大、更便宜

1. Google与三星联合发布首款MR眼镜,集成强大AI功能并搭载Android XR系统;

2. 眼镜比苹果Vision Pro更轻,视场角更大,价格更具竞争力;

3. 通过与多家厂商合作,推动XR生态系统发展,挑战苹果和Meta的市场地位。

七、 OpenAI“吹哨人”疑似自杀,不到一个月前曾揭露ChatGPT黑幕

1. OpenAI前研究员Suchir Balaji去世,死因自杀;他曾揭露OpenAI在训练ChatGPT过程中违反版权法;

2. Balaji指控OpenAI未经授权使用大量互联网数据,损害企业和创业者利益;

3. 该事件引发公众关注AI公司如何使用数据,特别是对“合理使用”法律的争议。

前沿科技

八、 Meta黑科技:戴上腕带即可隔空打字,引领神经接口AR革命

1. Meta发布EMG腕带与Orion AR眼镜原型,实现隔空打字和手势控制;

2. 推出开源sEMG数据集emg2qwerty和emg2pose,提升姿态估计与手部动作识别;

3. 通过轻便设备和AI技术推动神经接口与AR革命,挑战现有市场。

报告观点

九、 大模型预训练时代即将终结!,AI巨佬Ilya最新顶会演讲解读

1. Ilya在NeuralPS2024演讲中断言大模型预训练时代即将终结;

2. 数据量增长停滞和数据资源有限是预训练终结的主要原因;

3. 未来AI将转向代理、合成数据、推理时间计算及生物学启示等新方法。

十、 Hinton:AI的发展应回归生物学;一定不要开放大模型源代码

1. AI的发展应回归生物学,结合现代基因工程技术,通过模拟神经网络的非线性特性,实现低功耗计算;

2. 大语言模型不只是“自动完成”,它们具备深层次的理解,通过特征和交互学习词汇的含义;

3. 不应开放大模型源代码,AI的智能和控制能力可能引发资源争夺和不受控制的风险,需谨慎管理。

来源:腾讯研究院

相关推荐