人工智能与元宇宙产业委《元宇宙十大技术》培训班第106期:《AI后训练时代,如何建设高质量数据集》

360影视 欧美动漫 2025-06-01 06:45 2

摘要:2025年5月25日周日晚上八点,由人工智能与元宇宙产业委(“中国移动通信联合会人工智能与元宇宙产业工作委员会”的简称)指导,人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长叶毓睿创办的“燕园叶话”《元宇宙十大技术》培训班进行

人工智能与元宇宙产业委《元宇宙十大技术》培训班第106期:《AI后训练时代,如何建设高质量数据集》

2025年5月25日周日晚上八点,由人工智能与元宇宙产业委(“中国移动通信联合会人工智能与元宇宙产业工作委员会”的简称)指导,人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长叶毓睿创办的“燕园叶话”《元宇宙十大技术》培训班进行到第106期。微信视频号 乐生活与爱IT、央链直播、寇享学术、DOIT、零壹财经、iCloser社交元宇宙、卢米宇宙、察访区块链、web3马甲哥、上海创业导师、盘古智库、氦川科技、大江大湖大黄高、卢山说AI精进、凤岐茶社等媒体直播或转载。客座嘉宾高志讲解《AI后训练时代,如何建设高质量数据集》,本期超9382人在线观看。

燕园叶话欢迎大家一起打造AI培训平台,加入到这个AI全民科普计划(十个顶级专家,百个中高级的资深专家;千个甚至万个1~2层AI老师。无论是AI老师,或者需要培训的甲方,都欢迎和我私信联系、探讨。用Web3/DAO的方式,看看如何达成共识分润?

二、纪要

先分享几张讲稿截图

更多内容,可以观众公众号:乐生活与爱IT Plus,输入0525

超过下载期限,可订阅知识星球 “燕园叶话 资料和信息分享”

该知识星球还有100多份高质量文档,包括经授权的燕园叶话嘉宾原创的演讲稿70多份;价值上千元。后续将持续上传更多高质量文档;并且不定期涨价。
使用AIGC工具或平台帮助整理出的会议纪要如下:

高志老师分享总结:

数据范式革命

1、小样本学习+强化学习使千行百业数据价值指数级释放

2、医疗领域实现2000条高质量数据替代百万级原始数据

技术路径搭建

1、混合专家系统保证质量前提下降低模型尺寸,进而降低生产成本

2、指导员设计Reward Model通过强化学习方式降低标注门槛

3、开发端到端标注平台使医学数据标注效率显著提升

4、医学向量嵌入更高效率筛选标注数据集

产业生态重构

1、业务专家与AI模型专家的角色加速融合

2、新增"医学标注指导员"等跨界岗位,人才需求激增

3、医疗专业模型未来展望

圆桌讨论 - 思想碰撞出智慧火花

陈金雄(中国研究型医院学会医疗信息化分会副会长、IT value医疗分会会长、医疗信息化专家)

大模型兴起关键变量:能力跃迁,范式升级,交互变革,技术平权。

算法、算力、数据、场景、专家五要素:强调AI医疗需整合算法、算力、数据、场景和专家资源,尤其需以临床医生为核心。

模型边界与幻觉问题:医疗领域需明确模型能力边界,接受模型"幻觉"(类似医生误诊率)现实,着重控制应用场景在可接受范围内。

医疗数据治理挑战:不提倡强制医生结构化录入病历(破坏临床思维连续性),建议通过AI自然语言处理实现"人适应系统到系统理解人"的转变。

组织变革必要性:提出信息化需从"迎合"到"引领",通过本质需求+行政手段+标杆案例推动流程重塑,解决利益调整难题。

崔传荣(浙江省半导体协会副秘书长、人工智能和大模型专委会秘书长、硅基未来CEO)

技术落地需以用户感知为核心。

用户导向设计:技术需解决实际痛点(如自然交互提升体验),而非追求参数规模或技术术语。例如,通过AI优化病历生成流程,而非强制一线医生改变工作习惯。

价值即时体现:产品需立即为用户创造价值(如效率提升、成本降低),而非依赖长期愿景。例如,ChatGPT的成功在于“Chat”功能的直观体验,而非单纯的技术参数。

AI芯片与终端推理:关注国产芯片在终端推理(如手机、医疗设备)的应用潜力,推动低成本、低功耗AI硬件落地。

陈妍妍(华中科技大学附属同济医院大数据与人工智能办公室主任)

电子病历与数据结构化:主张放弃强制结构化录入,通过大模型实现自然语言到结构化数据的"翻译",减少医生负担。

临床需求导向:建议与大模型公司合作优化病历输入端设计,让医生专注于诊疗而非数据录入。

数据要素化争议:指出当前病历数据存在错漏,需通过统计框架设计适应大模型时代的数据特性。

张心程(上海医药协会医工转化协会专家委员)

药物研发与数据治理:利用大模型构建多模态药物数据库,加速临床试验和不良反应分析。

数据质量与统计创新:提出设计新统计框架应对大模型生成数据的不确定性,探索与监管机构的数据融合路径。

产学研合作:呼吁药企与医疗机构共建专病数据库,推动真实世界研究。

艾煜(太仓瑞鼎精密机械科技有限公司CIO)

制造业的严苛需求:生产环节要求超99.99%的准确性,AI主要用于研发设计知识库建设,而非直接干预生产流程。

数据隐私与供应链难题:企业对数据私有性保护需求极高,供应链数据协调困难,中小企业难以承担垂直模型开发成本。

异构数据与成本平衡:企业数据格式复杂(Excel/PDF/CAD等),标准化程度低,需通过小样本训练垂直模型,但需兼顾成本可控性。

FarMer

相当比例的传统媒体数据不可用于标注:功利性内容充斥伪专家观点,无法用于专业领域标注,极限思考,我们用广告内容当作产品描述文档,会出现多大的信息偏差和衰减(想下药品广告跟药品说明书之间的差距)。

在医疗数据的标注场景中,确有前面医学老师提到的,大量的“隐含计算”在医生的大脑中并行计算才能做出诊疗思路,因此这个关键过程的数据无法在事后阅读医案时获取,可以参考公文流转的思路,通过UI留痕来对医案的修改过程进行记录和分析,由此可以进行聚类等机器学习来获得在特定分类中医生的诊疗处置考量逻辑(隐含计算显化)。

这种做法的本质是引入差异分析,以撰写环节的服务来作为管理支点,相比传统的结构化输入,能获得更为充分的信息。

wolfram在《这就是chatgpt》曾把权重参数比喻为旋钮,显然医生修改动作是医案撰写中的关键旋钮所在,如果想获得高质量的、贴合诊疗底层逻辑的参数数据,对修改动作的信息获取就是重中之重,为了这个第一性目标,前端UI的操作设计要为数据专家的获取需求服务,操作流程可以围绕这个目标做重塑。

人工智能与元宇宙产业委《元宇宙十大技术》培训班第106期

第107期(2025年6月2日,周一20点)

请观众长期保存,如下的两种参会方式,其中腾讯会议的号码从2025年4月27日有所改变,以往的会议号作废。

1、腾讯会议:576-2467-9700 (密码: 230101)

2、 B站 http://live.bilibili.com/32509301

人工智能与元宇宙产业委《元宇宙十大技术》培训班是由人工智能与元宇宙产业委副主任委员兼联席秘书长、物链芯工程技术研究院元宇宙研究所所长、先进计算产业发展联盟智能计算组组长叶毓睿发起和创办的。叶毓睿长期关注区块链、VR/AR、AIGC、数字孪生、3D内容创作平台或规范(如Web3D、WebXR)等元宇宙等前沿技术领衔参与撰写的《元宇宙十大技术》一书系统地剖析了构成元宇宙的技术组成、原理、案例和未来趋势。他领衔并邀请了十多位领域的Top级专家撰写的《元宇宙十大技术》一书,系统地剖析了构成元宇宙的核心技术要点,该书得到了包括朱嘉明、肖风、姚前及四位院士等70多位资深专家的联袂推荐。 通过“燕园叶话”这个平台,叶毓睿希望能够推动元宇宙技术在社会各界的交流与普及。《元宇宙十大技术》一书为这个系列活动提供了理论基础和技术支撑。同时,叶毓睿还积极运用自己的人脉资源,邀请国内外元宇宙领域的专家学者前来主讲,保证了内容的专业性和前瞻性。截止2025年5月25日,已经举办了第106期,促成了不少合作,欢迎关注、转发。通过关注视频号 乐生活与爱IT,可以查看过往回放。

人工智能与元宇宙产业委《元宇宙十大技术》培训班目前主要以线上形式(腾讯会议+视频号)展开,并邀请了13+媒体伙伴们一起转播、转载,通常每次在线观看人数4000-41000不等,也是受访嘉宾及其所在公司的良好展示平台。该品牌系列活动的创办,是元宇宙产业委和叶毓睿推动元宇宙产业发展、促进元宇宙技术交流的重要举措之一。 《元宇宙十大技术》培训班的举办,是元宇宙产业委为推动元宇宙技术交流、促进产业发展作出的重要努力。通过持续邀请专家学者主讲,剖析元宇宙技术,和介绍应用场景或案例,使广大公众对元宇宙有了更深入的了解,也增强了对元宇宙发展的信心。可以预见,这一系列活动有望对元宇宙产业链培育人才、推动技术创新、规范产业发展起到积极的推动作用。我们期待它能够发挥引领示范效应,推动元宇宙产业健康快速发展。

来源:央链直播

相关推荐