摘要:春节期间大火的DeepSeek让众多医疗BD人士担忧自己的工作未来有一天是否会被AI取代。如果不能通过AI辅助自己工作的人,在未来很可能会被迅速淘汰。一名优秀的BD如果能熟练掌握各种AI平台,在有效增加自己效率的同时,还可以拓展很多之前不熟悉的工作类型和种类。
//
对于医药BD人士,AI不仅是一款有用的工具,更是一种思维方式。熟练掌握大模型将是未来医药BD人员必不可少的技能之一。
撰文|雅法资本 张艺林
春节期间大火的DeepSeek让众多医疗BD人士担忧自己的工作未来有一天是否会被AI取代。如果不能通过AI辅助自己工作的人,在未来很可能会被迅速淘汰。一名优秀的BD如果能熟练掌握各种AI平台,在有效增加自己效率的同时,还可以拓展很多之前不熟悉的工作类型和种类。在此,笔者想抛砖引玉,就市面上比较有代表性的几个模型如何在日常工作中,帮助大家完成BD进行对比。
模型对比,到底该选谁?
OpenAI
作为最老牌的AI平台,OpenAI在DeepSeek出来后一度被疯狂看衰。但经过不少实测,OpenAI还是有很多优势:首先是其异常强大的平台DeepResearch以及Operator,代表着目前所有模型里最强大的链式推理能力。
如下图,最近推出的Operator甚至可以替代秘书,帮助你订机票、预定餐厅、网购等。其实ChatGPT在刚上市的几个月内,在Github上就有叫AutoGPT类似链式推理模型工具。
OpenAI最大的挑战是价格昂贵,同时其O1模型没有长期记忆功能,且由于是闭源模型,无法本地或云端打造O1智能体,要使用DeepResearch+Operator需要注册其Pro用户,每个月200美元的价格会直接劝退很多“AI小白”。如果想要类似DeepResearch这样长链推理的能力,也可尝试Grok3模型,在多项LLM测试中,Grok3都跑赢了O1,同时也不需要高额费用。
Claude
亚马逊的Claude是笔者在DeepResearch和DeepSeek出现前最喜欢的平台。Sonnet 3.5模型有着强大的科研理解能力,虽然无法联网,但其内部数据库的医疗成本和数据预测极为精确,做出的模型相当准确。Claude由于没有内置的链式联网模式,导致其编程能力对比其他两个模型较差,在Cursor编程中经常出现bug且无法自我修复。而且对中国用户较为不友好,对中文理解能力不高的同时,对所有国内用户也会经常性查封。
DeepResearch
DeepResearch具备与O1模型相媲美的推理能力,同时其API价格是几位国外竞争对手的1%以内。但由于访问量太大,目前官网的API已经暂时无法使用。需要通过腾讯元宝、纳米AI、 阿里云等国内云计算平台来访问“满血版”的DeepResearch,或者部署相应的API服务。
DeepResearch有着最强的中文理解能力,可以联网进行非链式的总结性查找,对比Claude、GPT这样的强伦理模型,DeepResearch对于隐私认知比较奔放,可以协助企业查询客户查找等海外模型无法完成的工作。
由于本身是开源模型,能直接定制DeepResearch模型在本地或云端,并将企业的大量数据输送给它,保持企业数据安全的同时也可以享受具有长期记忆的DeepResearch大模型,其对企业情况的了解是网页版或API版本无法比拟的。
入门版
很多时候,BD去调研海外竞争对手的数据或一些潜在新靶点,传统的资源挖掘者在没有付费数据库的情况下就是Google+Pubmed相结合的形式做大量案头工作。这里AI基本可以完全平替传统案头调研,我们只需要知道一个准则即可:如果过于宽泛,AI在回答开放式问题式的准确度会显著降低。举个例子来说,回答“2025年最好的创新药资产”的准确性
这是因为,首先AI对于好的定义是不知道的,所以一定要给它一个可以明确的定义,如OS数据提升对比SOC最高、开发速度最快等;另一个就是避免Scope过大,最好限定治疗领域、靶点、开发进度等等。这里就需要BD人员对行业有着深刻的行业,AI对经验丰富的BD可以帮助他提升早期调研的效率,但如果对行业毫无理解,单纯通过AI无法找到合适的答案。
这里笔者想着重说一下DeepResearch,这个是OpenAI的链式推理平台,可以直接联网。目前它主要可以接触的数据还是Google可以查到的开放数据为主,而且准确度极高,也就是说,对于已经进入临床试验阶段的海外公司的数据,DeepResearch有比较高的准确度和效率,但对于“水下企业”是无能为力的。DeepResearch无法上载文件,只能通过文字描述需求,大家可以通过R1或O1直接把PDF或者WORD文档的信息进行文字结构,然后给到DeepResearch进行调研。
例如,我帮助母亲撰写一篇神学论文,由于神学几乎所有的数据都是开源的,导致DeepResearch的效率非常高。
在DeepResearch开始调研前,它几乎都会再次确认一些问题,帮助更好的定位你的需求。然后模型就会开始工作,在5~30分钟左右的时间就会完成调研,期间你可以挂机去做别的事情。对于严肃的学术工作,reference也是必不可少的。
如果要调研配套的资料非常多,一个PDF无法解决,这里可以在Claude或者GPT的项目栏创建一个项目,项目可以上传非常多的文档,这些文档在AI做分析时都会被引用和考虑进去,增加context的准确性,但在GPT里项目栏是无法访问最高级的推理模型DR的 ,在Claude中则没有这方面限制,所以推荐大家在背景文档较多的时候选择Claude进行初步分析。
在调研完以后,很多时候BD需要对市场进行预测,这里也可以借助DeepReseacu来完成。首先,可以在任意平台上传你想预测的资产信息,然后让AI进行文件的文字解构,主要包括资产的数据,适应症以及进度,然后在让输入这些信息给到模型,要求输出一个rNPV模型以及所有的假设和参数,这里面所有的参数如果不确定,可以让DR单独调研,比如“非小细胞肺癌在美国的年治疗费用” “前列腺癌在欧洲的病人数量” “ADC GLP毒理实验成本”等等,确保所有的参数都有较好的数据支撑,然后让AI通过VBA的形式直接输出模型并在Excel上录入这块VBA代码,rNPV模型就可以完成了。
AI 进阶版
这里大家可以明显发现网页版的调研,哪怕是最贵的DeepResearch也有很多限制,包括无法访问付费数据库、无法上传文档、没有记忆等等问题。如果仅仅是单人访问,或者对应的文档和数据比较小,可以通过GPT和Claude的项目功能解决。但如果访问人数众多,数据背景巨大,可以通过一定的编程或者本地化部署来解决问题。有医疗内容作为背景数据的智能体的公司,最近也在一级市场大放异彩,数家公司都有千万级别的融资。但搭建一个丐版的医疗AI智能体,其实都不需要花钱,也不需要大家有高级编程背景。
这里我推荐大家还是尽量采用云计算的方式而不是本地化部署,本地化除非有非常强大的设备,单纯的笔记本和台式机只能跑得动参数最少的DeepSeek,智能程度和网页版差异太远。
本地化部署
但如果大家来自于预算充足的大型企业,当然可以尝试本地化部署,只需要去Github上下载DeepSeek模型https://github.com/deepseek-ai/DeepSeek-LLM, 然后去HuggingFace下载模型参数https://huggingface.co/deepseek-ai/DeepSeek-V3,通过AI编译软件Cursor(如果有编程背景,可以试用ANACONDA)对上述部署步骤的指令的编程,这里需要大家有一定的技术理解,包括CMD命令行调用的基础功能。
更简单的方法,对于毫无电脑背景的可以用Ollma(https://ollama.com/),安装成功后在CMD直接输入ollama run deepseek-r1:1.5b命令,下载最简单的DS参数模型,当然如果设备足够强大,也可以提高参数数量。然后下载软件AnythingLLM(https://anythingllm.com), 这个软件可以把我们的PDF文件这样的数据变变为RAG(Retrieval-Augmented Generation)数据,由于下载了DS模型,可以在AnythingLLM的UI中选中DS并上传文件,目前测试支持的文件有PDF, txt, csv, excel, 音频。上传完毕后就可以让文件转移为向量数据。然后就可以在AnythingLLM里面直接询问DS刚才你上传文件的相关内容,模型就应该已经对你的数据有更深的理解,也会基于你的数据智能分析回答问题。
(截图来自腾讯云分享)
云端部署
当然,最简单的办法可以去目前主流的云计算平台,包括阿里云、腾讯云、华为云,都有现成的RAG+DS解决方案,这里我们以腾讯云为例:
如果不知道选择哪个,可以把你的需求和预算直接告诉DeepResearch,他的决策会更专业。如下图,可以通过网页直接进入云DeepResearch 点击窗口里面的Anythingllm就可以和本地部署一样上传你的数据了,如果你的云部署只是一个人使用,且使用频率不大,甚至可能不需要支付计算费用。但效果却比本地部署在普通办公用电脑的效果好得多。
在DeepSeek出现后,其实LLM大语言模型的搭建本身已经没有任何成本。而搭建一个优秀的智能体的核心还是结构化数据体量的大小,毕竟后端不管是模型的fine-tuning调参还是大语言模型本身的革新,都会由云计算公司或者LLM公司直接解决,开源的模型成本低廉而云计算的成本对比传统人力也是相对便宜,那么本身具有庞大embedding数据的大型药企将拥有大量临床/临床前数据,类似于医药魔方/IMS这样的数据公司拥有大量的管线数据,而药明这样的CDMO公司有大量的分子数据,都可以利用智能体有效提升公司的内部效率,而医药数据本身极度缺乏公司间的互通性,也不开源,也没有点对点的数据接口,所以未来可以预见会出现结构化数据的军备竞赛,甚至不排除腾讯这样的云计算公司直接推出的垂直解决方案,毕竟对于TMT巨头这些子领域的数据获取成本与算力投入来对比不值一提。
总结:
我们从网页版的GPT、DeepSeek、Claude的应用,以及本地化部署和方法都初步做了一些总结,由于医疗数据本身有较强的隐私和封闭性,推荐大家学习如何系统的做好本地化/云端部署,让大模型更好的服务于团队以及公司。
对于医药BD 人士而言,AI 不仅是一款有用的工具,更是一个思维方式——如何高效检索并分析信息,如何用数据支撑商业决策,如何拓宽自身能力边界从而占据行业先机。无论从个人角度快速完成案头调研,还是团队层面部署智能体进行深度分析,熟练掌握大模型都将是未来医药 BD 人员必不可少的技能之一。
希望本文能帮助更多 BD 同行快速上手并不断探索 AI 带来的新机遇,真正发挥“人机协同”的最大价值。祝各位在新的医疗商业竞争中脱颖而出,持续为企业和行业创造更高价值!
张艺林(Peter Zhang), CFA | 雅法基金合伙人,毕业于美国伊利诺伊州立大学香槟分校,长江商学院FMBA,曾任曾任上市公司百普赛斯CVC投资总监,先后在费森尤斯卡比、贝朗、诺华、安图生物担任市场营销和BD工作,拥有丰富的中国医疗行业商业化经验以及产品引进BD经验。
总第2374期
访问研发客网站,深度报道和每日新闻抢鲜看
来源:研发客