摘要:在春节假期期间,Deep Seek引发了社会各界的广泛关注。几位朋友纷纷向我询问对Deep Seek的看法,这促使我深入思考并分享我对利用GPT(Generative Pre-trained Transformer)技术的认识。
在春节假期期间,Deep Seek引发了社会各界的广泛关注。几位朋友纷纷向我询问对Deep Seek的看法,这促使我深入思考并分享我对利用GPT(Generative Pre-trained Transformer)技术的认识。
利用预训练模型创作效率高,但总感觉差了点什么?
事实上,在OpenAI备受瞩目时,我曾尝试使用OpenAI撰写了几篇文章。首先,我发现用OpenAI创作的文章阅读量竟然比我自己的文章还要高,这让我感到十分惊讶。然而,这些文章虽然内容详实、涵盖面广,通用性较强,但我总觉得它们缺少了独特的观点和深度。此外,虽然利用预训练模型准备资料确实高效便捷,但如果没有输入明确的观点,用预训练模型生成的文章往往会显得空洞,缺乏灵魂。
因此,在Deep Seek刚兴起时,我对它并不以为然。直到我了解到Deep Seek可以搭建本地知识库,并通过学习知识库中的知识来提升其创作能力。通过根据自己的知识框架对模型进行训练,再用训练好的模型进行创作,这样生成的文章才能更具差异性和深度。
知识架构对认知理解非常重要
不久前,我参与了一场关于“S&OP是计划还是流程”的辩论。其实,观点的差异很大程度上源于我和辩论对手在知识架构上的不同。我的辩论对手认为计划具有强逻辑性,我推测她可能将计划理解为ERP普及后,受ERP系统影响的软件系统的计划功能,这只是Planning概念的一个分支。
而我的知识架构则是基于APICS和SCOR框架的。APICS对Planning的定义是:为组织设定目标并选择各种方式来使用组织的资源以实现这些目标的流程。这个定义本身就包含了Process(流程)的含义,即制定计划的流程。而在SCOR早期版本中,供应链包含的26个流程分别属于计划、执行和使能三类。如果S&OP流程不属于计划,那么它就应该属于执行或使能类别。从这个逻辑出发,如果认为S&OP不是计划就不言而喻了。
如果GPT在训练模型时没有区分知识架构的重要性,当提供的多种知识架构中存在矛盾时,GPT输出的内容质量就无法得到保证。因此,我希望能够用自己的知识框架来训练模型进行创作,这样才有意义。
最近几天,我一直在努力搭建自己的本地知识库。可惜的是,docker+dify+deep seek的环境搭建过程并不顺利,花费了我两天的时间才终于搭建成功。今天早上,我终于成功搭建了AnythingLLM+deep seek的知识库。接下来,我计划在几天内将一些重要的供应链知识框架加入知识库,然后再利用Deep Seek创作内容,看看效果如何。
来源:许永硕