煮酒言规 | 第166期 | AI法律检索如何减少幻觉

摘要：数据合规是一个比较新的领域，很多问题都难以通过公开渠道检索到答案。此时，实务人士间的思想碰撞、交流就显得尤为珍贵。

煮酒言规

///////////////

数据合规是一个比较新的领域，很多问题都难以通过公开渠道检索到答案。此时，实务人士间的思想碰撞、交流就显得尤为珍贵。

• CONTENT •

「AI法律检索如何减少幻觉」

「小米公布车辆行驶数据是否侵权」

● AI法律检索如何减少幻觉

-问：元宝不开联网做个法律研究还有60分，开了联网就是负分，都被污染成垃圾场了。这一页5个案例，全是编的，100%的编造率。

-答1：同感，我试过perplexity和元宝都用R1，开联网搜索，结果差异很大，公众号内容现在AI生成的不准确内容过多了，模型还倾向于用有精确数值的内容，幻觉叠加了。还是用回DS官网吧，以后得加个选项过滤AI生成内容。换句话说，知识库的重要性就凸现出来了。

-答2：R1会编V3好一点，然后还有些参数要设置。RAG+RPA。

-答3：Grok的幻觉很轻，其次是Gemini和Claude，r1实在联网以后做境外检索感觉没几个真的。

-答4：元宝以前搜腾讯的内部规则和相关讨论很准确，现在一开联网就不行，个人感觉general的英文问题kimi比deepseek好用不少。

-答5：元宝的效果还行，但还是会比ds差，ds做了很多参数优化。专业性的东西不能用ai，巨坑，反而花了更多时间去验证来源。

-答6：多次体验到DS的深度推理能力一上来，容易变成一位重度话痨，简单的事儿说得特复杂、细节啰嗦一堆。对于专业用户而言，RAG限制一下基座模型的“放飞“能力，还是很重要的。

-答7：还是需要花功夫去校验AI输出的内容，发现好多次给我编国标和编案例了。

-答8：不是AI不能用，而是自己知识库+AI是现阶段正解，基本上知识库内搜索就幻觉很少。

-答9：除了自建知识库的积累，还有让大模型能快速读懂知识库、准确召回知识库片段、token消耗尽量少、前端体验好……这些也都是有开发工作的。在专业文献学习方面，很多基模能力表现还是没有足够好。

-答10：目前，大模型还停留在“人工苦力”阶段，擅长干“苦力活”，而不是“智力活”。降低预期就好了。不要想着一上来就替换谁。

-答11：就法律人使用知识库的场景，先体验一下这些灵魂拷问：

大模型“读取”用户知识库（用户本地的、未经版权人授权的内容），对版权人而言，是否落入其权利范围？

如果未生成侵权内容（假定已认定“侵权”），是否需要版权人授权？

如果生成侵权内容（无分享），是否构成侵权，以及，谁是责任主体、如何可以免责？

如果生成侵权内容且有分享，是否构成侵权，以及，谁是责任主体、如何可以免责？

总结：欢迎使用本公众号所有文章作为知识库+DeepSeek R1驱动的智能体：数据何规

● 小米公布车辆行驶数据是否侵权

-问：大家怎么看？小米抢先公布SU7事故车行驶数据，是否侵犯个人信息？

-答1：个人认为这算是为赋新词强说愁，不是真问题，算是拿悲剧事件开涮，可以先扒一下小米车机的用户协议。

个人信息处理者基于个人同意和合同处理个人信息的，在自然人死亡后，可以依据平台规则和与当事人的其他约定继续处理其个人信息。

张新宝，（一百）| 死者个人信息的处理与保护

-答2：广告主属于社交平台用户，理论上也是要标识的，平台也有识别义务。

-答3：我倒觉得这是一个真问题，如何处理车祸数据，谁有权处理，什么情况下能公开，厂家自己掌握的数据可信度有多少。我们做过一些这方面的研究，关于自动驾驶事故后的数据处理。

-答4：关键这些数据也不是行踪轨迹数据，只是车机系统的运行数据，很多还是自动运行的数据，关联说和识别说都靠不上去，文章里面说是行踪轨迹敏感个人信息。

-答5：不公布说是车企心虚，公布就说车企没个保意识，怎么做都要挨一刀，发的早就说“抢发”，发的晚就是没社会责任心，最后这个“不重视信息安全，和车祸同样可怕”结论不知道怎么得出来的，我是车企肯定选更多公众关切的透明度这边。

-答6：这个事故的焦点显然是产品安全/生命安全，位阶应当高于个人信息权益、隐私。个人信息安全不能说不重要，但在这个事故的话题下，似乎有点不合时宜或者跑偏了。

-答7：多一个合法性利益的合法性基础就好了。

-答8：压根就不是个人信息吧。

-答9：驾驶行为数据为啥不算个人信息，我觉得构成个人信息的原因是从关联说的角度来看的。如果要从识别说来看，单从驾驶行为很难推断出个人。EDPB把零部件磨损状态这种都算个人数据了。现在判断是否构成个人数据真的好抽象。

-答10：单数据无法关联和识别个人，且这样的数据可以当 syslog 看。

-答11：很多工况数据我觉得都不能算，车子场景太多了，你又没固定识别到人，主要还是针对，车主、司机不一定是一个人。

-答12：个人信息认定这么泛化的意义何在，又不是在欧洲。

-答13：欧洲是欧洲，根本不一样，欧洲注重网站的cookies，在中国可不是这么一回事。

-答14：很多我也觉得不算，但是监管现在怎么看啊，在车的场景。

-答15：是啊，实务中大家都体会过个人信息泛化的痛苦，但是监管又没有特别清晰的认定标准，所以有的时候只能保守了。

-答16：看场景吧，比如4S店的，相同数据在两个系统，不能都算个人信息。

我的观点：这个问题挺复杂的。一是车主和驾车人不一致的问题。个人认为，至少在涉案情况中，公布的相关数据不是车主的个人信息（类比手机借人之后的通话记录，肯定不是机主的个人信息）。小米汽车APP的隐私政策将汽车借用时提示阅读隐私政策的义务给到了车主。

事故发生时，时速为116km/h，我理解属于驾车人的个人信息，因为此刻驾车人对于小米是已识别的。

个人信息具有相对性，即对个人信息处理者而言，只要其已经识别、确定了特定个人的身份（已识别），或者具备识别、确定特定个人身份的能力（可识别），则与该特定个人有关的各种信息均应作为个人信息予以保护。

杨合庆：《个人信息保护法释义》

二是逝者个人信息保护的问题。驾车人已经不幸去世，所以其亲属可以根据《个人信息保护法》第49条行使删除权，要求小米删除相关已公开信息。

自然人死亡的，其近亲属为了自身的合法、正当利益，可以对死者的相关个人信息行使本章规定的查阅、复制、更正、删除等权利；死者生前另有安排的除外。

《个人信息保护法》第49条第1款

欢迎体验数据何规AI客服，可用特定关键词搜索历史问答。

来源：法律那些事儿

标签：法律 rag 幻觉知识库元宝

本文地址：https://news.43u.com.cn/a/1133223.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!

相关推荐