煮酒言规 | 第166期 | AI法律检索如何减少幻觉

360影视 动漫周边 2025-04-07 12:25 2

摘要:数据合规是一个比较新的领域,很多问题都难以通过公开渠道检索到答案。此时,实务人士间的思想碰撞、交流就显得尤为珍贵。

煮酒言规

///////////////

数据合规是一个比较新的领域,很多问题都难以通过公开渠道检索到答案。此时,实务人士间的思想碰撞、交流就显得尤为珍贵。

• CONTENT •

「AI法律检索如何减少幻觉」

「小米公布车辆行驶数据是否侵权」

● AI法律检索如何减少幻觉

-问:元宝不开联网做个法律研究还有60分,开了联网就是负分,都被污染成垃圾场了。这一页5个案例,全是编的,100%的编造率。

-答1:同感,我试过perplexity和元宝都用R1,开联网搜索,结果差异很大,公众号内容现在AI生成的不准确内容过多了,模型还倾向于用有精确数值的内容,幻觉叠加了。还是用回DS官网吧,以后得加个选项过滤AI生成内容。换句话说,知识库的重要性就凸现出来了。

-答2:R1会编V3好一点,然后还有些参数要设置。RAG+RPA。

-答3:Grok的幻觉很轻,其次是Gemini和Claude,r1实在联网以后做境外检索感觉没几个真的。

-答4:元宝以前搜腾讯的内部规则和相关讨论很准确,现在一开联网就不行,个人感觉general的英文问题kimi比deepseek好用不少。

-答5:元宝的效果还行,但还是会比ds差,ds做了很多参数优化。专业性的东西不能用ai,巨坑,反而花了更多时间去验证来源。

-答6:多次体验到DS的深度推理能力一上来,容易变成一位重度话痨,简单的事儿说得特复杂、细节啰嗦一堆。对于专业用户而言,RAG限制一下基座模型的“放飞“能力,还是很重要的。

-答7:还是需要花功夫去校验AI输出的内容,发现好多次给我编国标和编案例了。

-答8:不是AI不能用,而是自己知识库+AI是现阶段正解,基本上知识库内搜索就幻觉很少。

-答9:除了自建知识库的积累,还有让大模型能快速读懂知识库、准确召回知识库片段、token消耗尽量少、前端体验好……这些也都是有开发工作的。在专业文献学习方面,很多基模能力表现还是没有足够好。

-答10:目前,大模型还停留在“人工苦力”阶段,擅长干“苦力活”,而不是“智力活”。降低预期就好了。不要想着一上来就替换谁。

-答11:就法律人使用知识库的场景,先体验一下这些灵魂拷问:

大模型“读取”用户知识库(用户本地的、未经版权人授权的内容),对版权人而言,是否落入其权利范围?

如果未生成侵权内容(假定已认定“侵权”),是否需要版权人授权?

如果生成侵权内容(无分享),是否构成侵权,以及,谁是责任主体、如何可以免责?

如果生成侵权内容且有分享,是否构成侵权,以及,谁是责任主体、如何可以免责?

总结:欢迎使用本公众号所有文章作为知识库+DeepSeek R1驱动的智能体:数据何规

● 小米公布车辆行驶数据是否侵权

-问:大家怎么看?小米抢先公布SU7事故车行驶数据,是否侵犯个人信息?

-答1:个人认为这算是为赋新词强说愁,不是真问题,算是拿悲剧事件开涮,可以先扒一下小米车机的用户协议。

个人信息处理者基于个人同意和合同处理个人信息的,在自然人死亡后,可以依据平台规则和与当事人的其他约定继续处理其个人信息。

张新宝,(一百)| 死者个人信息的处理与保护

-答2:广告主属于社交平台用户,理论上也是要标识的,平台也有识别义务。

-答3:我倒觉得这是一个真问题,如何处理车祸数据,谁有权处理,什么情况下能公开,厂家自己掌握的数据可信度有多少。我们做过一些这方面的研究,关于自动驾驶事故后的数据处理。

-答4:关键这些数据也不是行踪轨迹数据,只是车机系统的运行数据,很多还是自动运行的数据,关联说和识别说都靠不上去,文章里面说是行踪轨迹敏感个人信息。

-答5:不公布说是车企心虚,公布就说车企没个保意识,怎么做都要挨一刀,发的早就说“抢发”,发的晚就是没社会责任心,最后这个“不重视信息安全,和车祸同样可怕”结论不知道怎么得出来的,我是车企肯定选更多公众关切的透明度这边。

-答6:这个事故的焦点显然是产品安全/生命安全,位阶应当高于个人信息权益、隐私。个人信息安全不能说不重要,但在这个事故的话题下,似乎有点不合时宜或者跑偏了。

-答7:多一个合法性利益的合法性基础就好了。

-答8:压根就不是个人信息吧。

-答9:驾驶行为数据为啥不算个人信息,我觉得构成个人信息的原因是从关联说的角度来看的。如果要从识别说来看,单从驾驶行为很难推断出个人。EDPB把零部件磨损状态这种都算个人数据了。现在判断是否构成个人数据真的好抽象。

-答10:单数据无法关联和识别个人,且这样的数据可以当 syslog 看。

-答11:很多工况数据我觉得都不能算,车子场景太多了,你又没固定识别到人,主要还是针对,车主、司机不一定是一个人。

-答12:个人信息认定这么泛化的意义何在,又不是在欧洲。

-答13:欧洲是欧洲,根本不一样,欧洲注重网站的cookies,在中国可不是这么一回事。

-答14:很多我也觉得不算,但是监管现在怎么看啊,在车的场景。

-答15:是啊,实务中大家都体会过个人信息泛化的痛苦,但是监管又没有特别清晰的认定标准,所以有的时候只能保守了。

-答16:看场景吧,比如4S店的,相同数据在两个系统,不能都算个人信息。

我的观点:这个问题挺复杂的。一是车主和驾车人不一致的问题。个人认为,至少在涉案情况中,公布的相关数据不是车主的个人信息(类比手机借人之后的通话记录,肯定不是机主的个人信息)。小米汽车APP的隐私政策将汽车借用时提示阅读隐私政策的义务给到了车主。

事故发生时,时速为116km/h,我理解属于驾车人的个人信息,因为此刻驾车人对于小米是已识别的。

个人信息具有相对性,即对个人信息处理者而言,只要其已经识别、确定了特定个人的身份(已识别),或者具备识别、确定特定个人身份的能力(可识别),则与该特定个人有关的各种信息均应作为个人信息予以保护。

杨合庆:《个人信息保护法释义》

二是逝者个人信息保护的问题。驾车人已经不幸去世,所以其亲属可以根据《个人信息保护法》第49条行使删除权,要求小米删除相关已公开信息。

自然人死亡的,其近亲属为了自身的合法、正当利益,可以对死者的相关个人信息行使本章规定的查阅、复制、更正、删除等权利;死者生前另有安排的除外。

《个人信息保护法》第49条第1款

欢迎体验数据何规AI客服,可用特定关键词搜索历史问答。

来源:法律那些事儿

相关推荐