DAILY LESSON / 2026-01-30

律师如何用AI解决判例引用幻觉问题

今天有位律师朋友问了我一个很实际的问题,用Gemini分析案件时,模型总是引用一些根本不存在的判例,这该怎么办?

AI编程法律SkillAI智能体AI知识库创业超级个体变现

作者:C 哥·C哥介绍 →

今天有位律师朋友问了我一个很实际的问题,用Gemini分析案件时,模型总是引用一些根本不存在的判例,这该怎么办?

这个问题背后,其实藏着AI应用落地时最常见的三个坑,幻觉问题、数据获取难、技术门槛高。咱们一个一个来拆解。

第一个问题,大模型为什么会编造判例?

大模型的工作原理,本质上是基于概率预测下一个词。它在训练时吃过海量文本,学会了法律文书的写作风格,但并没有真正记住每一个具体判例。

所以当你问它某某案件的判决结果,它会根据概率生成一个看起来很像判例的回答,案号格式对、法院名称对、判决逻辑也说得通,但这个案子压根不存在。

这就是所谓的幻觉。斯坦福大学2025年的研究发现,即便是使用了RAG技术的法律AI工具,幻觉率仍然在17%到33%之间。

解决幻觉的核心思路,别让模型记忆,让它检索

传统的RAG方案是这样的,你把所有判例存进向量数据库,用户提问时,先检索相关判例,再让模型基于检索结果生成回答。

这个方案在理论上可行,但实际应用中有两个大问题。

第一,向量检索不够精准。法律案件的相似度判断非常复杂,单纯靠语义相似度,很容易检索到看起来相关但实际不适用的判例。

第二,上下文窗口有限。即便检索到了相关判例,模型一次能看的内容也有限,复杂案件涉及的判例可能有几十个,根本塞不进去。

更好的方案,Skill方案

Skill是什么?简单说,就是给AI配一个专属工具箱。

你把所有判例整理成Markdown格式,按照案由、法院、年份分类,再做一个目录文件。当AI需要引用判例时,它会先查目录,找到对应的文件,再打开文件读取具体内容。

这就像图书馆的索引系统,你不需要把所有书都摆在桌上,只需要知道每本书在哪个书架、哪一层,需要时再去拿。

Skill方案相比RAG的三大优势

  1. 精准定位,通过目录结构,比如民事/合同纠纷/2024年/最高法,AI可以快速定位到相关判例,不会因为语义相似度误判。

  2. 按需加载,只有真正需要时才读取判例全文,不会浪费上下文窗口。一个Skill方案可以管理几万个判例,而RAG方案的向量库一旦超过几千条,检索效率就会明显下降。

  3. 可内嵌RAG,Skill方案本身可以内嵌RAG技术。比如你可以在Skill里写一个脚本,先用目录筛选出100个相关判例,再用向量检索从这100个里挑出最相关的5个,最后让模型基于这5个判例生成回答。这种粗筛加精筛的组合,比单纯的RAG要准确得多。

Skill方案的局限

Skill方案的核心是结构化管理,所以它更适合已知领域、固定格式的知识库。如果你的判例库每天都在更新,或者需要实时联网搜索最新判例,那RAG方案会更灵活。

但对于律师的日常工作来说,核心判例库其实是相对稳定的。你最常用的可能就是那几百个经典判例,这些判例一旦整理好,可以用很多年。

第二个问题,如何获取判例数据?

中国裁判文书网、最高法、税务总局这些网站,确实有很强的反爬虫机制。最高法官方曾明确表示,他们限制翻页数量、不提供公开时间检索,就是为了防止爬虫。

但这不意味着你就没办法了。

方案一,AI编程工具一键搞定

现在是Agent时代,你不需要懂编程,也不需要手动输入复杂指令。