DAILY LESSON / 2026-01-30

律师如何用AI解决判例引用幻觉问题

今天有位律师朋友问了我一个很实际的问题，用Gemini分析案件时，模型总是引用一些根本不存在的判例，这该怎么办？

AI编程法律SkillAI智能体AI知识库创业超级个体变现

今天有位律师朋友问了我一个很实际的问题，用Gemini分析案件时，模型总是引用一些根本不存在的判例，这该怎么办？

这个问题背后，其实藏着AI应用落地时最常见的三个坑，幻觉问题、数据获取难、技术门槛高。咱们一个一个来拆解。

第一个问题，大模型为什么会编造判例？

大模型的工作原理，本质上是基于概率预测下一个词。它在训练时吃过海量文本，学会了法律文书的写作风格，但并没有真正记住每一个具体判例。

所以当你问它某某案件的判决结果，它会根据概率生成一个看起来很像判例的回答，案号格式对、法院名称对、判决逻辑也说得通，但这个案子压根不存在。

这就是所谓的幻觉。斯坦福大学2025年的研究发现，即便是使用了RAG技术的法律AI工具，幻觉率仍然在17%到33%之间。

解决幻觉的核心思路，别让模型记忆，让它检索

传统的RAG方案是这样的，你把所有判例存进向量数据库，用户提问时，先检索相关判例，再让模型基于检索结果生成回答。

这个方案在理论上可行，但实际应用中有两个大问题。

第一，向量检索不够精准。法律案件的相似度判断非常复杂，单纯靠语义相似度，很容易检索到看起来相关但实际不适用的判例。

第二，上下文窗口有限。即便检索到了相关判例，模型一次能看的内容也有限，复杂案件涉及的判例可能有几十个，根本塞不进去。

更好的方案，Skill方案

Skill是什么？简单说，就是给AI配一个专属工具箱。

你把所有判例整理成Markdown格式，按照案由、法院、年份分类，再做一个目录文件。当AI需要引用判例时，它会先查目录，找到对应的文件，再打开文件读取具体内容。

这就像图书馆的索引系统，你不需要把所有书都摆在桌上，只需要知道每本书在哪个书架、哪一层，需要时再去拿。

Skill方案相比RAG的三大优势

精准定位，通过目录结构，比如民事/合同纠纷/2024年/最高法，AI可以快速定位到相关判例，不会因为语义相似度误判。
按需加载，只有真正需要时才读取判例全文，不会浪费上下文窗口。一个Skill方案可以管理几万个判例，而RAG方案的向量库一旦超过几千条，检索效率就会明显下降。
可内嵌RAG，Skill方案本身可以内嵌RAG技术。比如你可以在Skill里写一个脚本，先用目录筛选出100个相关判例，再用向量检索从这100个里挑出最相关的5个，最后让模型基于这5个判例生成回答。这种粗筛加精筛的组合，比单纯的RAG要准确得多。

Skill方案的局限

Skill方案的核心是结构化管理，所以它更适合已知领域、固定格式的知识库。如果你的判例库每天都在更新，或者需要实时联网搜索最新判例，那RAG方案会更灵活。

但对于律师的日常工作来说，核心判例库其实是相对稳定的。你最常用的可能就是那几百个经典判例，这些判例一旦整理好，可以用很多年。

第二个问题，如何获取判例数据？

中国裁判文书网、最高法、税务总局这些网站，确实有很强的反爬虫机制。最高法官方曾明确表示，他们限制翻页数量、不提供公开时间检索，就是为了防止爬虫。

但这不意味着你就没办法了。

方案一，AI编程工具一键搞定

现在是Agent时代，你不需要懂编程，也不需要手动输入复杂指令。

相关推荐