查看: 774|回复: 0

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何

[复制链接]

417

主题

459

帖子

1295

积分

金牌飞友

Rank: 6Rank: 6

积分
1295
飞币
834
注册时间
2017-8-6
发表于 昨天 10:02 | 显示全部楼层 |阅读模式
在上篇中,我们梳理了作为一名合格的公司法务部门员工需要具备的基本素质和开展有效工作的前提,并开始了对大模型实际能够完成哪些法务部门日常工作的分析,详情参见:大模型工具之于公司法务部—提效与隐忧(以ChatGPT和deepseek为例)-上篇:https://mp.weixin.qq.com/s/Ic-qopBFLtlHlFn_yaxu0Q

除了合同审核之外,几乎所有法务部门的日常工作还包括:案例检索、法律咨询,那么我们接下来看看在这两个场景下,大模型工具能够完成哪些具体工作事项或步骤。

三、大模型工具实际能做什么—以ChatGPT和deepseek为例(接上篇)

场景二:案例检索

在法务部门以下的工作场景里经常需要进行案例检索的相关工作,包括但不限于:

(1)处理诉讼纠纷时,通过案例检索确定诉讼解决思路。当公司遇到诉讼纠纷时,需要对相关的实际案例进行检索和研究,来了解和总结法院的裁判思路,评估胜诉几率,确定纠纷解决策略,这是案例检索最常见的场景。

(2)修改各类文书、合同模板前的准备工作。公司法务部门经常需要根据法律法规的变化、实务案例发展的情况,对公司内部使用的一些法律类文书模板进行修改和增减,在此之前,需对调整前后的模板内容可能造成的法律效果进行确认和分析,同样有赖于案例检索。

(3)新型交易中的交易风险评估。对于一些公司此前未曾涉足的领域、未曾开展过的交易模式,公司法务部门可能难以对交易中的一些疑似风险点的风险程度进行准确研判。此时,同样需要对同类或类似案件的案例处理情况进行检索,评估新领域、新交易模式的潜在风险。

(4)海外新区域的司法环境评估。在中国企业大规模出海的时代浪潮下,很多公司都面临着在此前未曾涉足的新区域国家、地区开设公司、开展业务时“两眼一抹黑”的情况。此时,除了与当地的律所、机构进行合作之外,在力所能及的范围内,公司法务部门也会通过对该国、该区域与公司拟经营业务相关的重大案例进行研究,进而对其司法环境进行初步评估,提前排查业务在当地的潜在风险点。

让我们设置一个如下场景:公司作为某软件开发合同的开发方,完成了约定为6个月的开发工作,但迟延了20天交付。现对方以公司存在迟延交付为由,拒绝支付合同尾款,并主张解除合同。公司想要起诉对方,现需要了解法官的裁判思路,并评估诉讼的成功概率。

    deepseek

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何w2.jpg

首先来看deepseek,值得肯定的是,deepseek的深度思考功能给出的思考过程已经比较类似真实的法律人思考此类案例的思维路径了,显示考虑到了合同解除的相关法律规定,同时准确的发现了本案的诉讼主要争点是20天的迟延履行期是否属于“合理期间”。

在此基础上,deepseek给出了三条《民法典》中的法条,并进行了相关案例的检索,给出了三个案例。法条的定位比较准确,虽然并不完全,但没有明显的错误,接下来我们来看看deepseek给出的案例。

从案例号上看,这三个案例的真实性就已经足够值得怀疑了,在真实的司法案例中,很少出现连续的数字结尾的情况,但deepseek给出的三个案例,(2021)京01民终12345号、(2020)沪0115民初6789号、(2019)粤0304民初5678号,均为此种情况。此时我已经基本判断这三个案例应该是虚构的了。经过到北大法宝上进行进一步确认,果然如此。

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何w3.jpg

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何w4.jpg

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何w5.jpg

这就是在案例检索这一领域,大模型工具一直未能彻底解决的编造和幻觉问题。由于大模型的基本逻辑是解决提问者提出的疑问,因此当提问者询问案例时,大模型工具即使是未查询到相关的可用案例,但经常会出于必须给出相关回答、解决提问者问题的目的,而编造出一些虚构的案例。

早在2023年6月,就有新闻报道了美国的两名律师因使用当时的ChatGPT提交法庭简报而被处罚的案例,原因同样是他们使用了ChatGPT给出的实际并不存在的司法案例。新闻参见:https://baijiahao.baidu.com/s?id=1769649630619690957&wfr=spider&for=pc

因此,对案例检索的结果不能过于相信,复核是必须的(当然,目前国内有一些其他的法律垂直领域应用,在案例检索方面具有可能更强的功能)。

    ChatGPT

其实让ChatGPT来查找我国国内的案例,对它而言有些“强人所难”,毕竟其不太可能调取到国内的案例,但即便如此,还是让我们看看它的具体表现如何。

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何w6.jpg

果然,大约是由于ChatGPT无法调取国内案例库资源,ChatGPT放弃了自主直接寻找案例,转而选择了一种更为迂回的方式,即联网查找涉及我所提出的相关问题的文章。

经过确认,ChatGPT给出的四个案例,分别来源于两处,第一个案例的链接我无法打开,第二至第四个案例来源于一篇某律所律师发布在百家号上的文章,其内容确实与我所提出的问题直接相关。而这三个案例,由于来自这篇律所的以案说法类文章,其真实性也并无问题,均能查到其对应判决,对于完成相关的裁判思路解析有不错的借鉴效果。

总结

目前的大模型工具,在案例检索方面的能力比较有限,其提供的案例仍有较大可能是虚构的,必须经历法务部门的双重确认,才可使用,特别是当大模型工具直接给出一些案例号的场景,务必进行进一步确认,否则可能碰到与上文中提到的两位美国律师相同的“遭遇”。

令人期待的是,目前国内的一些法律领域的垂直模型,如Metalaw、得理法搜等,已经通过与案例库打通的方式,在案例检索方面有了不错的表现。
场景三:新领域或复杂项目法律风险框架的搭建

对于经常尝试新领域业务、或者在海外新地区开展业务的公司而言,过往的经验往往不足以充分帮助法务建立对新业务领域法律风险的认知。比如甲公司的原主营业务是食品饮料,近期突然规划了进军基因检测领域的战略。对于甲公司的法务而言,产品质量法、食品安全法、消费者权益保护法等法律法规可能早已烂熟于心,但对于基因检测领域所涉及的医事法领域,可以说是两眼一抹黑,需要大量的重新学习,此时除了请教该行业里的专业法务之外,还可以请大模型工具帮助,列出学习清单,初步搭建学习的内容范围,并排列重要性。

除了涉足新领域之外,更为常见的场景,是复杂业务需求所带来的法律咨询和风险清单的制定工作,让我们具体举一个例子。

业务需求描述:A科技公司的主营业务是软件开发和人工智能模型的数据训练。现在A公司尝试拓展新的业务,计划在西班牙建立一个海外子公司,并在当地经营与数据相关的业务,包括为客户提供数据标注、数据脱敏、数据存储托管等服务。

在收到这样的一个需求时,首先需要我们对这个项目可能涉及的整体法律合规风险搭建一个基础框架,让我们先来问问两个模型,这样的业务场景,可能涉及哪些法律问题吧。

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何w7.jpg

大模型工具之于公司法务部(以ChatGPT和deepseek)下篇-大模型这匹“狼”的成色如何w8.jpg

ChatGPT 4o和deepseek的结论分别如上。ChatGPT 4o对于个人数据合规多花了一点笔墨,而deepseek对于设立海外子公司本身的风险多提及了一些,整体上讲,两个大模型工具对于业务中主要涉猎的问题都有所涉及,没有大面上的重大遗漏。

我们得到的只是非常初步的风险列表,需要通过以下步骤进行多次的修正和细化:

(1)在向当地律所、相关机构咨询的过程中,对风险清单的完整性和重点进行验证和调整

其实反过来说,风险清单也从某种角度上可以用来反向验证律所或机构给出信息的准确性。强烈建议读者不要过于迷信当地的律所或机构,我本人就曾遇到过当地律所给出的法律意见存在重大遗漏和错误,而恰恰是大模型工具给出的风险列表里提及了相关问题,在我方提示律所之后,律所修正了其法律意见的情况

(2)根据公司具体的业务重点,评估这份初步清单,设定关注重点

大模型工具提出的风险不一定都值得特殊关注,需要根据公司的业务属性对重点进行圈定,这是提升效率的必要步骤。公司需要的是值得重点关注的风险清单,而非仅仅对所有可能存在的风险进行罗列

(3)不断优化,形成内部的Knowhow

通过以上两个步骤的不断循环,随着公司在海外业务的定型,这份风险清单将随之定型,并形成内部通用的对海外该类型公司和业务的审查列表,最终形成内部的知识沉淀。

四、结论:这匹“狼”的成色如何,我们该担心什么?

通过对合同审查、案例检索和复杂项目法律风险框架的搭建三个公司法务部日常最常见类型工作的简单测试之后,我们对于大模型工具在当前的能力情况有了基本的认知。

总结而言,对于公司的法务部门而言,大模型工具固然在诸多方面可以作为提效工具,但是否也会带来一些人们对“狼”的担忧呢?如果是,这批“狼”,目前的成色究竟如何?

我个人的观点如下:

    文字类工作,大大提升效率,大模型工具“是友非敌”

限于篇幅,在上、下两篇的分析中,我并没展示大模型工具一些更为基础的、并不是针对法务部门工作的功能,比如处理文字、整理长文章观点、文书翻译等。但这些基础功能,恰恰是对于任何文字工作者来说都是无法绕开的。

仅以阅读域外法的资料这一场景为例,对于全球化经营公司的法务部门而言,法务人员无法避免地需要经常阅读域外的法律资料。这不仅仅是英文水平高低的差别,有些域外法可能根本无法找到当地官方的英文译本,比如一些东欧国家、南美国家,此时,除非法务人员本身有很强的直接阅读小语种法律资料的能力,否则不可能理解其内容。尽管在大模型工具出现以前,各类翻译工具早已充斥网络,但仅以我2023年以前使用的谷歌翻译为例,其对于法律文献的翻译能力十分有限,特别是结合上下文对一些特殊概念的翻译效果,可以说是很差,其结果很难直接使用,需要进行较多的调整和修改才能作为参考。但大模型工具的联网搜索和学习能力,使得它们在阅读域外法资料方面的能力明显提升了一个档次,以我个人的经验,ChatGPT和deepseek在阅读英语、德语、日语等方面的能力基本可以满足相关的翻译需求。

2. 合同审核方面,可作双重确认的助手,不必担忧(除非你非常“水”)

如《大模型工具之于公司法务部—提效与隐忧(以ChatGPT和deepseek为例)-上篇》中已经分析过的,合同的审核工作,远远不是单纯把合同文本层面的风险提示出来就万事大吉了。

出于各种原因,大模型工具很难真正理解一家公司的业务逻辑和真实业务风险所在,能做的只能是对我们给出的合同文本进行一般性确认。造成这种结果的一部分原因在于,由于保守商业机密的职业道德义务,我们不可能把一些企业经营的核心信息给到作为联网工具的大模型。经营情况的区别,决定了即使面对一份完全相同的合同,经营同一行业的两家公司,其审核重点和对于一些条款的接受程度将完全不同。比如麦当劳和杨国福麻辣烫,两家公司虽同属餐饮行业,但两家的经营逻辑、主要法律风险和关注重点均有明显差异,我们无法想象两家公司的法务基于完全相同的思路审核公司的各类合同,或者对同一份合同提出完全相同的审核意见。麦当劳的法务也不会觉得因为其同样身处餐饮行业,就能直接上手审核杨国福的同类合同,反之亦然。

综上所述,公司法务在审核合同时的真正任务,是将公司的各种“个性情况”与合同的法律文本结合起来,进行一案一议的审核,而大模型工具只能基于合同文本给出一般性的“共性”建议。

当然,如果你的工作模式就是仅基于合同文本提出审核意见,那么恭喜你,大模型工具这批“狼”,确实已经朝着你来了。

3. 与法律咨询、案例检索相关的工作,大模型工具的功能有限,暂不构成“杀伤力”

对于复杂问题的法律咨询方面,大模型目前能做的比较有限,基本限于搭建问题的研究框架,一旦涉及到具体的法条、法律问题,比较难以给出具有深度的回复,另外其“幻觉”问题相对严重,需要格外小心。

目前观之,对于域内域外的特定法律,大模型工具多数情况下可以相对准确地概述其主要内容和内容框架,但当涉及具体的条款时,其给出的结果远远称不上精准,包括明显错误的情况也并不鲜见。

在案例检索方面,大模型工具的“幻觉”问题体现得更为集中。除了上文出现的编造案例的情况之外,ChatGPT也曾出现将真实存在的案例号和完全不对应的内容相结合输出的情况。因此在对大模型工具给出的案例检索结果进行审核时,不仅要通过案例号检索确认其是否存在,还需要查看实际判决书内容,以避免发生“挂羊头卖狗肉”的情况。

在这些方面,大模型工具对于开拓研究视野和打开固有思路局限方面有比较值得借鉴的效果(特别是deepseek的深度思考R1功能),但其输出的结论必须经过严格审查和确认,且从目前的实际情况看,错误较多,不建议直接使用,仅供参考。

4. 三段话总结

(1)对于绝大多数的法务而言,当前的大模型工具水平远远还没达到能够取代人类法务的水平,在中短期之内,也不太看得到这种可能性。综合来看,我认为人类法务在商业和法律相结合方面的理解和建构能力是我们的核心竞争力。除非我们自己因为“躺平”而逐步放弃这种优势,否则,我认为即使是在未来,大模型工具也不可能做到完全取代人类法务。

(2)尽管我认为大模型工具不会取代人类法律工作者,但在公司中善于使用大模型工具的法务,将在同行中取得越来越大的效率优势,这种优势的积累和发展很可能不是线性的,而是指数级的,在开始的一段时间内并不明显,随着AI技术本身的进步和善用AI工具的法务工作效率的提升而逐步累积,只待达到某个阈值,就会产生质变,届时两类人群的差距将远超我们当前的想象。

(3)不要满足于边缘性的事务,永远要向深看、向本质看。尽管我不认为人类法务将被取代,但一些公司法务部门的一些相对初级、边缘性的工作,确实面临着大模型工具实实在在的冲击(本文不想贩卖焦虑,因此不点出具体的岗位或工作类型了)。其实在职业生涯的初期,我们所有人都不可避免地将从一些边缘性的、事务性的、非核心的工作做起,这无可厚非。区别在于,在大模型出现之前的世界,对于这些初级、边缘性的工作,只要接受较低的薪水和可能偏低的自我价值感,之前的我们还有“停留于此”的“躺平”选项,但大模型工具出现后,再作出这类选择的风险将显著上升。简单来说,想要长时间在边缘性的、事务性的、非核心的工作中“躺平”的职业风险会愈发升高,努力向着更核心、更专业、更复杂工作中前进,即使仅从职业安全的角度看,也将成为我们唯一的合理选择了。

关联阅读:大模型工具之于公司法务部—提效与隐忧(以ChatGPT和deepseek为例)-上篇:https://mp.weixin.qq.com/s/Ic-qopBFLtlHlFn_yaxu0Q
您需要登录后才可以回帖 登录 | 加入联盟

本版积分规则

快速回复 返回顶部 返回列表