当前位置: 首页 > 司法调研 > 调研园地
全国法院系统第三十一届学术讨论会三等奖
作者:郑仲超  发布时间:2021-11-10 17:56:32 打印 字号: | |

类案推送系统的应用困境与出路

——基于层次分析法的研究

 

论文提要:司法责任制改革以来,在放权背景下如何统一裁判尺度,实现类案类判,成为学界和实务部门关注的焦点。最高人民法院明确提出各级法院要建立类案强制检索机制,而随着人工智能和司法大数据的发展,类案推送系统的建立为类案类判提供了新的技术支持。本文考察了类案推送系统的运行原理,以最高法院类案智能推送系统为例,其以海量司法大数据资源为基础,采用新一代搜索引擎、知识图谱、深度学习、自然语言处理等人工智能技术,通过建立要素标签体系,支持文书整体识别,实现类案自动推送。但是,类案系统在推送精确性、全面性和有序性方面均存在不足,未能得到广泛认同,其根源是系统没有准确理解法官对类案的需求和对不同类案的偏好,未能建立合理的推送规则。此外,案例原材料质量不佳、标签识别等技术存在瓶颈也制约着类案推送的效果。本文借助层析分析法,构建层次评价模型,充分考察法官需求,建立包含相似性、权威性和法院类型三个核心指标的类案评价指标体系,通过调查法官偏好和专家意见,对三个指标及其项下细分指标的重要性进行排序,借助专业软件计算获得各个细分指标的权重,从而构建出类案推送赋分规则,并以实例阐释其意义与运用。为使推送规则发挥作用,本文提出三个方面的完善措施,其一是系统建设方面,以算法合理化保障全面推送,以标签精细化促进精准推送,以系统集成化提升建设效益;其二是案例数据规范化治理方面,要提升司法公开质量,重点推送权威典型案例;其三是类案结果有序呈现方面,提供了有序推送的界面示例。笔者通过以上推送规则及完善措施,希望对促进类案全面、有序、精准推送提供有益思路。 

主要创新观点: 当前对类案类判的研究主要集中于类案检索机制层面,包括检索机制的性质、适用范围、检索规则、结果运用等方面,本文则从类案推送这一角度出发,聚焦类案推送规则的建立及配套完善,重点解决类案推送全面性、有序性和精确性不足的问题。本文运用实证分析方法,通过实际操作类案推送系统获得直接用户体验,以一手数据呈现类案推送系统的应用困境,特别指出了系统与法官对类案的理解不一致,案由标签的严格限定导致了片面推送,未能满足法官对同一法律事实寻求不同司法定性的需求。相比多数局限于定性层面的研究,本文借助层次分析法构建类案推送层次评价模型,不仅提出相似性、权威性和法院类型三个指标,还在调查法官对类案需求及偏好的基础上,借助判断矩阵定量计算每个细分指标在决策中的权重,构建出一套案例赋分规则,并从算法调整、数据规范、有序呈现三个方面提出完善建议,让全面、有序、准确推送类案更具实操性。

司法责任制改革以来,在放权背景下如何统一裁判尺度,实现类案类判,成为学术界和实务部门共同关注的焦点,最高法院提出要建立类案强制检索机制[],学者则称类案类判“某种意义上是一种新型审判管理技术,有望成为控制裁判偏离度的纠偏机制”[]。随着人工智能和司法大数据迅速发展,类案推送系统的建立为类案类判提供了新的技术支持,本文在充分呈现推送系统的运行原理,考察其现实困境的基础上,借助层次分析法建立类案推送的基本规则,规划了类案推送系统的完善路径。

一、概念解析:类案推送系统的运行原理

相比近年来已为人熟知的“类案检索”,“类案推送”是一个更新的概念,考察类案推送系统的运行原理,有必要先厘清类案推送与类案检索的关系,明晰类案推送的核心问题,准确理解实现类案推送的技术方法,从而找准升级改造的正确路径。

(一)类案推送的核心问题

目前国内使用率较高的类案数据平台包括北大法宝、威科先行、元典智库、中国裁判文书网、最高法院“类案智能推送系统”、北京高院“睿法官系统”等,这些平台的发展经历了两个阶段。在案例智能服务1.0时代,以中国裁判文书网、北大法宝为代表的类案平台只支持用户通过输入关键词的方式进行人工检索,而到案例智能服务2.0时代,类案智能推送系统、元典智库等平台的人工智能含量进一步提升,其采用知识图谱、深度学习、自然语言处理等技术,支持用户将文书材料整体上传,系统可自动识别文书内容、自动比对标签要素,实现类案自动推送。

正因“自动推送”功能的出现,“类案推送”才成为新的热点概念,但对于类案推送与类案检索的区别,实践中存在一些误解,将类案检索等同于手动检索,将类案推送局限于自动推送[],此种混淆不利于明晰类案推送的核心问题。在案例智能服务1.0时代,类案平台根据用户手动输入的关键词反馈类案,在2.0时代,类案平台则根据用户上传的文书自动推送类案,这两种场景的人工智能技术含量不同,但都既存在检索动作(输入),也包含反馈推送(输出),因此,不能以人工智能技术含量的多寡(即手动或自动)来区分类案检索与类案推送。笔者认为,类案检索与类案推送的关键区别是主体和方向的不同,从司法人员角度看是做检索,从系统角度看则是做推送,方向的不同决定了研究问题的不同,类案检索机制主要规范司法人员,关注检索机制的性质、检索规则、检索结果运用等方面,而类案推送则聚焦于案例推送的精确性、全面性和有序性(见图一),这也是本文关注的核心问题。

 

 

 

 

 

 

 

 

 

 

 

 

 

(二)类案推送的技术支撑

明确类案推送聚焦的问题之后,需要考察类案平台基于何种原理来达成目标。最高法院“类案智能推送系统”于2018年1月上线,推出自动推送功能,可在全国法院内网登录使用,最具实践价值和引领意义,故本文主要以该系统为研究对象。据笔者考察,系统自动推送类案,主要以三种技术支撑三个环节[]

1.基于知识图谱的司法知识体系构建技术。根据谷歌公司的定义,知识图谱是用于增强搜索引擎功能的辅助知识库[],其构建有两大类方法,其一是自底向上构建,借助一定技术手段,直接从公开采集的数据中提取资源模式,经过置信度筛选和人工审核后纳入知识库中,此种方法在开放性较强的知识领域效果较好;其二是自顶向下构建,借助已有的结构化数据源,从高质量数据中提取资源模式纳入到知识库中,适用于专业性较强的知识领域。显然,在法律专业领域,现有的人工智能技术尚无法以“自底向上”模式自行探索出整套知识图谱,故技术服务商多采用“自顶向下”方式来搭建,即由法律专业人员根据现行法律规则体系构建法律概念模型,例如在刑事领域,先构建总论模型,包括犯罪主体、主观心态、刑事责任能力、违法阻却事由、犯罪形态、共同犯罪、从轻减轻事由等概念,再构建刑法分则各罪名的构成要件,总则与分则概念对接,形成体系化的知识图谱,成为类案推送系统的“知识芯片”。

2.基于模板匹配的案件要素自动提取技术。知识图谱中的法律概念,在文书材料中并非总以标准化、规范化的表述出现,而经常隐藏在千变万化的案件情节中,需要系统运用自然语言处理技术进行智能识别和提取。目前,自然语言处理技术运用NLTK、Standford NLP、Reverb等工具,通过语言分词、词性标注、命名实体识别、句法分析、语义依存分析等方法对案例进行要素抽取,但限于技术短板,此种提取的准确性不高。因此,技术服务商一般在要素抽取环节引入人工参与,即选取大量典型案例,将知识图谱中的法律概念在案例中进行人工标注,例如将“未经所有权人同意卖掉房子的行为”标注为“无权处分”,将“协助司法机关抓获其他犯罪嫌疑人的行为”标注为“立功”,使每个案例结构化为多个要素标签。接下来运用知识抽取开源工具(例如斯坦福大学开发的Deepdive系统),把人工标注作为一种“启发式规则”纳入到要素提取模型中,经过人工标注的案例便成为机器学习的模板,系统仿照模板确立的规则对给定案例文书进行要素提取,生成整套标签,从而实现文书的结构化、标签化处理。

3.基于随机森林的类似案件匹配技术。提取标签要素之后,需要进一步构建类似案件匹配模型,其重点是通过大规模裁判文书建模挖掘案件要素特征与裁判结果的关联关系,实现案件要素的有机重构。以刑事案件为例,运用预测编码(predictive coding)等技术[],重点突破面向罪名认定的分类预测模型和面向罪刑确定的回归预测模型,判断各类案件要素在裁判中的重要性,据此设置各要素的匹配权重,并通过有监督的机器训练和人工干预不断优化权重配比。除了要素匹配之外,技术服务商还综合运用文本相似(上下文)、基本信息相似等方法辅助限定案件范围[],提升自动匹配的准确性,最终实现案件事实、法律适用、裁判结果三个维度的立体化类案推送。

 

 

 

 

 

 

 

 

类案智能推送系统除了自动推送功能,也保留了以往类案平台具有的手动检索功能,用户可以通过输入关键词,自行组合标签进行检索,此时系统无需对待决案件进行标签识别,直接进入匹配阶段。

二、现状探究:类案推送系统的应用困境

如火如荼的类案推送技术实践效果如何呢?类案智能推送系统据称“通过机器自动学习构建出超过10万个维度的特征体系,做到全案由文书数据整体搜索推送准确率达63.7%,民事、刑事Top10类型准确率达85.5%,其中以文检索全案由整体准确率61.6%。”[]但笔者通过调查和实际操作发现,该系统在推送的精确性、全面性、有序性方面均存在不足。

(一)类案推送的精确性困境

实践中,各类案平台并未得到广泛运用,作为案例2.0平台、新增自动推送功能的“类案智能推送系统”甚至不为法官所知。对于类案推送,法官常有案例海量而无用、检索事倍而功半之感。当使用自动推送模式时,简单案件由于有大量案例标本,标签识别和匹配效果较好,但这并非法官最大的需求所在;在法官最关注、最需要类案的疑难复杂案件中,由于案件事实和法律问题比较特别,一般化程度低,标注模板少,系统为案件贴标签、将其结构化的效果较差,影响了匹配和推送的精确性,在核心法律问题上未能给法官提供有效帮助。当法官使用手动检索模式寻求推送时,由于初始输入的关键词有限,往往得到海量案例,必须通过增加关键词(即增加限制条件)来缩小类案范围,不仅耗时耗力,精确性也无从保证,严重影响了法官检索的积极性。

(二)类案推送的全面性困境

1.司法公开不足影响案例数据的全面性。类案推送系统真正发挥作用,离不开大量可测量、可报告、可分析的案件数据,而全国法院目前还沉淀着大量尚未数据化的案件信息。[]首先,裁判文书整体公开率不高。推送系统的案例来源于中国裁判文书网,截至2019年6月24日,该数据库拥有超过6934万份文书,其中2013-2018年的文书6173万余份,同期全国法院审结、执结案件数1亿1122万余件[],公开结案比仅为55.5%,若除去大量裁定增加的文书数量,实际公开比例更低。其次,文书时间分布失衡。2013年裁判文书网建立后,全国法院才有了文书统一上网渠道,而历史案卷电子化推进缓慢,2013年之前的裁判文书至今仅公开了761万份,类案价值缺乏足够的历史检验。再次,文书的地域结构失衡。研究显示,浙江、安徽等地裁判文书公开结案比超过60%,而黑龙江、西藏等地则低于20%。[] 

2.标签选取的限定影响手动检索的全面性。笔者以股东会决议效力案件为例,某公司股东会以履职不力为由解除董事职务,该董事认为存在大股东压迫小股东情形,请求法院确认股东会决议无效,笔者测试发现,必须输入“公司决议撤销”这一关键词才能得到最相关的第10号指导性案例,以“公司决议效力确认”、“股东会决议无效”等作为关键词均无法获得该案例。再以公司人格否认案件做测试,当输入“人格否认”作为标签时,系统不会推送相关的第15号指导性案例,只有输入“人格混同”时,第15号指导性案例及两个公报案例才出现在推送案例中,而“人格否认”、“人格混同”本都是司法实践中常用的提法,依合理的期待应该都能定位到上述典型案例。标签选取的严格限定既影响了推送的全面性,也严重降低了推送效率。

3.标签识别的局限影响自动推送的全面性。如果上传的文书材料中包含对案件的定性(表现为案由或罪名),系统识别到这个标签后,就只推送这个标签项下的案例。然而,对于同样的事实,司法实践经常存在不同定性。有研究提出例证:对网络虚拟财产盗窃案件的定性,实践中有裁判认为构成盗窃罪,也有观点认为虚拟财产价值难以认定,不符合盗窃罪构成要件,应定非法获取计算机信息系统数据罪。若将起诉书整体上传系统,而检察院在起诉书中以盗窃罪指控,系统便只推送盗窃罪案例,因为“盗窃罪”这个案由标签排除了计算机犯罪项下的案例推送[]。法官本来希望兼听则明,未曾想标签识别的局限使得起诉书先入为主。

这其实反映了系统与法官对类案理解的差距。如图三所示,椭圆1是以A罪名为标签的类案,椭圆2(A1+A2+B1+B2)是与待决案件案情高度相似的类案,椭圆3(A2+B2)是不仅情节相似、核心问题亦相似的类案。受到起诉书A罪定性的限制,系统只推送A1+A2,不推荐B1+B2,而B1、B2正是法官的目标。在法官看来,所谓“类案”即是那些案情高度相似、特别是核心法律问题一致的案例,案由并非决定因素,法官正试图了解对同样的情节和焦点问题,司法实践中是否有不同的定性,系统算法与法官需求的偏差,导致了推送的片面性。

 

 


 

 

 

 

 

 

(三)类案推送的有序性困境

类案推送系统的结果呈现有序性不足,未能带来友好的用户体验,仍以前述公司决议撤销纠纷为例,输入“公司决议撤销”,得到2244篇文书,观察这些文书的推荐顺序,存在几个突出问题:其一,案例分层粗糙。系统每批次推荐20个案例,第一批依次为:本市中级法院3个、本省高院1个、最高法院2个、其他地区法院14个。除了本市中院、本省高院、最高法院这几个案例前置之外,系统对其他法院案件未再分层,也未能将本省其他法院判决优先推送,致其散布于劣后推送的海量案例中。其二,权威性较高的案例未能优先呈现。推送页面左侧数据栏显示有1个指导性案例,但其并未出现在主页面首批推送案例中,遑论公报案例、省级参考性案例等其他典型案例。其三,同一案件的历审文书推送顺序混乱。某个案件系统优先推荐了一审判决书,而笔者在“历审案件”项下点击二审判决链接,发现二审撤销了一审判决,此种推送顺序令人费解。其四,推送案例未有相似性程度标注。如上所述,系统将本市中院、本省高院和最高法院六个案例置顶,但这些案例与待决案件在多大程度上相似,本市中院案例究竟是凭借更高的相似度而排在最高法院、省高院案例之前,还是纯粹因为它是本市中院案例,这些都不得而知。

小结:类案推送系统存在的应用困境,背后有三个深层原因。其一,现有人工智能技术存在瓶颈,案例标签识别和匹配效果不佳影响了推送的精确性。其二,系统对类案的理解与法官需求存在偏差,最为突出的问题即是案由标签的排他性导致了片面推送。其三是推送规则的缺失。系统仅仅按照一个粗糙的顺序向用户呈现案例,没有标注所推送类案的相似度差别,案例的权威性、地域性未得到充分考虑,这些都反映出系统缺乏一套合理的推送规则。

三、模型构建:基于层次分析法的类案推送规则

对于上文总结的三个原因,笔者认为,技术瓶颈制约着类案推送的上限,而需求定位和推送规则的构建则决定了类案推送的下限,如果我们连地板都没建成,便不能轻易以技术天花板来否定类案推送的价值。因此,当务之急是先构建基本规则,再来探寻优化路径。

(一)类案评价指标体系的确立

推送规则构建的第一步是根据法官的需求偏好确定类案评价指标,亦即系统在匹配案例时需要分析的因素。经笔者考察,案例的类似程度、案例的权威性、裁判法院与法官所在法院的远近关系,是法官在检索类案时最为关注的因素,故笔者从相似性、权威性和法院类型三个方面构建评价指标体系。其中,相似性无疑是最重要的指标,其下又包括案由是否一致、案件情节是否相似、核心法律问题是否一致三个方面;权威性指标项下则包括是否为指导性案例、公报案例、最高法院发布的其他典型案例(例如各业务部门汇编的参考系列案例)、省级参考性案例、市级以下典型案例、普通案例;法院类型则包括最高法院、本省高院、本市中院、本市基层法院、本省非本市法院、其他省高院和省外其他法院。推送规则的基本思路即是,根据法官对以上三类指标及其项下细分指标的重视程度设置各个指标的分数权重,按照数据库案例的得分高低依次推送。

(二)类案层次评价模型的构建

各项指标的分值权重,笔者借助层次分析法予以确定。层次分析法是一种将定性分析与定量分析有效结合起来的多层次权重分析决策方法,最早由美囯运筹学家萨蒂提出,其基本思想是把一个复杂的决策问题分解为若干层次,根据对客观现实的判断,就各个层次中所有要素的相对重要性给出定量表示,确定各要素的排序权重,进而计算各层次要素对决策目标的组合权重,为决策提供定量依据。[]运用层次分析法构建类案层次评价模型,步骤如下:

1.绘制层次评价模型。根据上文确定的指标体系搭建层次评价模型,分为决策目标层、中间要素层和具体指标层,利用yaahp软件[]绘制模型如图四:

 

 

 


 

 

 

 

 

2.建立判断矩阵。构建层次模型后,按照每个指标对类案推送的 重要程度进行排序,确定每个指标的权重值。在层次分析法中,指标权重值是通过建立判断矩阵,经过一致性验证后自动计算确定的。所谓判断矩阵,是对各个中间要素层、以及每一中间要素层项下的各个具体指标进行两两比较,用九个等级的相对尺度来表示,即绝对重要、十分重要、比较重要、稍微重要、同等重要五个尺度,以及介于这五个尺度之间的四个尺度。继续使用yaahp软件构造判断矩阵,通过调查法官及征求专家意见,填写各指标的比较关系。

由于该层次评价模型下包含相似性、权威性和法院类型三个中间层,每个中间层项下又包含若干个指标,因此需要填写四个判断矩阵,此处仅以法院类型指标项下的矩阵填写为例进行说明,根据调查及咨询结果填写不同类型法院的比较关系(图五),截图所示的本市中院与其他省高院之比较即意味着在法官心目中,本市中院的类案具有十分重要的优势地位。

 

 

 

 

 

 

 

 

 

 

 

3.计算各指标权重。软件对上述判断矩阵进行一致性检验,并计算得出各指标的单层级权重及总层级权重,如表一所示:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(三)类案层次评价模型的功能

对于类案推送系统的应用困境,不难提出各种建议,例如系统既要推送相同案由的、也要推送案件情节类似的案例,在呈现结果时要规范有序,优先推送典型案例等等,但相关影响因素在推送中占据多大的权重,系统具体按照何种规则对案例进行评价和排序?层次评价模型的意义正在于,不仅提出应重视哪些指标(定性),更提供各个指标的赋分规则(定量),使系统能通过对案例赋分排序,实现有序推送。笔者以几个例子来展示类案层次评价模型如何发挥作用。

1.相似性指标的优势地位。案例A是本市基层法院作出的普通判决,案由与待决案件不同,但案情及法律问题有80%一致,根据表一,其赋分为(0.1894+0.4063)×0.8+0.0058+0.0123≈0.495。案例B是最高法院作出的判决,且为指导性案例,案由也与待决案件相同,但案情及法律问题仅有20%一致,其赋分为0.327。本市基层法院案例能够击败最高法院指导性案例,显示出相似性指标的突出优势,同时亦表明,法律问题和案情高度一致的类案,不会因为案由不一致就被淘汰,有力回应了前文提出的全面性困境。

2.权威性和法院类型指标的辅助作用。如果备选案例在相似性方面旗鼓相当,权威性和法院类型指标就会发挥更大的辅助作用,根据赋分规则,指导性案例等典型案例将被优先推送,最高法院及本省法院的案例将比外省法院获得更高的推送位次。对上一段中的举例略作调整,假设案例A不变,案例B的案情及法律问题与待决案件有60%一致,虽然此时相似性指标仍落后于A,但凭借权威性和法院类型指标的赋分,最高法院的案例(0.565分)将被优先推送。

3.法院类型指标突出类案类判的地域性。在法院类型指标中,本省高院、本市中院、本市基层法院甚至本省其他法院都比省外法院更具优先性,这表明法官更希望了解本地区法院的判决,彰显了类案类判的地域性特征。假设案例C和案例D的相似性指标均为满分,C为省外高院参考性案例,D为本市中院普通案例,则C得分为0.6719,D得分为0.6754,D案尽管在法院级别和权威性上稍逊于C,其仍然具有优先地位。

以上例子可以看出,类案推送层次评价模型在综合考量各类指标,促进全面、有序和准确推送方面能够发挥积极作用。值得注意的是,在三类指标中,权威性、法院类型以及相似性指标中的案由指标在赋分时没有技术难度, 符合条件则得满分,反之不得分。而相似性指标项下的案情和法律问题一致性指标则比较复杂,其赋分一般不是满分或零分,而要根据标签要素的匹配情况确定不同的分值,而这正是人工智能技术尚需完善之处。因此,基于层次分析法的推送规则构建绝非一劳永逸,其作用发挥依赖于技术的进步,其赋分规则、指标权重配置也需要根据实践效果和法官的需求反馈不断优化。

四、进路探寻:类案推送系统的优化思路

建立推送基本规则之后,进一步的思考是如何完善类案推送系统,使上述规则能够顺利发挥作用。其实,类案推送就像来料加工,全国法院提供案例原材料,系统加工整理,再推送给法官。因此,完善类案推送系统,优质的案例数据、满足法官需求的精细加工及友好的包装呈现,三者缺一不可。

(一)算法调整、标签优化与系统集成

1.以算法合理化保障全面推送。 相似性指标在层次评价模型中举足轻重,系统算法首先要调整的即是相似性指标项下案由指标对推送结果的不当限制。前文在推送的全面性困境中提到,当系统自动识别文书标签时,如果文书中含有对案件定性的标签要素(案由或罪名界定),系统就只推送该标签项下的类案,这一现象笔者从某技术服务公司员工处得到证实,这不仅不符合层次评价模型的推送规则,也有违法官检索类案的期待。科技公司应调整算法,使案由指标能影响案例赋分,但不能直接排除某类案件,以满足法官对某一特定事实考察不同司法定性的需求。

2.以标签精细化促进精准推送。相似性指标项下的案情和法律问题指标,其赋分依赖于标签要素的精准识别,而目前标签识别倚赖的自然语言处理等技术仍然存在短板,人工“贴标签”则操作粗糙,“对法律事实的归纳存在疏漏,很多法律细节未被标签化或未被准确地标签化”。[]因此,标签的精细化需要多方助力:其一是专家学者的深度参与。法学学者加入到知识体系及基础标签的编制工作中,可以使标签维度更完整、体系更全面、分层分类更深入[],从而提升识别精确性。标签的专业编制还有助于提升推送全面性,例如前述第15号指导性案例,在“人格混同”之外增加“人格否认”的标签,即可增加该案例被推送的概率。其二是人力资源的投入。由于标签自动识别仅在部分简单案件中有较好效果,大量案例模板仍需逐段、逐句、逐词进行人工标注,需要大量具有法律专业知识甚至实务经验的人员参与到标签标注中。其三是司法人员的积极反馈。科技公司应当定期邀请法官对类案是否有效、标签标注是否合理进行评价,以此完善标签体系,促进精准推送。

3.以系统集成化提升建设效益。鉴于类案系统建设所需的技术投入、人力资源和巨额成本,应当由最高法院集中人才和物质资源,完善全国统一的类案推送平台,统一标签体系和案例数据库,实现建设效益最大化,避免各地重复建设,不仅浪费资源,还可能因为标签体系不一致而影响类案类判的效果。

(二)案例数据的规范治理

结合层次评价模型中的权威性和法院类型指标,案例数据规范化治理应从以下方面着手:

1.提升司法公开质量。首先,从法院类型指标可以看出,类案类判具有地域性特征,法官最关注本市及本省类案,因此,要推进各地裁判文书上网工作均衡发展,否则文书公开滞后的地区,类案推送系统对法官的吸引力也将降低。其次,应当加快历史案卷电子化进程,向前延伸案例数据年限,尽量纠正文书时间分布上的失衡,使类案经验经受历史的检验。再次,要提升裁判文书的结构化、规范化水平,法官应在裁判文书中明确案件的争议焦点,尽量展示更多可标签化的细节,使系统更容易识别标签。最后,案例如果被评为市级典型案例,或者经过审委会或专业法官会议讨论,应当在裁判文书上网时增加标注,以获得适当的权威性赋分,方便优先推送。

2.重点推送权威典型案例。长期以来,全国法院系统致力以各类典型案例统一裁判尺度,自1985年起先后推出了《公报》案例、《中国审判案例要览》、《人民法院案例选》、最高法院审判参考系列案例、《人民法院报》案例指导专栏、《人民司法》案例专刊[]等,2010年《最高人民法院关于案例指导工作的规定》正式确立了案例指导制度,随后各省高院发布参考性案例的做法也得到最高法院认可。[]上述典型案例经过严格筛选,质量和权威性都有保证,但其作用还未得到充分发挥。据调查,在选择案例模板进行人工标注时,技术服务商并未网罗上述所有案例,对一些未及时电子化或较难搜集的典型案例更是直接舍弃,转而随机选择普通案例;而对参考性案例,某科技公司员工坦言基本只选北京高院发布的参考性案例,其他高院的参考性案例不在标注范围内,此种区别对待使得大量典型案例未能获得推送。如果说案例是法治长空中的散落星辰,典型案例就是夜空中最亮的星,应该排除障碍将其效用最大化,一方面要及时将案例电子化并上传类案系统,另一方面,在人工标注工作量和成本巨大的背景下,应当优先标注典型案例,优先保证这些案例获得推送。

(三)类案推送的有序呈现

通过本文建立的层次评价模型对案例进行赋分排序,可以较好地解决类案推送混乱无序的问题,占据最大权重的相似性指标可以将相似度不高的案例直接淘汰,权威性和法院类型指标则能起到辅助排序作用。除此之外,系统呈现类案还应有几点改进,其一是要显示相似性得分,其二是细化类案分层,其三是在历审案件中优先推荐二审和再审判决,其四是在三大核心指标总分基本相同时优先推送较新的案例。表二展示了一个有序呈现类案的示例。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    本文探究了类案推送系统应用的现实困境,在正确定位法官类案需求的基础上建立层次评价模型,提出从相似性、权威性和法院类型三类指标对案例进行赋分的基本规则,并从算法合理化、标签精细化、数据规范化等方面提出完善建议,促进类案全面、有序和准确推送。不可否认的是,技术瓶颈仍将长久地制约类案推送的精确性,通过人工智能实现类案类判仍然任重道远,但是,只要我们以开放的理念和扎实的脚步继续前行,希望就在前方。

 


 

 
责任编辑:李凌岩