邮箱
云南网邮箱 云报邮箱
法治新闻
您当前的位置:云南网 >> 法治频道 >> 法治新闻 >> 正文
加快推进高质量检察数据集建设
发布时间:2026年06月09日 06:30:00  来源: 检察日报

原标题:加快推进高质量检察数据集建设

我国正全面实施“人工智能+”行动。在此背景下,各领域垂直大模型和智能体不断涌现,数据作为人工智能应用发展的三要素之一,已在诸多场景下形成新的发展前景。高质量数据集建设不仅有助于各领域垂直大模型和智能体的自我完善,同时也有助于增强其场景适用性。随着检察大数据的有效挖掘与科学处理,高质量数据集正以前所未有的广度与深度,形塑着检察大模型和智能体的研发应用,检察履职方式的人机融合表现显著。在此过程中,数据质量风险、数据安全风险等问题也会随之出现。因此,前瞻研究高质量检察数据集建设,不仅在理论上具有交叉学科研究的紧迫性,更是实践中加强数字检察建设的必要之举。

推进高质量检察数据集建设的需求识别

推进高质量检察数据集建设,应当重点把握其实践需求。它的需求识别主要涉及四个维度:数据来源、数据可用、数据安全、数据生态。

数据来源。随着检察职能作用愈发凸显,统筹处置内外部数据的重要性持续提升。就内部数据而言,检察机关如何精准激活存储于各板块内的业务数据,是提升检察工作高质量发展的重要抓手。对此,检察机关应依托全国检察业务应用系统内的海量数据,通过数据分析整合,有序释放业务数据效能。就外部数据而言,检察机关应依托政法工作数字化平台,加强与公安、法院、司法行政等单位的数据互通,同时,针对市场监管、生态环保、金融监管、社会保障等领域,搭建数据交互渠道,实现跨领域数据共享共用。

数据可用。检察领域所涉大量电子卷宗、音视频证据等,往往是非结构化或者半结构化数据,直接分析处理难度较大。为提升数据实用价值,检察机关在推进高质量数据集建设中,应强化法律文书的语义解析和实体信息标注,精准提取涉及的罪名和量刑情节等核心要素,完成数据结构化转换,以此建立句法和语义互通适配机制,切实赋能各项检察业务工作。

数据安全。数据安全防护不应仅停留于逻辑架构设计,因为再完善的逻辑体系,也无法预判和应对实务中的各类风险隐患。为此,检察机关需要建构一个覆盖数据采集、存储、传输、共享、使用与删除等全生命周期的安全框架。此外,还应结合检察实务场景,提升各业务场景下数据安全应对处置能力。可以采用属地授权和场景授权相结合的方式,对重要数据进行动态监管,确保所涉重要数据可用但不可见。

数据生态。打造优质可持续的数据生态,是推进高质量检察数据集建设的主要目标之一。检察机关应牢牢把握检察业务的实际需要,在权限可控范围内构建行刑反向衔接、公益诉讼线索发现等专项数据集,积极释放数据应用效能。针对不同业务场景的数据,开展动态质量评估,以完整性、一致性、时效性等为考核指标,定期对数据集开展校验优化,持续提升数据集整体质量。

推进高质量检察数据集建设的主要举措

为提升检察数据集建设成效,着力实现“人工智能+”检察工作的有序开展,应建立融合数据生态、技术使用、规范塑造的综合治理体系,促进“人工智能+”检察工作健康可持续发展。

确保数据来源合法合规。有效拓展数据来源的同时,保障数据源合法规范的核心在于,打通检察机关内部和外部的数据接口,实现所涉数据的自动、有序、规范接入。这要求检察机关结合业务场景需求,制定相应的元数据标准,确保案件信息、人员信息、法律文书类型等核心字段的一致性。在内部数据整合方面,主要整合法律文书、电子卷宗、办案流程等各类办案数据,按照人员、事件、地域、时间等维度分类梳理归集。在外部数据联通方面,应积极与其他政法机关及政府部门签署数据共享协议,明确数据共享范围、方式、责任和保障措施等内容。

深挖盘活数据应用价值。检察机关应综合运用深度学习技术,识别法律文书所涉的罪名、证据信息、量刑情节、监督事由等关键信息,把非结构化数据转化成可计算的结构化数据。在此基础上,应进一步挖掘结构化数据的使用价值,比如,依托结构化数据,借助知识图谱技术搭建数据关联体系,构建检察专业知识库,以此推进人工智能辅助检察办案系统纵深发展,为推进数字检察建设提供数据支撑。

保障数据安全可控。检察机关在保障数据安全方面已积累大量宝贵经验,相关保障举措在检察业务中已形成制度化、规范化运行体系。目前,检察机关已建立常态化数据安全审查机制,并依托业务应用场景,落地数据脱敏管控模式。在未来检察工作中,应充分结合有关数字技术规范和标准,研判检察数据分类分级工作中的现实难点,针对性制定核心数据、重要数据和一般数据的分级防护准则。针对电子证据的收集、存储、传输、示证与庭审质证全流程,进一步细化安全处置规则,同时强化技术安全防护,运用去标识化、匿名化和差分隐私处理等技术处理涉密、敏感数据,全方位筑牢检察数据安全防护线。

加快推进业务场景拓展应用。场景拓展应用在检察工作中占有重要地位。在数据交换和共享场景下,检察机关可运用API(应用程序编程接口),让数据在不同机关之间进行交换和共享。此外,结合检察履职实际需要,可以搭建电信网络诈骗犯罪等类案专业化数据集以及法律监督类数据集。以民事检察业务为例,办案中可依托人工智能技术深度分析民事裁判相关数据,精准研判案件线索,有效防范虚假诉讼等民事违法行为。

加快推进高质量检察数据集建设,既是贯彻实施“人工智能+”行动的直接体现,也是数字检察建设的题中应有之义。检察机关应充分把握高质量数据集建设的内在规律与科学方法,在严格遵守法律规则和伦理规范的基础上,挖掘检察业务开展的场景需要,锻造既精通法律又掌握技术的复合型检察人才队伍,持续推进高质量检察数据集建设,为新时代检察工作高质量发展提供强劲动力。

(作者为中国法治现代化研究院研究员)

责任编辑:小云
关注云南发布
关注云南网微信
关注云南网微博
新闻爆料热线:0871-64160447 64156165 投稿邮箱:ynwbjzx@163.com
云南网简介 |  服务合作 |  广告报价 |  联系方式 |  中央厨房 |  网站声明
滇ICP备08000875号 互联网新闻信息服务许可证编号:53120170002 信息网络传播视听节目许可证号:2511600
互联网出版许可证:新出网证(滇)字 04号
广播电视节目制作经营许可证号:(云)字第00093号
增值电信业务经营许可证编号:滇B2-20090008 ® yunnan.cn All Rights Reserved since 2003.08
未经云南网书面特别授权,请勿转载或建立镜像,违者依法必究
24小时网站违法和不良信息举报电话:0871-64166935;举报邮箱: jubao@yunnan.cn