Copy Detect System

文本查重系统(Copy Detect System,简称 CDS),主要功能是判断文本之间是否重复,是否存在拷贝的可能性。系统采用WebApi接口形式设计开发,通过接口创建文本数据集的指纹特征,以及输入文本的指纹特征,通过文本的指纹特征进行文本相似度计算,进而判断文本是否重复。CDS系统分为查重引擎(中间件)和查重接口(WEB服务)两部分,均采用NET6开发,支持Windos\Linux部署,支持分布式+集群部署,支持Msql\Sql Server\Sqlite数据库,支持读写分离,支持Redis内存数据库缓存,支持中\英\中英混合文本查重,自带容灾备份策略。


CDS系统适用于科研管理部门开展科研项目查重(项目指南、申请书、结题报告、科技报告)查重等涉及科技文本的查重场景,软件部署灵活,可嵌入任何文本数据集,二次开发成本低;既可以个人用户在单台计算机进行部署使用,也可以机构用户在大规模集群下使用。

CDS也可用于知识产权侵权纠纷案件中侵权证据发现,如扣押服务器中是否存在侵权证据是,采用CDS可快速进行字词级别的证据发现。

CDS典型应用:国家重点研发计划、重大专项指南查重,王者之剑源代码侵权纠纷案。