快捷搜索:论文 合同 演讲 心得

2017年论文查重行业评测报告



前 言

随着数字图书馆和互联网的快速发展,数字化文档随手可得,大大地降低了论文抄袭成本。最近这几年各种名人学术造假、知识产权被剽窃的事件层出不穷,给学术界造成一定的诚信危机,其学术不端行为的危害引起了政府及主管部门的高度重视,加大了社会对这种不端行为的关注度,而如何防范剽窃和遏制这种不端行为成为人们研究的热点。

学术不端行为涉及到学术活动的全过程,包括学术研究、学术出版、项目申报、成果鉴定、职称评定、研究生培养等诸多环节,目前就世界范围来看,发现与规范学术不端现象,主要是靠教育与个人举报,缺乏有效技术辅助手段,同时由于涉及到各种复杂经济利益,导致往往投入巨大,成果甚微,甚至出现“愈演愈烈”的趋势。无论期刊出版界、高校、研究院所、还是出版主管部门、科研主管部门、教育主管部门都迫切需要一个高效的技术措施来帮助管理部门进行检查与惩治学术不端行为。

自从中国知网2006年开始正式立项,清华大学《中国学术期刊(光盘版电子)》杂志社有限公司和同方知网数字出版技术股份有限公司历时两年攻关研制学术不端文献检测系统,经一千多家中国各地科技期刊使用表明,该系统的研制成功,开辟了采用技术手段防范学术不端行为的新道路,知网防剽窃技术经过多年的不断研究深入,已经达到大规模实用化程度。

商家在看到此商业机会,开始研发自己品牌的学术不端检测系统。继知网之后,有万方、维普先后推出查重系统,他们是国内三大学术论文数据商,凭借拥有自己的学术论文数据,品牌影响力已经深入人心。其他无自己学术数据库商家,也争先研发各种查重系统,由于缺乏学术论文比对数据,多数是通过网络爬虫抓取互联网数据进行查重,好的系统通过自己努力检索的网络数据加上自己的搜索算法也有一定的参考价值。在利润的驱使下,其他劣质查重系统也迅速发展起来抢夺这块蛋糕,检测质量良莠不齐。且每年将近有800万毕业生,对于每一届的毕业生来说,论文查重都是人生的第一次,面对如此多的查重系统并不知如何选择,需要一个认知的过程。每年大量的学生检测后抱怨上当受骗,对检测结果很不满意,同时也花了冤枉钱还浪费了时间和精力。撰写这篇文章的目的是希望给第一次查重的同学在选择查重系统上提供一些参考,指导大家如何挑选适合的检测系统,同时也给对于想了解论文查重行业的同仁们起到共同学习的作用。

第一章论文查重行业概况

1.1、政策背景

在面临学术诚信的危机下,教育部发布了《关于加强高等学校学术道德建设的意见》、《关于树立社会主义荣辱观,进一步加强学术道德建设若干意见》等一系列文件,来指导落实打击学术不端行为,于是各级教育部门及时响应了国家号召,为了提高教育教学质量,加强学术道德和学术规范建设,树立良好的学风,建立诚信的氛围,恪守科学道德,让越来越多的高校、杂志社等引进了知网学术不端文献检测系统。

硕博士研究生教育是培养高层次科技人才的重要手段。研究生教育质量关系到科教兴国战略能否得到有效实施的关键。要想从根本上遏制学术不端行为,需要从学生时代树立起正确的科学观与诚信观。就目前来看,研究生培养是涉及学术不端行为的主要阶段,如期刊论文发表、学术会议论文、参加科研项目,最后学位论文撰写与答辩等过程,在这些环节中都可能涉及到各种诚信问题。在“爱护与保护”的氛围中,于是知网学术不端检测系统被强制使用,甚至延伸到对学生作业、老师课件的检查过程中。

1.2、市场概况

1.2.1市场形成的标志

目前高校引进的知网学术不端系统确实为规范学术诚信起到了一定的作用,但知网学术不端系统主要针对机构用来检查个人学术不端的工具,并不对个人开放。市场上倒卖供个人检测的知网价格很贵,检测一篇硕博学术论文需要几百元。部分同学为了省钱前期修改论文只好在网上寻找查重工具进行自查,最后再用知网检测。在这种情况下,每年产生了几百万人的自查市场,于是商家瞄准商机开发出各种查重系统,从而形成了现在的论文查重市场,国内查重市场形成的标志是以2008年知网学术不端系统的推广开始。

1.2.2 市场规模

随着学术诚信意识的增强,每年递增的毕业生加上越来越多的高校、机构的使用,近十年发展迅速,据最新统计数据,2017年大学毕业生有795万人,每个毕业生检测一篇一次花费大概20元左右,一般检测3次以上,至少花费60元,加上每年大概60万硕博研究生和需要评职称的社会工作者,大概860多万人需要使用论文查重系统, 保守估计至少10亿以上的市场,且大学生每年以5%的比例在递增,这一市场还在逐步扩大,对于一个轻资产公司服务的垂直市场,利润空间非常诱人。

1.3、查重标准

论文查重系统追求的标准是什么?论文检测在谈及标准前,首先看看使用目的。有查重需求的学生希望通过从市场上购买论文检测系统进行自检,预先检测一遍论文再进行修改,目的是看能否通过高校查重。而高校希望通过论文查重系统,检测出学生的学术不端行为。个人用的查重系统和高校用的查重系统就如同矛和盾的关系。学生查重目的是进行论文检测进行修改以满足符合学校的检测要求,那么高校用的查重系统就是个人版论文检测系统追求的标准。比如高校用知网系统,那么知网就是标准。这种为追求通过审查单位论文查重的标准,通常意义上称为狭义上的标准。商家在开发查重系统都会研究知网系统的算法,通过渠道购买大量学位论文数据作为比对源,为的是在努力缩小与这种标准的差距。

而就广义标准来说,在使用论文检测系统查重时,首先应该着重提高自我的论文水平,规范自己的学术诚信,不能一味地应付通过学校的论文查重。如果建立在这个前提之下,那么优秀论文检测系统就需要满足两个条件:一是比对数据库得全面,这个是根本;其次要计算相似率的算法合理,能找出论文中真正相似的内容。

在这里纠正一下对于论文查重软件标准的片面理解,大量的学生认为查重系统严格、查重比例高就是“准”,这属于片面理解。任何一个查重系统不可能收录完全一样的论文数据,多数是没有自己本地学术论文数据的系统。如果学校用知网系统,初期检测时用了其他系统,那么其他系统的数据库和知网是有差别的,差别表现在两个方面,一是知网的收录上,其他系统不一定收录;二是其他系统抓取的互联网资源,知网不一定抓取,所以知网检测比例是不一定比其他检测比例高的。另外其他系统抓取的互联网资源比较杂,有的数据并不符合知网收录标准,导致其他系统收录,知网就存在没有收录的情况,于是知网检测比例比其他系统检测比例就低了。每年大量同学在其他系统检测了几遍进行修改后,相似比例显示很低;在知网上检测,比例却很高,于是再重新修改,工作的反复浪费了很多时间、精力。在这一点上,同学们要认识到自己对论文查重标准的片面理解。

但就国内而言,最权威的查重系统还是属于知网学术不端系统,市场上没有自己学位数据库商家开发的系统都在向知网系统学习,追逐标准,模仿知网,而知网因有先天强大的权威数据库作为支持,加上优秀的算法,是目前市场上自查系统暂不可比拟的。其他系统是矛,知网系统是盾,短期内这种关系还不能改变。不过随着教育部及个人的学术诚信意识越来越强,这种现象一定会通过行业发展的方式在内部自行洗牌,这也是每个行业发展到一定阶段必然要走的过程。

第二章论文查重品牌概况

1、相关品牌

目前论文查重系统品牌众多,为了让广大用户清晰地了解论文检测品牌情况,依据权威程度、知名度、市场口碑等方面按一线品牌、二线品牌、三线品牌等级进行划分。

1.1一线品牌

1.1.1知网学术不端检测系统

中国知网是国家知识基础设施的概念,由世界银行于1998年提出。CNKI工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,由清华大学、清华同方发起,始建于1999年6月,在2006年立项开发知网学术不端系统,2008年开始推广高校、期刊杂志社使用。

从硕博研究生学术论文强制使用开始,几年的发展快速延伸到211和985院校,其他高校也开始以抽检的方式在陆续使用,包括出版社的审稿、职称评定、科研成果的查重等,使用范围越来越广泛。知网学术不端系统的数据范围包括如下:

中国学术期刊网络出版总库

中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库

中国重要会议论文全文数据库

中国重要报纸全文数据库

中国专利全文数据库

大学生联合比对库(收录历届大学生检测过的论文)

互联网资源(包含贴吧等论坛资源)

英文数据库(涵盖期刊、博硕、会议的英文数据以及德国Springer、英国Taylor&Francis期刊数据库等)

港澳台学术文献库

优先出版文献库

互联网文档资源

图书资源

CNKI大成编客-原创作品库

学术联合比对库(收录历届硕博研究生检测过的文章)

个人比对库

起初各个领域使用的知网数据库是一样的,随着社会发展和市场的需求,知网检测系统针对性越来越强,就不同领域,数据范围开始细分。使用对象的不同,数据库也有所差别,表格如下:

1.1.2万方数据知识平台相似性检测系统

万方数据股份有限公司是国内较早以信息服务为核心的股份制高新技术企业,在互联网领域,集信息资源产品、信息增值服务和信息处理方案为一体的综合信息服务商。公司目前有六家股东单位:中国科技信息研究所、中国文化产业投资基金、中国科技出版传媒有限公司、北京知金科技投资有限公司、四川省科技信息研究所和科技文献出版社。

万方数据知识服务平台相似性检测服务在2010年6月正式上线,个别高校和杂志社在使用,相对于知网,机构用户比较少。数据库来源主要是被万方收录自己建设的本地库,比对的网络资源少,和其他有网络资源库查重系统比较,检测结果多数情况下比例偏低。有自己数据做支持,检测有一定的权威性,在机构使用普及度和权威性上没有知网高。

万方数据库如下:“中国学术期刊数据库(CSPD)、中国学位论文全文数据库(CDDB)、中国学术会议论文数据库(CCPD)、中国学术网页数据库(CSWD)”。

1.1.3维普论文检测系统

重庆维普资讯有限公司的前身为中国科技情报研究所重庆分所数据库研究中心,是中国第一家进行中文期刊数据库研究的机构。作为中国数据库产业的开拓者,数据库研究中心于同年自主研发并推出了《中文科技期刊篇名数据库》,成为中国第一个中文期刊文献数据库, 是中国最大的自建中文文献数据库。它的问世标志着我国中文期刊检索在实现计算机自动化方面达到了一个领先的水平,同时结束了我国中文科技期刊检索难的历史。

维普在2013年3月联合湖南通远网络科技有限公司,推出了依托维普数据开发的论文检测系统“Gocheck”。开始通过线上网络推广和线下推广高校使用相结合,迅速抢占了一定市场份额。在2015年由于一些内部原因,维普终止合作,推出自己研发的一套论文检测系统---“维普论文检测系统”(根据市场使用对象的个性化需求推出了研究生版、大学生版、职称版的检测系统)。维普数据库范围如下:

中文科技期刊论文全文数据库

博士/硕士学位论文全文数据库

外文特色文献数据全库

中文主要报纸全文数据库

中国主要会议论文特色数据库

个人比对自建库

中国专利特色数据库

维普优先出版论文全文数据库

图书资源

港澳台文献资源

1.2二线品牌

这类品牌定位标准主要依据自有技术和发展沉淀而来,用户使用量比较大,品牌的百度指数比较高。目前这类品牌有PaperPass和PaperFree。

1.2.1 PaperPass

PaperPass起初是个人开发的论文检测系统,2010年8月正式推向市场,开始主要靠抓取互联网资源进行查重,后来在2013年初涉嫌通过黑客技术盗取国内知名数据商的数据被告发。网站停运近一年,该品牌转到北京智齿数汇科技有限公司旗下重新运营,由于品牌投放市场较早,用户基数较大、品牌影响力迅速得到恢复。最近两年通过天猫和其他网络渠道的推广,品牌知名度在论文检测行业有很大的影响力。

1.2.2 PaperFree

PaperFree检测系统是湖南写邦科技有限公司旗下品牌,2015年初上线开始以免费10万字检测迅速扩大了影响范围,后推出先免费后付费的使用体验服务,满足学生的高性价比需求且得到了快速传播。PaperFree结合自己的技术不断以提高用户体验为出发点,从2015年系统正式推出片段降重到2017年初推出“在同一个界面边修改边检测,及时同步反馈查重结果”的在线改重,在用户体验方面领跑目前论文检测市场。品牌知名度和口碑得到了进一步提升,市场影响力有赶超PaperPass之势。

1.3 三线品牌

此类品牌划分标准,主要因市场影响力一般,部分在逐渐没落或近期才推出的系统,知名度和影响力较弱。品牌主要有Gocheck(格子达)、Papertime、Paperright(Writecheck)、大雅(Paperyy)、Papertest、Ptcheck。

1.3.1 Gocheck(格子达)

Gocheck是早期品牌,和维普合作有过一段辉煌历史,但自从与维普终止合作后逐渐走向没落,之后推出的格子达品牌,以免费为噱头,名义上打出永久免费检测,但在查看完整报告时要另外加收费用,免费体验方面较PaperFree不够彻底。

1.3.2、大雅(Paperyy、笔杆)

大雅相似度分析是超星提供图书数据支持的文章查重系统,论文数据库缺乏。Paperyy和笔杆行业上流传是超星系,和大雅是兄弟关系。Paperyy在2017年初率先推出了自动降重功能,不只是用系统能查重,还能实现自动降重,由原来的人工降重向机器人降重转变,开辟了自动降重先河,具有里程碑意义。

1.3.3、Paperright(Writecheck)

Paperight前身是Paperrater,因商标被抢注,后被迫改为Paperright系统。Writecheck属于同一个公司推出的低价品牌,查重报告结果差,市场反应口碑不好,缺少一定核心技术革新。

1.3.4、PaperTest(PaperPass的子品牌)

PaperTest早期属于淘宝店铺的一个品牌,由于最早采用完全自营的推广模式结合低价的万字收费手段,销售业绩非常惊人,在商标被北京智齿数汇科技公司抢注后,该淘宝店铺被迫更名品牌为PTcheck。目前主要在天猫和淘宝销售。

1.3.5、PaperTime

PaperTime是湖南写邦科技有限公司推出的同步在线改重查重品牌,与PaperFree是兄弟关系,在2016年末推出后,该品牌市场反应较佳,最大的亮点是在线改重功能,实现一边修改一边检测,及时同步反馈查重结果,在很大程度上提高了论文修改效率。

1.3.6、PTcheck

PTcheck于2013年在淘宝推出,主要以淘宝流量为主,通过拍淘宝链接交易,检测价格便宜,以比对互联网数据为主,查重效果一般,缺乏一定核心技术支持,无太多的亮点。

2、各个品牌查重情况分析

论文查重系统主要作为检查论文中出现的不端行为提供辅助工具,在技术上实现了有效的反抄袭、反剽窃,主要体现在各自特色功能和计算相似方法。表现如下:

2.1查重技术表现比对分析

各种查重系统的检测算法存在一定的差别,那么什么样的系统检测论文才合理呢?详细情况如下表:

查重系统检测算法表现比较表

2.2各个品牌价格及优惠等比对表

2.3产品的特色功能

在产品技术层面,各个论文查重系统从提升用户体验的角度勇于创新、敢于大胆尝试,特别是PaperFree、格子达、PaperPass、Paperyy在功能创新方面取得了质的飞跃。

1、PaperFree:独创业内唯一的在线改重功能,操作步骤简单明了,实现同一界面上一边修改一边检测,即时反馈查重结果。目前这一特色功能领先于行业内其他同类产品,在查重过程中,用户体验大大提升。

2、格子达:具有在线改重功能,需要改一段提交一段,体验感觉不佳。

3、PaperPass:近期开发了片段查重功能,技术较陈旧,体验远不如PaperPree同步在线改重。

4、Paperyy:通过大数据AI算法,针对论文检测报告实现了机器人降重,修改后的语句比较通顺,提高了论文修改效率。

3、各个品牌市场影响力概况

3.1品牌在互联网上信息量情况

以下树形图是根据没有本地数据库的检测品牌在互联网网页索引量信息上的粗略统计,通过该图可看出,各个品牌在互联网上的信息量,同时反映了各个品牌互联网上的影响力。PaperPass在2007年建立的品牌时间较长,影响力最大,PaperFree在2015年建立,属于新品牌,而影响力紧跟其后。

3.2市场份额概况

为了能更好地了解各大检测系统的市场份额情况,根据百度指数粗略估算,该估算能比较客观地反映用户使用情况。

该图如下:

作为国内三大学术论文数据商---知网、万方、维普在论文检测市场中,知网作为多数定稿必用的查重系统,搜索量大是必然,万方次之、维普最小。

其他检测系统中,PaperPass的指数最高,PaperFree次之,其他的系统处于5%左右,有的甚至没有指数。PaperPass、PaperFree两个系统几乎占到了整个行业的半壁江山,说明其品牌影响力大、使用人数多、市场认可度高,较清晰地反映出目前其市场份额。而作为有本地数据的万方、维普与其比较存在一定的差距。

三大数据商属于国有企业,市场运营方面缺乏一定灵活性。PaperPass和PaperFree作为个人查重市场中的两大巨头,在产品规划和推广策略上是可圈可点的。

3.3品牌市场概况总结

论文查重最先起步于淘宝平台,作为查重业务的主要流量来源地,一直都是各大商家开展查重业务的必争之地。

自2015年天猫新增查重类目后,拦截了淘宝部分流量,至此商家开始争夺天猫这块平台流量。由于天猫要求门槛高(商家须提供商标、数据授权等资质),拦截大部分淘宝商家不能进驻天猫,只好转战百度、360搜索引擎作为引流入口。

自2017年淘宝实施提高查重行业的保证金和进驻淘检测等措施,开始整治天猫和规范淘宝查重市场,导致多数淘宝商家争夺搜索引擎流量,于是商家转战京东,展开试水阶段的行动。

各大论文查重在抢占争夺市场份额的同时,同质化服务比较严重,在这种情况下想脱颖而出,只有差异化竞争。比如PaperFree、PaperTime在2017年初推出同步在线改重;PaperPass在2017年下半年推出片段改重;Paperyy在2017年推出自动降重,激烈地争夺市场生存空间。

在市场激烈的斗争中,为了吸引更多流量,商家推出各种形式的领取免费字数活动,目的是通过前期免费送字数来吸引流量。另外在产品线的延伸服务上,Paperyy正在试水“免费查重引流、收费降重赚钱”的互联网思维模式,这也是市场发展的必然趋势,预计不久将会出现类似 “360免费杀毒软件”的颠覆性行动,论文查重一律免费,将对整个查重市场进行重新洗牌。对于没有产品研发能力或者缺失市场运营能力的商家,将逐渐被不断地技术革新和市场运营模式的创新所淘汰。

4、各品牌优缺点

中国知网查重(CNKI)

优点:学术不端检测的权威, 目前查重标准;

缺点:不对个人开放,市场上检测价格贵。

万方数据知识平台相似性检测系统

优点:有本地数据做支撑,检测有一定客观性。

缺点:缺少网络资源,检测结果多数情况下比例偏低。

维普

优点:有自己数据库支持,有一定的参考价值;

缺点:价格不便宜,相似来源部分不清晰,算法有待提高。

PaperPass(PaperTest)

优点:成立早,用户基数大,有一定口碑。

缺点:缺少本地数据库,检测结果缺乏稳定性。

PaperFree(PaperTime)

优点:主打免费牌,具有在线同步改重功能。

缺点:检测主要依托互联网数据,多次检测,结果存在一定波动

Gocheck(格子达)

优点:报告检测完毕带有微信提示功能,体验不错;

缺点:逐渐走向没落,品牌影响力在减弱。

Paperright(Writecheck)

优点:缺乏亮点

缺点:缺少核心技术,算法差,相似来源匹配不准。

大雅(Paperyy)

优点:检测图书类文章效果较好

缺点:缺少一定论文数据,论文检测效果不佳。

Ptcheck

优点:价格便宜

缺点:比对结果以互联网数据为主,缺少论文数据。

第三章行业总结

论文查重市场正处于一个快速成长期,多种查重系统的出现是市场发展必然趋势,让越来越多的人意识到学术道德建设的重要性,强化提高论文的原创性、减少抄袭行为,具有很强的现实意义。

在调查中,据某知名大学的一位老师所述,查重技术的出现,在很大程度上确实对规范学术有一定作用,至少对学术不端行为会有一定震慑作用。但是通过技术查重手段来预防学术不端毕竟是机器而不是人,在机械性的判断情况下也存在漏洞、有一定的局限性,具体如下:

1、对于案例讨论、问题举例、调查问卷、法条等一些内容的引用也会标注抄袭嫌疑。这个是写文章的正常行为,判断抄袭属于不太合理。文科类会出现比较多的这种现象,这种现象导致作者很难修改,于是只能为了修改而修改。于此,预防学术不端变成了应付规范学术不端行为。

2、查重软件能杜绝抄袭,但是不能提高个人论文质量水平。

通过软件来提高论文质量估计很难。有学生答辩和提交查重的论文是完全不一样的文章,可能是一篇风马不相及的论文,这种规避查重的行为对提高论文质量一点作用都没有。其他情况如抄袭别人未发表的作品、小范围交流的内部文稿,这些都很难检测出来,这种抄袭和自己的学术能力也是没有关系的。

3、论文观点的剽窃软件是无能为力的。

查重软件是机械的找出论文相似部分的内容,对于内容的观点、思想的剽窃还是处于无能为力的状态,通过变换说法,变换句式等重新表达,查重系统是检测不出来的,对于现在大学的指导老师必须要花费很大精力去检查学生的论文才能减少抄袭现象的发生。

纵观目前的这么多查重系统,他们目的只有一个,就是端正学术行为。通过技术实现预防和检查学术不端行为只是一种手段,如果通过这种技术手段达到警示作用,逐渐形成良好的学术氛围,让同学们自律自己的学术研究,从这方面来讲才是论文查重软件存在的真正意义,也是政府及管理部门想看到的理想局面。



您可能还会对下面的文章感兴趣: