基于细粒度用户可靠性的众包任务分配研究分析工商管理专业.docx
《基于细粒度用户可靠性的众包任务分配研究分析工商管理专业.docx》由会员分享,可在线阅读,更多相关《基于细粒度用户可靠性的众包任务分配研究分析工商管理专业.docx(36页珍藏版)》请在优知文库上搜索。
1、前言3第1章绪论411J)IJ.正页;111.2 国内外研究现状及挑战41.3 本文的主要工作及创新点4第2章相关技术和研究工作72.1 众包基本特征72.1.2与外包区别72.2 众包工作流程823)iJIj82.2.1 AmazonMechanicalTurk82.2.2 科研领域应用9旦.fjlS*12.4.1 低质量结果产生的原因102.4.2 相关工作115J-1一*11第3章问题抽象与模型建立13第4章算法研究154.1 共聚类可靠性矩阵154.1.1 基于用户回答准确率的任务聚类154.1.2 计算共聚类164.2 预1贝!目K任务正确答案.,164.2.1 朴素贝叶斯相关的统计
2、学知识164.2.2 朴素贝叶斯模型174.2.3 3预贝!目K任务答案.,.17第5章实验与对比225.1 模拟仿真5.1.1 贝塔分布5.1.2 狄利克雷分布5.1.3 模拟用户作答5.1.4 分析预测结果5.2 相关预测方法5.2.1 majorityvoting5.2.2 weightedvoting5.3 方法对比5.3.1 k折交叉验证.5.3.2 对比结果5.4 本章小结第6章总结与展望6.1 本文总结6.2 后续工作展望.22.22.22.23.23.25.25.25.26.26.26.29.30.30.30.32.346.3 致谢摘要众包(CrOWdSoUrCing)计算模式
3、因其自身优势,近年来被学术界视为一种高效大规模数据集收集方式。但是,由于众包用户自身能力所限,不同用户提供的答案可能存在不合理的情况。因此,如何将收集到的用户答案进行整合,来推断任务的正确答案,是一项关键问题。己有的真实答案预测方法通过挖掘用户可靠性和任务话题之间的相关性来解决这一问题。但是,己有研究仅在有限的任务上起作用,对标准数据集的利用不充分,对于有些任务不兼容。为了考虑兼容性,我们认为任务和用户都存在聚类,进而提出了一个通用的细粒度方法。该方法包括两个方面:建立共聚类和基于共聚类可靠性模型的真实答案预测机制。首先,基于用户对标准任务的回答,利用特定的聚类方法得到用户聚类、任务聚类,建立
4、共聚类可靠性模型。然后对于一系列答案未知的目标任务,根据学习得到的模型,将收集到的用户答案以特定的方式组合,预测出目标任务的真实答案。通过理论分析,我们证明了本论文提出的方法适用性强,可以更好的表达用户和任务之间的关系。同时,实验表明,我们的方法可以对目标任务得到更为精确的估计。关键词:众包;共聚类模型;答案预测;标准任务AbstractCrowdsourcinghasbeenregardedasaveryefficientandpromisingmethodtocollectlargedatasetsinrecentyearsduetoitsnativeadvantages.Unfortun
5、ately,theanswersprovidedbyworkersofcrowdsourcingarenotalwaysreasonablesincethevariationabilitiesofworkers.Sohowtointegratethecollectedanswerstoinferthetrueanswerofthetargettasksisacriticalissue.Existingstate-of-the-arttruthdiscoverymethodssolvetheproblembyexploringthecorrelationbetweensourcereliabil
6、ityandtasktopics.However,theabovemethodscanonlyworkwellinlimitedtasks,sincetheyoftendonotmakefulluseofglobaldatasets.Weconsiderthatbothtasksandsourcesexistclustersandproposeageneralfine-grainedmethod,whichcanmaintaincompatibility.Themethodincludestwoaspects:buildingco-clusterreliabilityanddiscoverin
7、gtrueanswer.First,basedonanswersforstandardtasks,wecancalculatethesourceclustersandtaskclustersthroughspecificalgorithmsothatco-clusterreliabilitymatrixcanbebuilt.Thenforaseriousoftargettasks,wecollectworkers,answersandaggregatethem,makingfulluseofthepattern,toproducetheestimation.Throughthetheoreti
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 细粒度 用户 可靠性 任务 分配 研究 分析 工商管理 专业
