边缘辅助群智感知隐私保护真值发现激励机制研究

论文价格:150元/篇 论文用途:硕士毕业论文 Master Thesis 编辑:vicky 点击次数:109
论文字数:30256 论文编号:sb2021040211180735057 日期:2021-04-14 来源:硕博论文网

本文设计的真值发现算法,和原有的 CRH 真值发现算法,在精度上几乎没有损失,但是在计算时间上有数倍的提升,在安全性能上也有出色的表现,但是还是有一定的优化空间,首先就是用户的权重信息会在逆向拍卖过程中暴露给边缘云,现有的加密算法还是无法做到加密逆向拍卖过程中的权重信息。

第一章 绪论

1.1 课题背景
移动群智感知(MCS)是一项以人为驱动的活动。它基于普遍的无线连接,具有内置感知功能的各种移动设备,以及工作者的移动性,以创建密集和动态的数据集,从而有效地表征环境信息。该数据收集活动需要尽可能多的工作者参与感知。关于同一物体的传感数据可以从多个工作者处获得。MCS 的工作者有可能在同一实体上提供相互冲突的和含有噪声的信息,如何在这些冲突的传感数据中发现真实信息是一个关键问题。MCS 的真值发现可以在不同的领域中获得许多应用,包括医疗保健,群智感知/社会传感,众包,信息提取,知识图谱建设等。
虽然已经有许多移动群智感知系统,但大多数都以工作者自愿参与为前提。工作者的参与成本很高。由于工作者在现实中是个体理性的,因此激励机制是移动群智感知系统的关键模块。它使工作人员能够获得适当的补偿,以补偿他们在感知,存储和传输数据上花费的时间,能量,计算能力,存储空间和数据流量。
但是在移动群智感知系统中,工作者提供的数据通常质量很差,包含由于记录或传输错误,设备故障或恶意意图而产生的过时,丢失或错误的记录。在几乎每个行业中,基于不可靠信息去做出决策都可能造成严重的损失。当大多数工作者报告虚假信息时,将无法通过投票或平均来发现真值信息。直观地说,应该更加信任来自可靠工作者的信息,即在移动群智感知系统中具有高权重的工作者。然而每个工作者的权重不是凭空得来的,他们的可靠度并不是先验的。目前研究者提出了很多基于可靠工作者倾向于报告真实信息并且真实信息会被很多的可靠工作者报告的原则的真值发现方法。
所以本文选择采用移动群智感知来实现真值发现,有真值发现过程来为群智感知提供可靠度,从而避免不可靠信息可能造成的损失,但是现有的基于传统云计算的数据处理方法在移动群智感知系统中存在一些缺点:
......................

1.2 研究意义
智能手机的普及为众包创造了巨大的机会,有人发出了某些信息的请求,而其他人帮助收集,处理这些信息并将其返回给请求者[2-3]。移动群智感知的一个重要应用是在紧急情况下收集图像信息[4]。在自然灾害或战场中,指挥中心可能需要关于某些特定目标(例如建筑物)的信息。 现场的救援人员,幸存者和士兵可以使用智能手机(或其他移动设备)拍照并将其上传到指挥中心。 照片中包含的信息,例如建筑物的损坏或洪水的程度,有助于指挥中心对人力,设备和物资的分配做出关键决策。除了在救援场景的应用外,群智感知在交通领域[5-6],环境监测领域[7-8],健康监测领域[9-10]等也起着越来越重要的作用。甚至在日常生活中,当遇到一些无法一个人去完成的任务时,可以通过众包平台将任务发布在平台上,通过招募足够多的智能手机用户来帮人们解决问题。
在群智感知系统中,如果没有足够的吸引力,智能手机用户是不会愿意主动花费自己的时间、精力和财力去感知和提交数据的。因此一个合理的激励机制对平台来说至关重要,但这也是群智感知中相对困难的一点。由于用户的自私性,用户会通过不同的策略,如提交虚假的成本信息[11-13],来提高自己的收益。因此一个激励机制的防策略性是必不可少的。除了防策略性之外,激励机制在不同的应用场景中有着不同的特性,如当任务具有时空特性时,设计的激励机制需要将时空特性的任务分配问题考虑进去,当用户提交位置信息时,需要将对用户位置的隐私保护考虑进去。除了这些,还有数据的质量保障、预算约束等。因此,需要针对不同的应用场景,设计出不同的激励机制来解决具体的问题。
现有的大多数移动群智感知系统[14-16]都依靠云服务来收集/聚集传感数据,分配任务,估算真值并激励移动用户。基于云的移动群智感应系统具有一些明显的缺点,例如,由于云服务器上的计算和通信拥塞,导致大规模群智感应的可扩展性较弱,难以识别感知数据的虚假位置,数据安全性高风险和用户隐私暴露。最近,已经提出了基于边缘计算的移动群智感知架构[7-11]来解决上述问题。基于边缘计算的架构对于移动群智感知的主要好处如下:降低计算复杂性:基于边缘计算的移动群智感知架构可以通过将计算从云上卸载到多个边缘服务器来并行化计算。合理的利用了原来那些没有被利用的边缘设备的计算能力,代替云服务器来进行一些计算任务,从而减少了云服务器上的计算压力。
.......................

第二章 相关背景知识介绍

2.1 移动群智感知激励机制研究现状
随着社会的不断进步以及科学技术的不断发展,近些年我国信息产业,在互联网的高速发展与广泛应用下有了很大的发展。随着时代的不断发展,智能手机开始逐渐的普及。在智能手机的作用下,人们有更多的方式来对周围环境和社会进行感知。传统的传感器部署方式逐渐转变为以人类携带移动感知设备的感知模式,也就是现在的移动群智感知的模式。
传统的感知方式通过在一定区域部署大量的移动传感设备,这些设备是固定的无法移动,这样不仅需要耗费巨大的资金,而且要消耗很多人力物力,这些设备一旦部署之后,就很难移动,即便可以移动,大批量的移动这些设备也会消耗很大的人力资源。由于部署的传感设备大都会暴露在自然环境下,所以很容易造成设备的损坏,设备的维修更换也将带来许多工作量以及人力物力的损耗。
但随着时代的发展,移动智能手机在人们之间逐渐普及,逐渐地人们对于数据的感知方式也有了更多的选择。其中移动群智感知来完成感知任务是目前最流行的方式。通过智能手机内置的 GPS(Global Positioning System)、麦克风、摄像头等传感设备来感知数据,在完成数据的感知之后用户将数据提交给数据需求方(如任务发布平台)。通过移动群智感知的方式来完成感知任务,相较于传统的部署移动传感设备的方式,不仅节省了成本,并且每个传感器可以更加灵活,节省了人力物力。
全球市场情报机构的(IDC)的研究数据表明,截止 2018 年全球智能手机出货量达到了14.2 亿部,从长期来看,2022 年智能手机出货量预计将达到 15.7 亿部[17]。随着 4G / 5G 网络和嵌入式传感器的出现,智能手机逐渐成为功能强大的可编程的移动数据接口。这些传感器可以协同地感知各种人类活动和周围环境。移动群智感知将需要感知的数据外包给一群参与用户,这些用户通常携带功能越来越强大的移动设备和大量的车载传感器。移动群智感知已成为满足大规模感知应用需求的有效方法,它可以应用于各种领域,例如 Sensorly[18]构建蜂窝/ WiFi 网络覆盖图,Nericell[19]和 VTrak[20]提供交通信息,以及 Ear-Phone[21]和NoiseTube[22]创建噪声图,共享单车系统的行程选择[23],实时交通管理系统[24]和 SmartBike[25]用于监测城市空气污染。
......................

2.2 基于隐私保护的移动群智感知真值发现
近些年来,大数据的挑战随着人们从物理世界中提取和收集数据的能力的急剧提高而不断增长。大数据的一项重要特性就是其种类繁多,即可以从各种来源获得有关同一对象的数据。例如,可以从公司的多个数据库中找到客户信息,患者的病历可能分散在不同的医院中,并且自然事件可以由多个实验室观察和记录。由于记录或传输错误,设备故障或操纵数据的恶意意图,数据源通常包含干扰,过时,丢失或错误的记录,因此,多个数据源可能会提供互相冲突的信息。在几乎每个行业中,基于不可靠信息的决策都会造成严重损害。例如,公司数据库中错误的帐户信息可能会导致财务损失;基于对患者的错误测量而做出的错误诊断可能导致严重后果;如果科学的探索发现是从不正确的数据中得出的,那么它们可能会被引导向错误的方向。因此,从多个冲突信息源中找出最可信赖的答案至关重要。
在数据库社区中研究解决多种来源冲突的方法已有很多年[64-66],从而产生了多种方法来处理数据集成中的冲突。其中,一种消除分类数据冲突的常用方法是进行多数表决,以便将出现次数最多的信息视为正确答案。对于连续值,可以简单地将平均值或中位数作为答案。这种投票/平均方法的问题在于,它们假定所有来源均具有同等可靠性,因此,来自不同来源的选票将得到统一加权。在当今复杂的世界中,评估数据来源的可靠性以从冲突数据中找出正确的信息至关重要,尤其是当存在来源质量低下的数据(例如传感器感知的错误数据、用户收到的某些垃圾邮件或者在 Internet 上传播的虚假信息)。但是,没有人告诉我们哪个来源数据更可靠,哪些信息是正确的。

图 2.1 三层的移动群智感知系统结构

..........................

第三章 边缘辅助群智感知隐私保护真值发现................................15
3.1 引言.....................15
3.2 基于边缘辅助双层云结构的群智感知系统模型................16
第四章 边缘辅助群智感知真值发现激励机制设计..........................25
4.1 系统模型与问题形式化...................................... 25
4.2 激励机制设计.................................. 26
第五章 激励机制性能评估.................... 34
5.1 仿真参数设置................................... 34
5.2 真值发现评估................................. 35

第五章 激励机制性能评估

5.1 真值发现评估
首先,通过仿真实验来评估 IMTEC,ER 和 SRD 真值发现的精度,他们的 MAPE 值如图5.1 所示。可以看到,所有三种算法的 MAPE 随着用户数量的增加而逐渐降低。 在三种算法中,IMTEC 可以获得最佳精度。 这是因为 IMTEC 考虑了边缘云中的用户数量,因此拥有更多用户的边缘云在真值发现中起着重要作用。同时,可以看到 IMTEC 使用的距离函数比 SRD更合适,因为 IMTEC 考虑了每个任务提交的数据的标准偏差,并且数据偏差较大的任务对更新用户权重的影响较小。

图 5.2   对真值估计结果的影响

..........................

第六章 总结与展望

6.1 论文总结

本论文的研究工作主要是针对移动群智感知在真值发现中的计算效率以及安全等方面的问题,提出了一种集成解决方案,以激发战略用户为边缘辅助群智感知中的真值发现做出更多贡献。首先通过真值发现算法进行真值发现,计算出真实值和用户权重,随后在更深层云进行以边缘云为单位的真值发现,然后通过逆向拍卖机制选择获胜的用户和计算获胜用户的报酬来实现最大化平台质量函数的目标。
考虑到传统的真值发现算法并不是适合边缘辅助的双层结构,本论文设计了一个新的真值发现算法,并考虑到边缘云的可靠性和重要性。本文最后还就用户的隐私保护问题上提出了一个有加密算法加密后进行的真值发现算法。
提出的激励机制是一个随机概率算法,有 2/5 的概率进行单用户最优选择,有 3/5 的概率进行多用户质量最大化选择。这是一个综合性的解决方案,可以同时保证机制的计算可行性,个人理性,真实性,预算可行性,以及较好的近似比。
参考文献(略)


上一篇:基于行为建模的智能终端用户身份识别的关键技术研究与实现
下一篇:复杂环境下异常感知的无线传感器网络节点定位算法研究