众包数据库管理、时空众包、移动群智感知方向的综述整理——附思维导图
众包数据库管理、时空众包、移动群智感知方向的综述整理——附思维导图
论文介绍
该方向的发展主要分为三个模块:时空众包、群智感知、众包数据库管理;
然后我就选择这个方向上其中一个具有代表性的团队综述进行分析:
众包数据库管理
该章节内容及思维导图整理的论文是出自柴成亮, 李国良, 赵天宇, 骆昱宇, 于明鹤. 众包数据库综述. 计算机学报, 2018.
现如今,对于许多数据处理与分析的任务(例如实体匹配),仅仅依靠机器算法不能达到很好的效果。幸运的是,众包(crowdsourcing)模式的出现在很大程度上解决了这一问题。众包概念最初是由美国《连线》的记者JeffHoew在2006年提出的,其定义是:“一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)网络大众的做法”。也就是众包利用人的智慧来帮助我们解决大型的、对于机器来说很难的问题。在过去的十年中,众包模式已经不知不觉惠及到几乎每一个人并成为数据挖掘和数据管理的一大研究热点。一些影响力极其深远的工程,例如维基百科,百度知道,百度百科还有学术界的ImageNet,都是通过众包模式来构建的。步入大数据时代,数据量在不断增大,数据的表现形式也越来越多样化,导致众包的需求量增大以及任务的形式增多,在线众包平台应运而生,例如亚马逊的AmazonMechanicalTurk(AMT)、Crowdflower和Upwork。在这些平台上,我们可以轻松地雇佣千上万的工人(Worker)来帮助我们解决问题。解决问题的流程可以概括为以下三步:(1)任务发布者(Requester)发布许多任务到众包平台。(2)众包平台把任务分配给工人。(3)工人回答问题并返回答案给任务发布者。
然而,对于任务发布者来说与众包平台交互是比较不方便的,因为众包平台会要求任务发布者设置很多参数甚至书写代码来布置任务。为了解决这一问题,受传统数据库管理系统的思想启发,研究人员们提出了众包数据库例如CrowdDB,Qurk,Deco和CDB。一方面,这些数据库提供了描述性的编程接口,其允许任务发布者利用简单的类SQL语言来发布任务并与众包平台交互。另一方面,众包数据库封装了平台与工人交互的复杂流程。针对不同的数据库算子,众包数据库会自主选择不同的策略来分配任务并推理答案。这样大大提升了答案质量,降低了众包开销,也使得任务发布者不需要亲自设计相关策略。在这种设计思想下,当任务发布者给出一个类SQL查询,众包数据库首先解析这个查询,生成带有众包算子的查询计划。接着根据计划生成任务发布到众包平台上,最后收集众包工人的答案并产生最终的结果。
众包数据库与传统数据库的不同主要有以下两点。第一,传统数据库采用的是封闭环境(ClosedWorld)的模型。该模型仅能处理数据库中已经存在的数据。然而众包数据库采用的是开放环境(OpenWorld),该模型可以利用人工来获取外部世界的数据,加载到数据库后再进行处理。例如,收集一条新的记录或者填充一个属性。第二,众包数据库可以利用人的智慧来处理数据库相关算子。例如,比较两个实体是不是指代同一实体,记录之间的排序,为实体打分等等。
完整思维导图资源(可以私信/评论,邮箱私发给您):
时空众包
该章节内容及思维导图整理的论文是出自童咏昕, 袁野, 成雨蓉, 陈雷, 王国仁. (2017). 时空众包数据管理技术研究综述. Journal of Software, 28(1).
随着移动互联网技术与共享经济模式的快速发展,移动计算技术为众包数据管理带来了更多的外延需求,其不仅延伸了众包数据管理系统所需管理数据的类型,更延伸了众包数据管理系统可获取数据的方式。所谓延伸所需管理数据的类型是指:由于移动设备自身携带着大量时空数据共享经济思维导图,且此类时空数据又与众包任务和众包参与者(也称为“众包工人”)的行为密切相关,众包数据管理系统不得不考虑如何有效地处理此类新型数据问题.例如,近年来全球流行的各类实时专车类服务平台,如滴滴出行、神州专车与Uber等,均采用时空众包方式提供服务,其中,专车用户为众包任务请求者,专车司机即众包参与者.所谓延伸可获取数据的方式是指:移动设备日益强大的功能产生了一类以获取数据为目标的新型众包任务.例如,美国的Gigwalk公司[23]组织众包参与者通过智能手机收集不同超市的物品价格,而国内高德地图公司推出的“道路寻宝”服务也旨在组织众包参与者收集国内各大城市的道路周边信息。
综上所述,移动互联网与物联网等技术的飞速发展,使得众包数据管理技术从基于在线众包平台的模式转变为一种新型的服务模式,称为“时空众包(spatiotemporalcrowdsourcing)”(也称为空间众包或移动众包)。简言之,时空众包数据管理技术是指以时空数据管理平台为基础,将具有时空特性的众包任务分配给非特定的众包参与者群体为核心操作,要求众包参与者以主动或被动的方式来完成众包任务并满足任务所指定时空约束条件的一种新型众包计算模式。特别地,当前“互联网+”时代的共享经济模式为时空众包数据管理技术提供了大量实际应用。具体而言,近年来流行的各类O2O(online-to-offline)应用、灾情监控、交通管理、公共安全、物流管理和社交媒体等领域,都有意或无意地采用了时空众包技术以提高其服务质量。因此,时空众包数据管理技术已遍及百姓衣食住行等各个领域,并在人们日常生活中扮演着越来越重要的角色。
不同于其他众包技术综述类文章,本文仅聚焦于时空众包数据管理技术,首先揭示时空众包与传统众包技术的区别与联系,随后以时空众包平台的工作流程与其任务特点为基础深入讨论了当前时空众包数据管理的3项核心研究问题和3类应用技术的研究现状,同时也展望了时空众包数据管理领域未来潜在的研究方向共享经济思维导图,为相关研究人员提供有价值的参考。
完整思维导图资源(可以私信/评论,邮箱私发给您):
移动群智感知
该章节内容及思维导图整理的内容是出自京东联合实验室“城市计算夏令营”上於志文老师的演讲分享。
收集“城市大数据”则是开展城市计算研究的基石。基于静态设施的传统感知技术(典型代表为物联网)存在部署成本高、覆盖范围有限等不足,难以满足城市空间大规模动态感知需求。以群智感知(Crowd Sensing)、无线感知(Wireless Sensing)等为代表的新型感知技术成为应对公共安全、灾难应急等重大挑战的有效方式,受到国内外学术界和工业界的广泛关注。群智感知利用广泛存在的智能设备(智能手机、可穿戴设备、车载设备等),实现灵活机动且成本低廉的数据收集。移动群智感知(Mobile Crowd Sensing)是群智感知的一种特殊形式,其以大量普通用户及携带的智能设备作为感知节点,利用大众的广泛分布性、灵活移动性和机会连接性实现大规模时空感知。相比群智感知,移动群智感知覆盖范围更广、灵活性更强,是一种“以人为中心”的感知模式,通过利用显式或隐式的大众“智慧”(即群体智能),对低质、冗余、碎片化感知数据进行优选和增强理解,进而为城市计算提供更加优质的数据。移动群智感知关注的主要科学问题是:1)如何合理选择和协同泛在、互补的群体感知能力实现高质量感知;2)如何高效处理和融合低质、冗余的群体感知数据实现准确理解。
移动群智感知结合移动群智感知关键科学问题,重点在感知任务分配、感知数据汇聚、群智融合计算等方面开展研究工作。
完整思维导图资源(可以私信/评论,邮箱私发给您):
总结
这里整理的只是本人自己在平时阅读众包方向论文时遇到的具有代表性的大牛团队及自己所感兴趣的方向,这些都是国内的一些研究学者团队,当然在众包方向上国外的一些团队也很强例如:Vincent Lenders.Princeton University,USA. ; Atsuyuki Morishima.University of Tsukuba,Japan.
新的一年要快乐,加油吖 ( ^ _ ^ ) !
手机浏览,点击图片保存二维码到相册,然后打开微信扫一扫选择本二维码图片就可以进入,电脑端微信“扫一扫”二维码,进入找聊天搭子平台,里面有找饭搭子、找对象、找陪伴服务等等