大数据分析和处理面临着巨大挑战。计算机算法的优势在于对大数据处理的高效性,而群智分析更能保证准确性,因此计算机与群智的有效结合能够提高大数据处理的准确性和效率。本报告首先概要介绍大数据计算中的难点问题,特别分析了计算机与群智融合计算所面临的科学问题和技术挑战以及当前的研究进展。
群智系统是在互联网的推动下发展起来的一类重要的应用系统,目前已经在机器学习、问答系统、软件开发等诸多应用领域得到了广泛的应用。随着互联网、大数据、人工智能和物联网等的进一步发展,群智系统将会发挥更加重要的作用。然而,由于群智资源的特殊性以及群智协同计算环境的开放性,质量保障依然是群智系统所面临的重要挑战之一。围绕群智任务的设计、工人处理任务的质量和群智结果的处理等,研究群智系统的质量保障是重中之重。
众包是一种新型的任务分配和执行模式,能把过去需要分配给特定个人完成的任务以自由自愿的形式外包给非特定的(而且通常是大型的)大众完成。众包能很好地利用人类的群集智能来完成计算机难以完成的任务,并且能以较低的成本获得更高的准确性。因而,众包也是一种新的群智协作模型。随着社会网络的发展,社会网络已成为重要的众包平台。众包中的工人们通常会通过社会网络进行互联和交流。社会网络平台还可以用于救灾等社会紧急情况,例如2010年海地大地震后,就有慈善组织通过Twitter、Facebook等社交网站招募志愿者。
互联网用户遵循一定的群体结构和运行机制,自愿贡献体现个体智能的可衡量产出物,并通过群智协同汇聚融合成群体智慧涌现的高质量知识成果或产品,形成了一大批以开源软件社区、大众生产、问答网站、众包等为代表的在线开放协作项目。这些项目及其展现的群智协同模式,正以前所未有的深度和广度改变着人们获取知识、协作生产、解决难题、共享产出等的过程和方式。
结合讲者自己的研究工作实践,介绍了以人为中心的协同计算的概念,即分布式协同计算、社会化协同计算和群智协同计算。此外,他还阐述了相关的研究方法包括定性方法和定量方法。最后,讲者指出,“社会”与“技术”的紧密融合以及定性与定量的深入融合是以人为中心的协同计算未来的发展趋势。
基于互联网的群体智能理论和方法是新一代人工智能的核心研究领域之一,对人工智能的其他研究领域有着基础性和支撑性的作用。著名科学家钱学森先生在上世纪90年代曾提出综合集成研讨厅体系,强调专家群体以人机结合的方式进行协同研讨,共同对复杂巨系统的挑战性问题进行研究。《新一代人工智能发展规划》所提出的群体智能研究方向,实质上正是综合集成研讨厅在人工智能新时代的拓展和深化。本次讲座将系统地介绍群体智能的概念内涵、基础理论和前沿技术的关键研究任务,以及群体智能平台和重要的应用领域。
基于群智资源进行任务处理已成为一种基于互联网的新型计算模式,目标是通过汇聚群体智能实现复杂问题求解,其重要性得到学术界和工业界的广泛认可。然而,在动态开放的互联网环境中,参与者的动机、能力水平和投入时间等差异巨大,且受时间、环境和心理等多种因素影响,使得群智资源具有高度的自主性、不确定性和难控性,从而会导致任务处理的不可靠,因而质量保障成为群智系统面临的主要挑战之一。本讲座首先分析群智资源的特点和群智系统所面临的质量问题;其次将系统地介绍国际上针对众包、人本计算等群智系统中的质量保障方法,重点介绍面向群智任务处理的结果汇聚方法,主要包括各类投票和统计机器学习方法;最后,总结该问题面临的主要挑战和未来研究机会。
社会网络与信息传播中的群智行为在很多领域引起了人们的极大关注,其研究成果无论在科学研究还是社会现实中都具有很大的意义。社会网络主要由自治的社会主体和他们之间的社会交互关系所组成;而多智能体计算已经被公认为是一种能对群智多主体系统进行有效建模分析的方法。因此,基于多智能体对社会网络及信息传播群智行为进行分析研究就成了目前我们需要考虑的研究方向,通过发现社会网络与多智能体系统之间的关联性、提出基于多智能体研究社会网络的模型框架;然后,还将讨论基于多智能体研究社会网络中的典型问题-信息传播。然后,我们将基于多智能体的研究方法与其他两种经典的研究方法(图论结构分析方法、实证数据分析方法)进行比较,讨论基于多智能体的研究方法的优缺点和未来发展趋势。最后,还将介绍社会网络中的群智系统的任务分配的研究问题和工作。
现代计算机与信息技术的迅猛发展与普及,极大地改变了人们创造和分享知识的方式,互联网涌现了一大批诸如Wikipedia、Stack Overflow、Github等集合普通用户群体智慧的著名在线开放协作项目。由于背景知识、专业技能和兴趣爱好等方面的差异,自愿参与在线开放协作项目的用户群体展现出了独特的群体协同行为。全面分析和深入理解这些行为及其对鼓励贡献、增强认同感、增加参与度、规范协同行为、提高内容质量等方面的社会影响,将为群智协同技术创新、系统构建和应用设计提供重要的洞察、思路与启示,这也是CSCW、社会计算与人机交互等领域持续关注的研究重点。本次讲座将首先从计算科学与社会科学相结合的视角,介绍定性定量融合的混合研究方法,及其建模和分析受“社会”与“技术”因素共同影响的用户群体协同行为的全过程。接着以Stack Overflow和Github为例,详细介绍我们在建模、分析与理解Stack Overflow用户的协同编辑行为对项目内容质量与用户参与度的权衡,以及Github用户协同交互冲突及其不同消解策略对用户留存度影响等方面的最新研究成果。最后展示如何利用这些研究成果进行技术创新、界面设计与系统构建,形成“社会理解-技术创新-系统设计”的研究闭环,并结合国内外动态指出未来群智协同行为分析与理解研究的发展趋势。
推荐系统技术已经发展了二十余年,目前广泛应用于各类与人们日常生活息息相关的信息系统中,如电子商务、社交网络、内容服务、生活服务等。推荐系统通过个性化的服务帮助用户便捷的发现感兴趣的信息,为信息系统带来销售额、参与度、满意度等多个方面的提升,例如亚马逊网站中推荐系统能够带来约30%的销售额提升。本次讲座首先分析当前推荐算法的前沿理论与技术,针对推荐模型的表达能力、泛化能力和可扩展性三个方面,着重介绍如何从理论分析和方法设计两个层面去尝试解决真实推荐系统所面临的关键研究挑战。
CCF协同计算专委执行委员
复旦大学
CCF协同计算专委秘书长
复旦大学
CCF协同计算专委常务委员
东南大学
CCF协同计算专委副秘书长
北京航空航天大学
CCF协同计算专委荣誉主任、资深委员
复旦大学