CCF C?-03@搜狗丨深度语义学习和脑机接口将如何影响搜索的发展?
4月16日晚,30位企业技术高管齐聚搜狗,共同探讨深度语义学习和脑机接口将如何影响搜索的发展。讲者报告后的75分钟,与会者以技术话题为核心,充分展开交流。
CCF C?活动是CCF CTO Club发起的,面向企业技术专家的热门技术和战略分享会,第一站在京东分享了188体育投注:智能客服的相关技术,第二站在小米分享了智能家居的发展趋势,第三站来到搜狗讲述深度语义学习在搜索的应用。
近年来深度学习使得语义理解取得不少突破,信息检索从基于关键词搜索逐渐走向语义搜索。然而在真实的网络搜索引擎中,面对海量规模的互联网数据和纷繁复杂的用户意图,仍然面临不少挑战。
作为国内第二大搜索引擎,搜狗搜索在搜索技术以及语言AI的创新和发展上均有着深厚的积累。近年来,搜狗一直致力于解决深度语义学习应用于大规模网络搜索中的问题,力求通过深度语义检索、深度匹配排序、深度问答能力增强,实现网络搜索用户体验升级。
CCF副秘书长、亿邦动力CEO王超主持了全程活动,CCF副理事长、创新工场首席科学家周明代表CCF致辞,并为CCF企工委副主任、CCF CTO Club主席、搜狗CEO王小川颁发了CCF C?活动承办单位感谢牌。
王超主持会议
周明致辞
周明为王小川颁发承办单位感谢牌
王小川作报告
在本次分享会现场,王小川以题为“深度语义学习在网络搜索的应用研究与实现”的报告,对现阶段深度语义学习在网络搜索的核心过程“索引检索-候选排序-结果展现”中所面临的技术和工程挑战,给出了系统性的解决方法。这些方法已经在搜狗搜索中完整实现并上线,大大提升了搜索品质。
其中,融合稀疏检索内容匹配和稠密向量检索语义匹配的检索模型,通过系统设计引入倒排检索系统中的内容匹配特征,使得稠密向量检索的意图漂移大大缓解,候选结果的优质召回率提升幅度增长了7.0%,语义检索带来的收益显著。
而针对当前深度排序模型只利用文本内容语义匹配而丢失结构信息的问题,王小川在报告中提出了融合页面关键词、站点语义表示、查询和网页标题词项重要度、紧密度、精确和同义词匹配信号的深度语义匹配模型,有效提升了深度语义匹配模型排序能力。
此外,对于基于机器阅读理解的问答式搜索所面临的一般较长、形式不定、答案位置可能非连续等非事实型问题的机器阅读理解的挑战,王小川也在现场展示了搜狗搜索在实际的应用中的相关研究以及取得的突破。
随后,清华大学计算机系党委书记刘奕群教授就脑机接口技术对搜索过程可能带来的机遇与挑战在现场进行了分享。
刘奕群作报告