学术活动
CCIR2017全国信息检索学术会议成功召开
2017-07-18
一、 总体情况
第二十三届全国信息检索学术会议(The 23rd China Conference on Information Retrieval, 简称CCIR2017)已于2017年7月12日至14日在上海市顺利召开。本次会议由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办,华东理工大学承办。参加本次会议的代表来自全国从事信息检索理论与应用研究的70多所高校和科研机构共200余人,既有享誉国内外学术界和产业界的资深专家,也有崭露头角的青年学者。华东理工大学副校长钱锋院士出席了会议开幕式并致辞。中国中文信息学会副理事长兼秘书长孙乐研究员、专委会主任程学旗教授,大会主席聂建云教授、文继荣教授、程序委员会主席刘奕群副教授出席了开幕式并致辞。
本次大会根据国内外相关领域学术交流形式的变化,在论文征集和会议组织方面进行了改革创新。与往届相较,本次会议(1)由仅录用中文论文改为同时录用中文和英文论文,录用的英文论文将由斯普林格出版社LNCS系列编纂出版,以利于国内学者的先进研究成果扩散至国际学术圈;(2)由多会场制改为单一会场制,使参会代表能在同一会场内听到所有报告;(3)由单一报告形式改为多种报告形式,在原先的口头报告之外增加了海报展示与“点对点交流”环节,确保会议交流的效率与质量; (4)增设了“亮点论文交流”环节,邀请最近在信息检索领域国际顶级期刊上发表了高水平论文的作者作论文报告与交流。
会议期间还举行了中文信息学会信息检索专委会会议,会议讨论并决定了优秀学生论文的评选。CCIR2018承办单位广西师范大学对会议筹备情况做了介绍,吉林大学、福州大学与山东师范大学作了CCIR2019的承办演讲。另外,专委会对未来工作规划研讨、信息检索方向做了热烈的研讨。
二、 特邀报告
本次会议特别邀请了荷兰皇家科学院Maarten De Rijke院士、美国密歇根大学梅俏竹副教授、今日头条副总裁马维英博士、清华大学朱军副教授做大会特邀报告。
Maarten De Rijke院士为大家带来了信息交互行为建模与预测方面的研究进展。他首先为大家介绍了现有的各种点击模型,包括CTR模型、基于位置的模型、级联模型、动态贝叶斯网络模型、用户浏览模型等;然后详细介绍了利用神经网络构建点击模型方面的研究成果,并提出了上下文感知时间模型以对上下文偏差进行纠正;最后还探讨了非顺序交互和非点击行为交互的建模方法。Maarten De Rijke院士的报告激发了与会者的广泛讨论。
梅俏竹副教授为大家介绍了谣言检测方面的研究进展。他首先用大量的事例为大家引入了谣言的概念,并给出了谣言的精确定义;然后分析了谣言检测所遇到的挑战,并从不同的角度给出了不同的解决方案;最后还探讨了信息检索未来的发展方向,引起与会者的高度兴趣。
马维英博士分享了他对于信息流的未来与人工智能的机会方面的思考。首先他为大家介绍了今日头条基于智能算法的内容推荐和内容分发平台,然后介绍了机器学习方面的具体算法,并梳理了人工智能的发展概况,最后为大家介绍了人工智能在现实生活中的具体应用,以及今日头条利用人工智能在寻人、追逃、辟谣方面所做的贡献。马维英博士的报告引起了与会者的热烈讨论。
朱军副教授为大家带来了关于大规模生成模型及其相关应用的报告。他首先为大家引入了生成模型的概念,介绍了生成模型的研究进展,包括用于文本数据的主题模型以及用于图像的深度生成模型。然后,朱军副教授着重为大家讲解了他们团队所开发的珠算编程库。珠算编程库基于TensorFlow框架,利用神经网络学习后验概率。朱军副教授的此一报告引起了与会者的广泛兴趣。
三、 工业论坛
会议期间,大会举办了工业论坛。拓尔思副总裁刘瑞宝先生介绍了大规模动态本体及其应用。阡寻科技执行董事、总经理熊昊博士介绍了阡寻科技的技术体系及产品在金融行业的应用。
拓尔思副总裁刘瑞宝先生做现场报告
阡寻科技执行董事、总经理熊昊博士做现场报告
四、 青年学者论坛
会议期间,大会举办了青年学者论坛,活跃在科研第一线的青年学者们报告了他们的研究内容及心得体会。
清华大学刘洋副教授分享了自己在学术论文写作方面的经验体会。他从写作观念与写作技巧两个方面提出了自己的建议,尤其是在摘要、引言、相关工作的书写以及方法的描述、实验的设计、图表的运用方面,用详尽的示例系统地介绍了学术论文的写作技巧和注意事项。
复旦大学博士研究生刘鹏飞同学分享了自己的科研经历,介绍了自己学术灵感的来源与学术思考的方向,并为青年学子的学术生涯发展提出了自己的建议。
上海瓦歌智能科技有限公司总经理、深圳狗尾草智能科技公司CTO王昊奋博士就聊天机器人产业化落地之路分享了自己的看法。他着重介绍了知识图谱在聊天机器人中的运用,并提出知识图谱的变革升级,最后,王昊奋博士以聊天机器人公子小白与琥珀·虚颜为例,介绍了聊天机器人的应用场景。
五、 专题讲习班
会议期间,大会举办了专题讲习班,由来自微软研究院的主管研究员秦涛博士与微信人工智能技术专家谭翊章博士分别为大家做学术讲座。
秦涛博士主要讨论如何将机器学习与博弈论结合起来,解决实际应用问题。他首先为大家介绍了机器学习的基本概念,包括监督学习、无监督学习、半监督学习与强化学习;接着,引入了经济学中的博弈论,为大家介绍了著名的囚徒困境与纳什均衡;然后,将机器学习与博弈论结合起来,引入了对偶学习与生成对抗网络,并给出了具体的理论公式与应用场景;最后,为大家介绍了广告推荐与信息检索中的博弈论机器学习研究。
谭翊章博士就聊天机器人的发展与挑战展开报告。他首先为大家介绍了微信聊天机器人,接着带领大家回顾了聊天机器人的发展历史,然后讨论了聊天机器人所要用到的关键技术,并以语音助手和贤二机器僧为例进行详细展开,最后简述了聊天机器人的未来发展与所面临的挑战。
六、 亮点论文交流
本次大会还邀请了最近在信息检索领域国际顶级期刊上发表了高水平论文的作者作论文报告与交流。来自上海交通大学、青海大学、重庆理工大学以及微软亚洲研究院的科研工作者为大家汇报了最近一两年内,在ACM Transactions on Information Systems, Information Retrieval Journal上发表的部分信息检索相关文章。文章涉及到微博话题识别与流行预测,跨领域推荐算法的冷启动,通过鼠标轨迹增强点击模型,以及搜索中的查询推荐等。
通过几位老师同学的报告,年轻学者不仅了解到了信息检索前沿研究,也对如何将文章发表到顶级期刊上有所了解。
七、 论文情况
作为本届会议的改革内容,大会同时对外征集中文论文和英文论文,最终共收到论文80篇,录用54篇,总录用率为67.5%,其中收到中文论文39篇,录用33篇,录用率为84.6%,已推荐到相关学术期刊发表;收到英文论文41篇,录用21篇,录用率为51.2%,将由斯普林格出版社LNCS系列编纂出版。录用的论文总体反映了国内在信息检索领域的最新成果。会议还根据大会现场报告,结合函评,由参会专委会常务委员组成优秀论文评议小组投票评出了2篇优秀学生论文,分别是中科院信工所的《Leveraging External Knowledge to Enhance Query Model for Event Query》和大连理工大学的《基于Attention机制的药名实体识别》。
同样作为改革内容,对于录用的论文,会议安排了5篇高水平论文进行15分钟口头汇报,其余论文做1分钟口头汇报,并进行海报展示。会议还为录用论文安排了“点对点交流”环节,以便参会代表与报告人进行充分的学术交流。
现场观众提问
海报展示与点对点交流
八、 面向智能问答的篇章排序评测
本次会议还与北京搜狗科技发展有限公司联合举办了面向智能问答的篇章排序评测,共计有85个队伍参加,最终评选出了第一、二、三名及优胜奖获得者,并邀请排名靠前的9支队伍到会议现场做了技术报告。除了少部分参赛者使用特征工程的方法外,大多数参赛者使用了CNN、LSTM等神经网络模型,体现了神经网络的实效性。
九、 会议网站
华东理工大学计算机系自然语言处理与大数据挖掘实验室为本次会议开发了会议网站,为用户提供会议信息预报、会议论文征集、会议资料发布等服务;会议前期通过网站进行宣传,论文征集、审稿、录用等均通过信息化手段予以完成;整个会议期间对会议动态、特邀报告内容、会议议程、会议资料和会务等信息进行实时更新。大会的特邀报告、青年论坛和讲习班报告均已放到该网站以供下载。
大会网站首页截图
大会网站论文录用页面截图
十、 小结
全国信息检索学术会议面向国家重大战略需求,关注国内外信息检索研究领域的最新进展,对本领域面临的挑战性科学问题和关键性技术难题展开了深入研讨。本次会议相较以往进行了改革创新,取得了不错的效果。大会的圆满的成功,既促进了相关学科领域与IT界的学术交流,又增进了同行间的学术友谊。随着人类社会信息化进程的逐渐推进,信息的合理、高效利用无疑对信息检索技术提出了更具挑战性的研究问题。异质信息处理、复杂查询交互、场景感知、隐私保护、个性化等研究问题都从实验室研究逐渐走向商业应用。近年来,我们欣喜的看到,在前辈学者高屋建瓴的引导与各方面同行持之以恒的努力下,国内的信息检索研究已经一定程度上跟随上国际领先者的步伐。从追赶到跟跑、从跟跑到领跑,角色的转变更需要国内信息技术领域的学术界、工业界同行进一步携手努力,共同取得更大的成绩。