新闻头条
ACL 2012会议在韩国济州岛成功召开
2012-07-17
计算语言学学会( The Association for Computational Linguistics,ACL) 旗下的ACL年会是国际上最具影响的计算语言学及自然语言处理学术会议。2012年,第50届ACL年会与计算语言学学会的另一顶级学术会议 EMNLP(Empirical Method for Natural Language Processing)于7月8~14日在韩国济州岛(Jeju)联合召开。济州岛是韩国的旅游胜地,位于朝鲜半岛南端,是韩国最大的岛,方圆1825平 方公里,居民51.45万,是个由火山喷发而形成的火山岛。围绕济州岛,周围还有8个有人岛和55个无人岛。岛中央海拔1950米的汉拿山,号称韩国第一 高峰,因受近海暖流的影响,全年气候温和,有"韩国的夏威夷"之称。除ACL、EMNLP主会议外,还有11 个专题研讨会(Workshop ) 和6 个专题讲座( Tutorial)同期举行。
今年ACL的Tutorial共包含6个讲座,讲座的信息如下表所示:
题目 |
讲者 |
Qualitative Modeling of Spatial Prepositions and Motion Expressions |
|
State-of-the-Art Kernels for Natural Language Processing |
|
Topic Models, Latent Space Models, Sparse Coding, and All That: A Systematic Understanding of Probabilistic Semantic Extraction in Large Corpora |
|
Multilingual Subjectivity and Sentiment Analysis |
|
Deep Learning for NLP (without Magic) |
|
Graph-based Semi-Supervised Learning Algorithms for NLP |
由 于近年来以Topic Model为代表的图模型算法在NLP领域得到了广大的应用,大大推动了这一领域的发展,因此来自CMU的副教授Eric Xing所讲述的关于Topic Model在面对大规模数据下语义分析的基本模型、算法和应用引起了很多与会者的兴趣,同时Eric Xing教授对于Topic Model与Sparse Coding的结合进行了概述性的介绍,而Eric Xing教授在EMNLP会议的Keynote Session上对于这一部分进行了更为详细的介绍。此外,由于近几年Deep Learning 在语音识别领域获得巨大的成功,越来越多的研究者试图将Deep Learning用于文本分析的各个任务中,因此来自Stanford的Manning教授等人所带来的"Deep Learning for NLP (without Magic)"专题报告也在与会者中引起了强烈的反响。
每年的ACL 论文,尤其是主会议长文(Full Paper) ,基本反映了自然语言处理领域的最新研究进展、代表了本领域最高研究水平。今年的主会议论文投稿数达到了940篇,其中长文571篇、短文369 篇。被录用的长文有83 篇oral、29篇poster,录用率为19 %;短文被录用77篇,录用率20 %。
在今年的会议中,程序委员会专门对于所录用的长文题目中的关键词进行了统计,如下:
entity 5、evaluation 5、hierarchical 5、information 5、joint 5、syntactic 、、topic 5、discriminative 6、lexical 6、statistical 6、chinese 7、dependency 7、machine 8、modeling 8、models 8、language 10、word 10、parsing 11、model 12、learning 14、translation 15 |
从统计结果中,我们可以看出NLP的传统研究领域:机器翻译、句法分析,包括统计学习仍然是会议的热点研究问题。另外,本次 会议增设了Social Media领域,反映了自然语言处理对新兴Web 2.0研究热点的关注和在社交媒体下自然语言的处理问题。
此 外,本届ACL是第50届,因此此次会议的两个Keynote Speech都与ACL的50周年活动相关,同时也增加了Anthology Session,从而对于ACL的Anthology建设工作进行介绍。Keynote Speech包含Philadelphia大学的ARAVIND K. JOSHI带来的"Remembrance of ACLs past"以及Macquarie University的Mark Johnson教授带来的"Where do we go from here?"两个报告。其中ARAVIND K. JOSHI对于ACL过去50年的重要事件,并且对于研究方向的发展、语言学与AI等领域的关系等问题提出了自己的看法。Mark Johnson教授从自身的角度对于可能爆发的研究点进行预测,提出了自己的看法,并对年轻人在进行科研工作时科研方向的选择方面给出一些建议和忠告。
从国家分布来看,美国所发表的论文数量仍然占据第一位。在中国大陆方面,有北京大学、清华大学、中科院自动化所、中科院计算所、哈 尔滨工业大学等单位共发表论文15篇。此外,商业机构中的百度公司和微软亚洲研究院也有论文发表。其他发表论文较多的国家有日本、新加坡、德国、加拿大 等。
今 年的所有录取论文中共有两篇论文获得了最佳论文以及最佳学生论文奖,其中清华大学计算机系博士生布凡的论文(合作老师:李航,朱小燕)"String Re-writing Kernel"被评为大会最佳学生论文。论文提出了一种新的核方法,可以在不使用句法分析器的前提下快速鲁棒地度量句子对之间的结构相似度。该方法可以被 应用到同义句识别,句子蕴含关系识别以及相似问题检索等许多自然语言处理以及信息检索的任务中。另外,大会的最佳论文来自日本的NTT通讯科学实验室 (NTT Communication Science Laboratories),第一作者为Hiroyuki Shindo。该文章提出了一种基于符号改良的树替换语法,并将其用到句法分析中。该工作可以将传统的树替换语法和符号改良整合到一个统一的框架下,并自 动地从训练数据中进行学习。该方法可以在宾大树库的相关测试集上取得92.4%的F1值,获得了当前在这个数据集上的最好的效果。
总的来说,ACL是自然语言处理一年一度的顶级会议,在会场亲眼目睹了国际学者们的风采,也领略了顶级自然语言处理的研究水平。同时 也感受到了华人在自然语言处理、信息检索、语言技术领域中地位的迅速提升。相信随着时间的推移以及中国的不断发展,人类语言技术领域必将会有华人更大的舞 台。
相关图片