学术活动

ACL2007会议观感
2007-09-11

ACL2007会议观感

刘群刘洋

中国科学院计算技术研究所

{liuqun,liuyang}@ict.ac.cn

每年一度的计算语言学学会年会（Annual Meeting of ACL）是计算语言学界的盛会，也是计算语言学和自然语言处理领域最有影响的学术会议，ACL每年发表的论文都反映了这一领域的最新研究进展和学术动向，受到研究工作者的广泛重视。今年的ACL2007是ACL的第45届年会，在美丽而又浪漫的东欧古城——捷克首都布拉格召开，同时召开的有EMNLP-CoNLL 2007和IWPT 2007等2个学术会议（conference）、15个学术研讨会（workshop）以及5个专题讲座（tutorial）。会期从6月23日开始一直持续到6月30日结束，根据ACL2007网站公布的名单，参加会议的人数达到了创纪录的1095人，可谓盛况空前。ACL主会议于25-27日召开，其他各个会议、研讨会和专题讲座都是安排在ACL主会议之外的时间段并行进行的。其中，EMNLP于28-30日召开，持续时间最长。其他研讨会或者专题讲座持续时间半天到两天不等。

今年的ACL会议一共收到论文588篇，录用131篇，录用率为22.3%。各领域论文分布如下：

领域	收到论文数量	录用论文数量	录用百分比
篇章、对话和语用	58	16	28
句法、句法分析和形式语法	63	15	24
词典、本体和资源建设	63	11	17
词法相关	60	13	22
自然语言处理中的机器学习和算法	67	16	24
信息提取、信息检索和问答	70	15	21
机器翻译	65	15	23
语音、语言模型	41	9	22
语言生成和文摘	48	10	21
语义相关	54	12	22
总计	588	131[1]	22.3

（以上资料来自大会公布的Newsletter No.6）

以上的领域划分比较粗，实际上，会议的Session划分更细一些，包括：机器翻译、词义消歧、句法分析、语言资源、语法、机器学习方法、语音与形态、语义角色标记、生成、多语言、多模态、情感、复述与文本推理、篇章与对话、语言模型、同指、文摘、语义关系、问答、序列处理、词典和词汇语义、文本挖掘与检索。每个Session通常有4篇论文。我们可以看到，其中机器翻译是目前最大的研究热点，安排的Session达4.5个（其中一个Session是和Multilingualty合并举行的）。而在机器翻译中，统计机器翻译研究又占据了主导地位，纯粹基于规则或者基于实例方法的论文几乎没有。统计机器翻译的文章全面开花，一些传统的基于语言知识的规则方法也开始融入到统计机器翻译研究中，很多论文都试图利用句法结构、句法标记、功能词、词义排歧来改善统计机器翻译的效果。另外，统计机器翻译的一些经典问题，如词语对齐、自动评价、词序调整，依然受到重视。其他一些统计机器翻译研究论文涉及的话题包括解码算法、音译、翻译预处理、系统融合、多语言等。不过，总体上看，这次会议上统计机器翻译论文并没有出现突破性的研究成果。另外，深层次的句法语义分析，也仍然是ACL关心的主要话题，论文数量占了相当的比例，而且，今年的EMNLP-CoNLL重点讨论了依存分析技术， ACL主会议上有专门的Session讨论语义角色标注，另外有一个SemEval Workshop开展了语义分析方面的评测。除此之外，其他几个比较热门的研究领域包括语音与形态、篇章与对话、多语言、多模态、语言模型、机器学习方法、情感等，这些领域分别有两个或两个以上的Session。

这次会议收到的论文来自45个国家，其中亚洲太平洋地区和欧洲各占35%，北美洲27%，中东2%，南美和非洲都不到1%。从被录用论文所占比例来看，北美最高，为46.6%，欧洲是31.3%，亚洲和太平洋地区为16.8%。一些主要的国家和地区论文录用情况如下：

国家和地区

投稿论文数

录用论文数

澳大利亚

中国大陆

香港

印度

日本

新加坡

台湾

法国

爱尔兰

德国

意大利

荷兰

友情链接