学术活动
EMNLP-CoNLL 2012会议在韩国济州岛成功召开
2012-07-17
自然语言处理实证方法会议(The Conference on Empirical Methods in Natural Language Processing, 简称EMNLP)自1993年开始举办,迄今已成为自然语言处理领域极具影响力和规模的顶级会议。该会议的主题涵盖了语用学、语义学、信息抽取、问答系 统、情感分析、机器翻译、自然语言处理、文本挖掘、文档摘要等主题。EMNLP会议每年召开一次,有超过500人参加。该国际会议以其世界一流的学术水 平,受到学术界和产业界的高度关注,历届会议都曾给自然语言处理的创新发展带来启示。
自然语言学习会议(the Conference on Natural Language Learning)是ACL SIGNLL的年度会议。除大会之外,自1999年起,每一年CoNLL都会组织一个自然语言的共享任务(shared task),通过提供训练和测试数据来推动相关任务的发展。历届CoNLL的共享任务(从NP Chunking、Clause Identification、Named Entity Recognition、Semantic Role Labeling、Dependency Parsing一直到今年的Multilingual Unrestricted Coreference),CoNLL都在以其独特的方式推动着自然语言处理的发展。
2012年,EMNLP-CoNLL 2012联合会议于7月12~15日在韩国济州岛成功召开。济州岛是韩国最大的岛屿,风景秀丽,岛中央是通过火山爆发而形成的海拔1951米的韩国最高峰 ———汉拿山(Mt.Halla),同时也有世界新七大自然奇观之一的日出峰。
在投稿方面,EMNLP-CoNLL 2012共收到606篇投稿(其中有36篇被撤回或者不经过审稿直接拒稿)。最终共有99篇论文被接受为口头报告,40篇被接受为张贴报告,总体论文录取率为24.8%。
为了展示Oral论文的录用领域,我们总结了所有Oral论文的录用领域,并呈现在表1中。我们可以看 到,机器翻译仍然是EMNLP最大的领域,共有12篇口头报告论文被录用,机器学习、信息抽取领域紧随其后,都有超过10篇论文被录用。传统的NLP领域 如Parsing、Semantics、Dialogure、POS、WSD等领域录用论文都在6篇左右。在新兴领域方面,Social Media成为了最大的新兴热点,共有6篇论文录用,这也表明了NLP领域对社会化媒体如微博的关注。我们也看到,随着IBM的Watson系统和苹果公 司的Siri系统的发布,研究人员对问答系统的兴趣也在回归,这一届会议共有3篇问答的论文被录用。
领域 |
Oral录用 |
Machine Translation |
12 |
Machine Learning |
11 |
Information Extraction |
10 |
Parsing |
9 |
Semantics |
8 |
Social Media |
6 |
Dialogue |
6 |
POS,WSD |
6 |
Sentiment & Opinion |
6 |
Discourse |
5 |
Summarization |
3 |
Phonemes,Words and Speech |
3 |
Question Answering |
3 |
Large-Scale NLP Algorithms |
3 |
Information Retrieval |
3 |
NLP Applications |
3 |
Evaluation |
2 |
TOTAL |
99 |
今年的EMNLP中,大陆的研究人员多有斩获。因此在参会人员中,经常可以看到大陆学者,包括来自于北京大学、清 华大学、复旦大学、苏州大学、中科院自动化所、中科院软件所、中科院计算所、百度和微软亚洲研究院等单位的研究人员。同时除了上述中国大陆学者的情况外,来自中国香港和中国台湾、 新加坡、 日本及欧美各国的华人学者也在 EMNLP 2012上展示了强大实力。