一、学术活动

第二届全国中文知识图谱研讨会将于2014年10月17日在武汉举行

     知识图谱(Knowledge Graph)是当前学术界和企业界的研究热点。中文知识图谱的构建对中文信息处理和中文信息检索具有重要的价值。作为国内最大的自然语言处理专家学者的学术类社团团体——中国中文信息学会(CIPS)主办的前沿学术研讨会之一,本次会议将与第十三届全国计算语言学会议在同一会议地点举办,会务、交通等详细信息敬请查看会议网站中的报名及注册部分。

    重要日期

    报到时间:2014年10月16日14:00

    召开时间:2014年10月17日(会期一天)

    会议详情请参考:会议网站

第十三届全国计算语言学学术会议(CCL-2014)将于2014年10月18日—19日在武汉举行

     "第十三届全国计算语言学学术会议"(The Thirteenth China National Conferenceon Computational Linguistics,CCL2014)将于2014年10月18日—19日在华中师范大学举行。作为国内最大的自然语言处理专家学者的社团组织——中国中文信息学会(CIPS)的旗舰会议,全国计算语言学会议从1991年开始每两年举办一次,从2013年开始每年举办一次。CCL着重于中国境内各类语言的计算处理,为传播计算语言学最新的学术和技术成果提供了广泛的交流平台。

    重要日期

    报到时间:2014年10月17日8:00

    召开时间:2014年10月18日至19日(会期两天)

    会议详情请参考:会议网站

第三届CIPS-SIGHAN中文处理资源与评测国际会议(CLP-2014)将于2014年10月20日—21日在武汉举行

     2014年中文处理资源与评测国际会议(CLP-2014)由中国中文信息学会(CIPS)和国际计算语言学协会中文处理专业兴趣组(SIGHAN)联合组织。首届中文处理资源与评测国际会议(CLP-2010)与第23届国际计算语言学大会(COLING-2010)同期在北京举办。第二届中文处理资源与评测国际会议(CLP2012)于2012年12月20-21日在中国天津大学举行。本届大会CLP2014将于2014年10月20-21日在中国华中师范大学举行。

     本次中文处理资源与评测国际会议(CLP-2014)旨在为中文处理领域中全球的研究人员提供一个展示研究成果、交流学术思想、探索研究新方向、推动研究发展的平台。CLP-2014还将举办一个国际评测竞赛,包括四项评测任务:中文分词、中文拼写检查、简体中文句法分析、中文人物属性抽取。有关此次国际评测竞赛的详细信息,请参见:评测任务。本次会议将与第十三届全国计算语言学会议在同一会议地点举办,会务、交通等详细信息敬请查看会议网站的“Conference venue”。

    重要日期

    报到时间:2014年10月19日8:00

    召开时间:2014年10月20日至21日(会期两天)

    会议详情请参考:会议网站

第三届全国社会媒体大会(SMP-2014)将于2014年11月1日—2日在北京举行

     第三届全国社会媒体大会(SMP2014)将于11月1日-2日在北京理工大学召开,由中国中文信息学会(CIPS)社会媒体处理专委会(筹)举办。全国社会媒体处理大会每年举办一次。SMP专注于社会媒体处理为主题的科学研究与工程开发,为传播社会媒体处理最新的学术研究与技术展示提供了广泛的交流平台。

    重要日期

    报到时间:2014年10月30日 9:00-20:00

    召开时间:2014年11月1日-2日(会期两天)

    会议详情请参考:会议网站

第十届全国机器翻译研讨会(CWMT-2014)将于2014年11月4日—6日在澳门举行

     第十届全国机器翻译研讨会(CWMT 2014)将于2014年11月4日至6日在澳门大学举行。本研讨会自2005年由中科院自动化所、计算所和厦门大学联合召开第一届以来,已连续在中科院计算所、哈尔滨工业大学、中科院自动化所、南京大学、中科院软件所、厦门大学、西安理工大学以及昆明理工大学成功召开了九届。其中共组织过五次机器翻译评测(2007、2008、2009、2011、2013),一次开源系统模块开发(2006)和两次战略研讨(2010、2012)。这些活动对于推动我国机器翻译技术的研究和开发产生了积极而深远的影响。因此,CWMT已经成为我国自然语言处理领域颇具影响的学术活动。

    CWMT 2014旨在为国内外机器翻译界同行提供一个交互平台,加强国内外同行的学术交流,召集各路专家学者针对机器翻译的理论方法、应用技术和评测活动等若干关键问题进行深入的研讨,为促进中国机器翻译事业的发展,起到积极的推动作用。有别于以往,本次会议特设两个专题讲座,将和与会者互动探讨机器翻译最炽热的研究论点,而大会专题论坛汇集顶尖领域专家向大家揭示机器翻译最前沿的蓝图,本会还邀请了国内外知名专家学者做相关的特邀报告。另外,会议期间将选出最佳学生论文,颁发证书和奖金。专为企业、用户、开发者而设的系统演示环节能让与会者展示及分享宝贵经验。

    重要日期

    报到时间:2014年11月3日 14:00-19:00

    召开时间:2014年11月4日至6日(会期三天)

    会议详情请参考:会议网站

二、学会通知

中国中文信息学会会员发展工作的通知

    为推进学会的改革,建立以会员为主体的管理体制,健全会员管理制度,按照中国科协《关于规范全国性学会个人会员登记号的通知》的要求和规定,结合本会的具体情况,建立个人会员登记制度。

会员登记的简要流程:

    1.下载会员申请表,填写完成后发送至学会邮箱:[email protected]

    2.收到会员信息确认函后缴纳学会年度会费, 完成会员资格认证。

2014年度"中国中文信息学会"个人会员收费标准:

    个人会员:120元/年    学生会员: 60元/年

会员费缴费方式:

    (1) 银行转账:

       开户银行:工商行北京市分行海淀西区支行 户名:中国中文信息学会 账号:0200004509014415619

    (2) 邮局汇款:

       地址:北京8718信箱"中国中文信息学会" 收款人:中国中文信息学会 邮政编码:100190

    (3) 学会支付宝账号转账:

       户名:中国中文信息学会 账号:[email protected]

    (4)中国中文信息学会办公室缴费

       地址:北京市海淀区中关村南四街4号院7号楼201房间 联系电话:010-62562916

    会员经注册并缴费后,将获得会员登记号和会员证。在参加学会主办的各类学术活动时,凭会员证将享受会费优惠;定期获赠中国中文信息学会会员通讯(电子版)。

    为鼓励更多学者加入学会,完成2014度会员登记的全体会员和部分学生会员(以缴费顺序,先到先得,赠完为止),将获赠2014年度全年《中文信息学报》(纸质版)。

三、学术动态

美国脑创新计划十年计划耗费45亿美元

    近日,美国总统巴拉克.奥巴马的脑创新计划定价翻了两番。去年,白宫公布了一个名为BRAIN创新计划的大胆项目——该项目旨在绘制活体人脑图谱,并命令数个联邦机构迅速制定方案以确保计划实现。为了强力推动该项目实施,奥巴马今年为该计划拨款1亿美元,覆盖国立卫生研究院(NIH)、国家科学基金会和国防部先进研究项目局。

    现在,在经历了持续1年的会议和商谈后,一个由NIH召集的工作小组对脑创新计划的一些目标和愿望进行了充实,并试图对资金需求提出一个更现实的目标:为期10年的进程共需45亿美元——大约是目前预算的4倍。

    http://scienceblog.blog.163.com/blog/static/189685007201451195033437

CIKM 2014将于11月初在上海举行

    CIKM 2014将于11月初在上海举行,主办方请来了谷歌的Jeff Dean讲深度学习,以及微软核心管理层成员、全球执行副总裁Qi Lu,和著名知识图谱项目Yago的创始人Gerhard Weikum。

    http://cikm2014.fudan.edu.cn/index.php/Index/info/id/6

百度机器人踢馆江苏卫视《芝麻开门》

    9月16日晚22点整,江苏卫视《芝麻开门》闯关节目的擂台迎来了节目开播以来的首位"非人类"挑战选手——智能问答机器人小度。这位由百度深度问答团队开发的智能问答机器人在国内还属首例,不仅频频和主持人互动调侃,更是凭借迅速的反应和准确的回答勇闯四关,40道涉及音乐,影视,历史,文学类型的题目全部答对,出色的表现赢得现场观众惊叹不已。

    http://finance.chinanews.com/it/2014/09-17/6598884.shtml

中文句法语义分析系统 NiuParser 1.0.0 Beta发布

    由东北大学自然语言处理实验室团队经过一年多努力研制成功并正式发布中文句法语义分析系统 NiuParser,支持中文句子级七大语言分析技术,所有代码采用C++,自主完成开发,不包含任何其它开源代码。研究永远免费。

    http://www.niuparser.com/

北语汉语语料库(BLCU Chinese Corpus,BCC)正式上线

    100亿字报刊、社交、文学、科技语料~规模完爆CCRL和国家语委语料库。全文检索更方便,支持模糊查找和长距离模式查找。全文自动分词并词性标注。

    http://bcc.blcu.edu.cn/

微软研究员获Funai成就奖

    近日,微软亚洲研究院主管研究员Junichi Tsujii教授因为在自然语言处理(NLP)、机器翻译和生物学文本挖掘上的开创性工作获得Funai成就奖。这一奖项是日本计算机学界最重要的奖项之一,之前的得奖者包括Marvin Minksy教授和Takeo Kanade教授。

    http://blogs.technet.com/b/inside_microsoft_research/archive/2014/09/16/microsoft-researcher-receives-prestigious-funai-achievement-award.aspx

DBpedia Version 2014 released

The most important improvements of the new release compared to DBpedia 3.9 are:
1. the new release is based on updated Wikipedia dumps dating from April / May 2014 (the 3.9 release was based on dumps from March / April 2013), leading to an overall increase of the number of things described in the English edition from 4.26 to 4.58 million things.
2. the DBpedia ontology is enlarged and the number of infobox to ontology mappings has risen, leading to richer and cleaner data.

    http://blog.dbpedia.org/2014/09/09/dbpedia-version-2014-released/

2014 SIGKDD Test of Time Award

获奖论文包括:
A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise [KDD 1996]
Integrating Classification and Association Rule Mining [KDD 1998]
Maximizing the Spread of Influence through a Social Network [ KDD '03]

    http://www.kdd.org/blog/2014-sigkdd-test-time-award

四、学术资源

ICML2014视频
http://techtalks.tv/icml2014/
    International Conference on Machine Learning 2014的视频,包括Keynote,Tutorial及论文Track

word2vec 0.1C版本发布
https://code.google.com/p/word2vec/
    主要改动包括:添加了一个迭代步数的参数;CBOW的输入层向量累加改成了平均;修改了基线模型

深度学习讲座:Deep Learning on Hadoop
http://cdn.oreillystatic.com/en/assets/1/event/115/Introduction%20to%20Parallel%20Iterative%20Deep%20Learning%20on%20Hadoop%E2%80%99s%20Next%E2%80%8B-Generation%20YARN%20Framework%20Presentation%202.pdf
    简洁明了的解释了什么是深度学习DL,什么样的应用适合DL,DL有哪些开源实现,在Hadoop上如何跑起一个DL应用。

由22个联邦机构分享的6482个数据集(6,482 Datasets Available Across 22 Federal Agencies In Data.json Files)
http://kinlane.com/2014/08/25/6482-datasets-available-across-22-federal-agencies-in-datajson-files/
    由22个联邦机构分享的6482个数据集

康大教授David Mimno写的《对机器学习初学者的一点建议》
http://mimno.infosci.cornell.edu/b/articles/ml-learn/
    康大教授David Mimno写的《对机器学习初学者的一点建议》,强调实践与理论结合。

让我们拥有大数据--郁彬教授北大讲座
http://v.youku.com/v_show/id_XNzY1MTk2OTY0.html
    郁彬教授简介:现任加州大学伯克利分校统计系主任、清华大学数学科学学院特聘教授,美国艺术与科学院院士。

Tutorial: Dependency Parsing: Past, Present, and Future
http://ir.hit.edu.cn/~lzh/
    COLING 2014的由苏州大学的张民教授,程文亮教授和李正华博士所做的Tutorial "Dependency Parsing: Past, Present, and Future" 。

Tutorial:Entity Linking and Retrieval
http://ejmeij.github.io/entity-linking-and-retrieval-tutorial/
    分为实体链接,实体检索和语义搜索三部分

博士论文:RECURSIVE DEEP LEARNING FOR NATURAL LANGUAGE PROCESSING AND COMPUTER VISION
http://nlp.stanford.edu/~socherr/thesis.pdf
    Richard Socher

199IT:2014.09.01—2014.09.07互联网报告合辑
http://dataunion.org/bbs/forum.php?mod=viewthread&tid=426&page=1&extra=#pid433
    包括:Nielsen:2014年全球电子商务报告、Acquity:2014年全球物联网市场研究报告、App Annie&IDC:2014年Q2全球手机游戏市场报告等。

Michael Jordan Reddit问答
http://www.reddit.com/r/MachineLearning/comments/2fxi6v/ama_michael_i_jordan/
    Michael I. Jordan is the Pehong Chen Distinguished Professor in the Department of Electrical Engineering and Computer Science and the Department of Statistics at the University of California, Berkeley.
    在本次问答中,Michael Jordan回答了他对深度学习的观点,并推荐了一些机器学习的学习书籍等等。

人工智能资源库
http://openair.allenai.org/
    Open AI Resource收集了AI领域的很多工具和数据,分类让大家点赞和评论。目前库内包含3000+资源,12个分类,根据喜好,点击率排序。

KDD2014讲义 "the recommender problem revisited"
http://www.kdd.org/kdd2014/tutorials/KDD%20-%20The%20Recommender%20Problem%20Revisited.pdf
    推荐系统的综述。第一部分Xavier Amatriain的综述(135页, 2014机器学习夏季学校版有248页), 第二部分"Context Aware Recommendation" (64页)。

深度学习参考书目大全
http://memkite.com/deep-learning-bibliography/
    收集了深度学习最新的出版物(2014年之后),并做了精心标注,几乎囊括尽深度学习相关的所有最新资料。

Deep learning工具包 CNTK
https://cntk.codeplex.com/
    微软研究院出品,C++实现,CPU/GPU支持,DNN/CNN/RNN/LSTM,目前只支持windows。

免费电子书: Deep Learning Methods and Applications" (2014)
    http://research.microsoft.com/pubs/209355/DeepLearning-NowPublishing-Vol7-SIG-039.pdf
    微软研究院邓力和俞栋合写的免费电子书,近200页篇幅对深度学习的方法和应用做了比较全面地综述。