查看原文
其他

书讯 | Quantitative Analysis of Dependency Structures

楓若轩 计量语言学 2021-03-17

前几日,沉默良久的qler君在重出江湖之后,便给大家带来了一个好消息。译著《语言研究中的统计学——R软件应用入门》已经由商务印书馆出版发行。不仅如此,qler君上一回还特意卖了一个关子,提到今年有三本值得推荐的书将要出版。现在第一本书已经在各大平台销售,那么后两本究竟又是些什么东东呢?今天,就让新开工的小编楓若轩来带大家揭开第二本书的神秘面纱吧。

就在上周(10月8日),久负盛名的语言学出版社德古意特(De Gruyter,这是个什么出版社?赶紧去查查它都出了些什么期刊,说不定就有你想投的SSCI和A&HCI刊物哟)出版了Quantitative Analysis of Dependency Structures(《依存结构的计量分析》)一书。



德古意特网站上有关该书的介绍言简意赅:

Dependency analysis is increasingly usedin computational linguistics and cognitive science. Surprisingly, compared with studies based on phrase structures, quantitative methods and dependency structure are rarely integrated in research. This is the first book that collects original contributions which quantitatively analyze dependency structures across different languages and text genres.

(依存分析正在计算语言学和认知语言学领域得以广泛使用。但令人诧异的是,相较于基于短语结构语法的研究,将计量方法和依存结构结合在一起的研究却比较罕见。这是第一本采用计量的方法来研究不同语言和文体依存结构的原创性论文集。)


光看这短短的几句介绍,就把外行的小编给唬住了。虽然言简意赅却又洋溢着赞美之词。当然,这么高的荣誉也是实至名归,且听小编一一道来:


第一,现代意义上的计量语言学诞生不过百年,德古意特出版的“计量语言学书系”(Quantitative Linguistics Series)汇聚了国际上该领域最为前沿、热门的研究。本书作为“计量语言学书系”第72卷出版,足以说明采用计量方法研究依存语法(结构)是科学的、合理的,具有旺盛的学术生命力。



正如本书两位主编在序言中所提到的,采用依存语法来分析人类自然语言的历史悠久,从古印度的帕尼尼语法到中世纪摩的斯泰学派语法理论和阿拉伯语法,再到世界各国的传统语法,都或多或少含有依存语法的元素。尤其是20世纪下半叶以来随着各种大型语料库的建立,依存语法逐渐成为了主流的“树库”标注体系,在自然语言处理及人工智能领域发挥了重要的作用。

即便如此,从计量语言学角度对依存语法的研究仍然是比较零散的,在广度和深度上都远远难以满足实际应用的需求。为此,在大数据时代背景下,基于现有的大量的多语种依存树库,采用计量方法进行依存语法的研究顺应了科学发展的历史潮流。这不仅有助于探索人类语言与认知的内在运作机制,也便于将其成果运用到自然语言处理的实践中,推动人工智能领域的进一步发展。(小编突然觉得语言学好高大上,原来这么有用啊 哈哈!)

第二,本书的两位主编之一蒋景阳教授,是浙江大学外语学院语言与翻译系主任、外国语言学及应用语言学专业博导,同时兼任Journal of Quantitative Linguistics(SSCI和A&HCI收录)的书评编辑和学术编辑以及Corpus Pragmatics的编委、审稿人。主要研究方向为二语习得、依存语法、计量语言学和语用学等。据大道消息说,上蒋老师的课玩游戏,成绩会越来越好(上课玩游戏,而成绩却越来越棒!这位浙大女教授有一套提高英语成绩的好方法)。小编也好想去呀。另一位主编是刘海涛教授,有关他的传奇故事,可以参考浙江大学官微的报道(跨界大牛!从国企副总工到语言学家,他不仅是社科类“高被引学者”浙大第一人,还是摄影高手!)。

对于依存计量领域稍微熟悉的读者,对这两位主编的相关成果都不会陌生。如被学生们亲切地称为“蓝宝书”的《依存语法的理论与实践》(科学出版社,2009),该书是国内第一部也是目前唯一的有关依存语法的专著,已成为依存语法研究的重要参考书,受到语言学、自然语言处理等领域研究人员的欢迎与好评,推动了相关学科建设及理论的进一步发展。书中以依存句法树库为基础,对汉语的句法结构进行了一些定量研究,开辟了语言句法计量研究的新路径,将精确的定量方法与句法研究结合起来是获得具有解释与处理真实语料能力语言模型的重要科学途径,为构建更高效的自然语言处理系统提供了可信的语言学理论基础。某种意义上讲,现在的这本文集与“蓝宝书”有着千丝万缕的联系。具体有啥联系,你亲自看看就知道了哈。

这可不是卖书的节奏啊,因为根本买不到。坊间流传,“蓝宝书”在十年间出过精装本和平装本,前后三次印刷却再三脱销,某宝网旧书曾炒到XXX元一本。可怜的小编知道得的太晚了,现在手头上的是第二次印刷的平装本。大家猜一猜下图是什么版本?



此外,2015年两位教授发表在Language Sciences的文章“The effects of sentence length on dependency distance, dependency direction and the implications-Based on a parallel English-Chinese dependency treebank”(《句长对依存距离、依存方向的影响及启示:基于英汉平行依存树库的研究》),是采用计量语言学进行依存语法研究的重要文献。



这篇文章基于英汉平行依存树库,研究了句长对依存距离和依存方向的影响,得出了一些比较有趣的结论,如:

(1)依存距离的概率分布不受句长影响;

(2)汉语的平均依存距离往往要高于英语;

(3)依存距离受工作记忆和语法的限制;

(4)汉语比英语耗费更多的工作记忆;

(5)依存方向较少受句长的影响,因而更有可能成为语言和文体分类的指标。

文章发表后,迅速得到关注,并成为该刊2015年以来发表的所有文章(共计228篇,截至2018年10月15日)中,在WOS里被引用次数最多的文章(23次,截至2018年10月15日)。也正因如此,该文在期刊引证报告JCR 2017年的统计中,成为对Language Sciences影响因子(IF, Impact Fact)贡献最大的文章(BTW,不知道什么是WOS、JCR和IF的筒子们,是不是要考虑下10月19号“花格老刘”在同济大学的讲座:学术讲座 | 刘海涛:“双一流”背景下中国语言学研究的国际视野与本土创新之路)。



第三,本书的作者阵容也很强大。小编简单统计了下,书中收录的16篇文章,由来自7个国家(中国、日本、以色列、英国、德国、捷克和斯洛文尼亚)的32位作者合作完成。这其中就包括几近耄耋之年,但仍然笔耕不辍的英国国家学术院院士Richard Hudson教授,“词语法”(Word Grammar)理论的创始人。同时还包括Journal of Quantitative Linguistics主编、“协同语言学”(Synergetic Linguistics)理论的倡导者,德国特里尔大学的Reinhard Köhler教授。需要指出的是,全书作者以中国学者为主,这体现了中国在依存语法及计量语言学研究方面已经与国际接轨并达到世界领先水平。为了方便阅读,小编也特意从出版社官网下载了目录,以飨读者。


  • Preface

  • Richard Hudson
    Dependency, Corpora and Cognition

  • Hongxin Zhang, Haitao Liu
    Interrelations among Dependency Tree Widths, Heights and Sentence Lengths

  • Radek Čech, JiříMilička, JánMačutek, Michaela Koščová, Markéta Lopatková
    Quantitative Analysis of Syntactic Dependency in Czech

  • AnatNinio
    Dissortativity in a Bipartite Network of Dependency Relations and Communicative Functions

  • Andrei Beliankou, Reinhard Köhler
    Empirical Analyses of Valency Structures

  • HuiyuanJin, Haitao Liu
    Regular Dynamic Patterns of Verbal Valency Ellipsis in Modern Spoken Chinese

  • Haruko Sanada
    Negentropy of Dependency Types and Parts of Speech in the Clause

  • Qian Lu, Yanni Lin, Haitao Liu
    Dynamic Valency and Dependency Distance

  • Jingyang Jiang, Jinghui Ouyang
    Minimization and Probability Distribution of Dependency Distance in the
    Process of Second Language Acquisition

  • Jingqi Yan
    Influences of Dependency Distance on the Syntactic Development of Deaf and Hard-of-hearing Students

  • Hua Wang
    Positional Aspects of Dependency Distance

  • Jinlu Liu, Gaiying Chai
    Dependency Distance and Direction of English Relative Clauses

  • Chunshan Xu
    Differences between English Subject Post-modifiers and Object Post-modifiers: From the Perspective of Dependency Distance

  • Xinying Chen, Kim Gerdes
    How Do Universal Dependencies Distinguish Language Groups?

  • Yaqin Wang, Jianwei Yan
    A Quantitative Analysis on a Literary Genre Essay’s Syntactic Feature

  • Alexander Mehler, WahedHemati, TolgaUslu, Andy Lücking
    A Multidimensional Model of Syntactic Dependency Trees for Authorship Attribution

  • Subject Index

  • Author Index

  • List of Contributors


另外,本书目前有纸质书和电子书两种形式,对比阅读两种版本的筒子们可能会发现彩蛋哟(具体是什么蛋?小编欢迎留言来撩)。有木有很心动?心动不如行动,抓紧时间订购吧。德古意特是德国的出版社,本书目前在国内还没有开售,不过可以去德古意特官网订购(文末“阅读原文”直达)。


快到年底了,有项目经费还没花完的老师和同学们,迅速提高经费执行速度只需鼠标轻轻一点网络订购哟。没有经费的也木有关系,可以推荐图书馆购买,像小编就是第(主)一(要)时(是)间(穷)给学校图书馆荐购了呢。有了这本书,咱们是不是离成功又更近一步啦?就像“花格老刘”经常说的,“进来,就有希望!”


PS. 记得还有一本书也很快出来了哦





    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存